tipc: move link input queue to tipc_node
[cascardo/linux.git] / net / tipc / node.c
1 /*
2  * net/tipc/node.c: TIPC node management routines
3  *
4  * Copyright (c) 2000-2006, 2012-2015, Ericsson AB
5  * Copyright (c) 2005-2006, 2010-2014, Wind River Systems
6  * All rights reserved.
7  *
8  * Redistribution and use in source and binary forms, with or without
9  * modification, are permitted provided that the following conditions are met:
10  *
11  * 1. Redistributions of source code must retain the above copyright
12  *    notice, this list of conditions and the following disclaimer.
13  * 2. Redistributions in binary form must reproduce the above copyright
14  *    notice, this list of conditions and the following disclaimer in the
15  *    documentation and/or other materials provided with the distribution.
16  * 3. Neither the names of the copyright holders nor the names of its
17  *    contributors may be used to endorse or promote products derived from
18  *    this software without specific prior written permission.
19  *
20  * Alternatively, this software may be distributed under the terms of the
21  * GNU General Public License ("GPL") version 2 as published by the Free
22  * Software Foundation.
23  *
24  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
25  * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
26  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
27  * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE
28  * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
29  * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
30  * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
31  * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
32  * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
33  * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
34  * POSSIBILITY OF SUCH DAMAGE.
35  */
36
37 #include "core.h"
38 #include "link.h"
39 #include "node.h"
40 #include "name_distr.h"
41 #include "socket.h"
42 #include "bcast.h"
43
44 static void node_lost_contact(struct tipc_node *n_ptr);
45 static void node_established_contact(struct tipc_node *n_ptr);
46 static void tipc_node_delete(struct tipc_node *node);
47
48 struct tipc_sock_conn {
49         u32 port;
50         u32 peer_port;
51         u32 peer_node;
52         struct list_head list;
53 };
54
55 static const struct nla_policy tipc_nl_node_policy[TIPC_NLA_NODE_MAX + 1] = {
56         [TIPC_NLA_NODE_UNSPEC]          = { .type = NLA_UNSPEC },
57         [TIPC_NLA_NODE_ADDR]            = { .type = NLA_U32 },
58         [TIPC_NLA_NODE_UP]              = { .type = NLA_FLAG }
59 };
60
61 /*
62  * A trivial power-of-two bitmask technique is used for speed, since this
63  * operation is done for every incoming TIPC packet. The number of hash table
64  * entries has been chosen so that no hash chain exceeds 8 nodes and will
65  * usually be much smaller (typically only a single node).
66  */
67 static unsigned int tipc_hashfn(u32 addr)
68 {
69         return addr & (NODE_HTABLE_SIZE - 1);
70 }
71
72 static void tipc_node_kref_release(struct kref *kref)
73 {
74         struct tipc_node *node = container_of(kref, struct tipc_node, kref);
75
76         tipc_node_delete(node);
77 }
78
79 void tipc_node_put(struct tipc_node *node)
80 {
81         kref_put(&node->kref, tipc_node_kref_release);
82 }
83
84 static void tipc_node_get(struct tipc_node *node)
85 {
86         kref_get(&node->kref);
87 }
88
89 /*
90  * tipc_node_find - locate specified node object, if it exists
91  */
92 struct tipc_node *tipc_node_find(struct net *net, u32 addr)
93 {
94         struct tipc_net *tn = net_generic(net, tipc_net_id);
95         struct tipc_node *node;
96
97         if (unlikely(!in_own_cluster_exact(net, addr)))
98                 return NULL;
99
100         rcu_read_lock();
101         hlist_for_each_entry_rcu(node, &tn->node_htable[tipc_hashfn(addr)],
102                                  hash) {
103                 if (node->addr == addr) {
104                         tipc_node_get(node);
105                         rcu_read_unlock();
106                         return node;
107                 }
108         }
109         rcu_read_unlock();
110         return NULL;
111 }
112
113 struct tipc_node *tipc_node_create(struct net *net, u32 addr)
114 {
115         struct tipc_net *tn = net_generic(net, tipc_net_id);
116         struct tipc_node *n_ptr, *temp_node;
117
118         spin_lock_bh(&tn->node_list_lock);
119         n_ptr = tipc_node_find(net, addr);
120         if (n_ptr)
121                 goto exit;
122         n_ptr = kzalloc(sizeof(*n_ptr), GFP_ATOMIC);
123         if (!n_ptr) {
124                 pr_warn("Node creation failed, no memory\n");
125                 goto exit;
126         }
127         n_ptr->addr = addr;
128         n_ptr->net = net;
129         kref_init(&n_ptr->kref);
130         spin_lock_init(&n_ptr->lock);
131         INIT_HLIST_NODE(&n_ptr->hash);
132         INIT_LIST_HEAD(&n_ptr->list);
133         INIT_LIST_HEAD(&n_ptr->publ_list);
134         INIT_LIST_HEAD(&n_ptr->conn_sks);
135         skb_queue_head_init(&n_ptr->bclink.namedq);
136         __skb_queue_head_init(&n_ptr->bclink.deferdq);
137         hlist_add_head_rcu(&n_ptr->hash, &tn->node_htable[tipc_hashfn(addr)]);
138         list_for_each_entry_rcu(temp_node, &tn->node_list, list) {
139                 if (n_ptr->addr < temp_node->addr)
140                         break;
141         }
142         list_add_tail_rcu(&n_ptr->list, &temp_node->list);
143         n_ptr->action_flags = TIPC_WAIT_PEER_LINKS_DOWN;
144         n_ptr->signature = INVALID_NODE_SIG;
145         tipc_node_get(n_ptr);
146 exit:
147         spin_unlock_bh(&tn->node_list_lock);
148         return n_ptr;
149 }
150
151 static void tipc_node_delete(struct tipc_node *node)
152 {
153         list_del_rcu(&node->list);
154         hlist_del_rcu(&node->hash);
155         kfree_rcu(node, rcu);
156 }
157
158 void tipc_node_stop(struct net *net)
159 {
160         struct tipc_net *tn = net_generic(net, tipc_net_id);
161         struct tipc_node *node, *t_node;
162
163         spin_lock_bh(&tn->node_list_lock);
164         list_for_each_entry_safe(node, t_node, &tn->node_list, list)
165                 tipc_node_put(node);
166         spin_unlock_bh(&tn->node_list_lock);
167 }
168
169 int tipc_node_add_conn(struct net *net, u32 dnode, u32 port, u32 peer_port)
170 {
171         struct tipc_node *node;
172         struct tipc_sock_conn *conn;
173         int err = 0;
174
175         if (in_own_node(net, dnode))
176                 return 0;
177
178         node = tipc_node_find(net, dnode);
179         if (!node) {
180                 pr_warn("Connecting sock to node 0x%x failed\n", dnode);
181                 return -EHOSTUNREACH;
182         }
183         conn = kmalloc(sizeof(*conn), GFP_ATOMIC);
184         if (!conn) {
185                 err = -EHOSTUNREACH;
186                 goto exit;
187         }
188         conn->peer_node = dnode;
189         conn->port = port;
190         conn->peer_port = peer_port;
191
192         tipc_node_lock(node);
193         list_add_tail(&conn->list, &node->conn_sks);
194         tipc_node_unlock(node);
195 exit:
196         tipc_node_put(node);
197         return err;
198 }
199
200 void tipc_node_remove_conn(struct net *net, u32 dnode, u32 port)
201 {
202         struct tipc_node *node;
203         struct tipc_sock_conn *conn, *safe;
204
205         if (in_own_node(net, dnode))
206                 return;
207
208         node = tipc_node_find(net, dnode);
209         if (!node)
210                 return;
211
212         tipc_node_lock(node);
213         list_for_each_entry_safe(conn, safe, &node->conn_sks, list) {
214                 if (port != conn->port)
215                         continue;
216                 list_del(&conn->list);
217                 kfree(conn);
218         }
219         tipc_node_unlock(node);
220         tipc_node_put(node);
221 }
222
223 /**
224  * tipc_node_link_up - handle addition of link
225  *
226  * Link becomes active (alone or shared) or standby, depending on its priority.
227  */
228 void tipc_node_link_up(struct tipc_node *n, int bearer_id)
229 {
230         struct tipc_link_entry **actv = &n->active_links[0];
231         struct tipc_link_entry *le = &n->links[bearer_id];
232         struct tipc_link *l = le->link;
233
234         /* Leave room for tunnel header when returning 'mtu' to users: */
235         n->links[bearer_id].mtu = l->mtu - INT_H_SIZE;
236
237         n->working_links++;
238         n->action_flags |= TIPC_NOTIFY_LINK_UP;
239         n->link_id = l->peer_bearer_id << 16 | l->bearer_id;
240
241         pr_debug("Established link <%s> on network plane %c\n",
242                  l->name, l->net_plane);
243
244         /* No active links ? => take both active slots */
245         if (!actv[0]) {
246                 actv[0] = le;
247                 actv[1] = le;
248                 node_established_contact(n);
249                 return;
250         }
251         if (l->priority < actv[0]->link->priority) {
252                 pr_debug("New link <%s> becomes standby\n", l->name);
253                 return;
254         }
255         tipc_link_dup_queue_xmit(actv[0]->link, l);
256
257         /* Take one active slot if applicable */
258         if (l->priority == actv[0]->link->priority) {
259                 actv[0] = le;
260                 return;
261         }
262         /* Higher prio than current active? => take both active slots */
263         pr_debug("Old l <%s> becomes standby\n", actv[0]->link->name);
264         if (actv[1] != actv[0])
265                 pr_debug("Old link <%s> now standby\n", actv[1]->link->name);
266         actv[0] = le;
267         actv[1] = le;
268 }
269
270 /**
271  * node_select_active_links - select which working links should be active
272  */
273 static void node_select_active_links(struct tipc_node *n)
274 {
275         struct tipc_link_entry **actv = &n->active_links[0];
276         struct tipc_link *l;
277         u32 b, highest = 0;
278
279         actv[0] = NULL;
280         actv[1] = NULL;
281
282         for (b = 0; b < MAX_BEARERS; b++) {
283                 l = n->links[b].link;
284                 if (!l || !tipc_link_is_up(l) || (l->priority < highest))
285                         continue;
286                 if (l->priority > highest) {
287                         highest = l->priority;
288                         actv[0] = &n->links[b];
289                         actv[1] = &n->links[b];
290                         continue;
291                 }
292                 actv[1] = &n->links[b];
293         }
294 }
295
296 /**
297  * tipc_node_link_down - handle loss of link
298  */
299 void tipc_node_link_down(struct tipc_node *n, int bearer_id)
300 {
301         struct tipc_link_entry **actv = &n->active_links[0];
302         struct tipc_link_entry *le = &n->links[bearer_id];
303         struct tipc_link *l = le->link;
304
305         n->working_links--;
306         n->action_flags |= TIPC_NOTIFY_LINK_DOWN;
307         n->link_id = l->peer_bearer_id << 16 | l->bearer_id;
308
309         if (!tipc_link_is_active(l)) {
310                 pr_debug("Lost standby link <%s> on network plane %c\n",
311                          l->name, l->net_plane);
312                 return;
313         }
314         pr_debug("Lost link <%s> on network plane %c\n",
315                  l->name, l->net_plane);
316
317         /* Resdistribute active slots if applicable */
318         if (actv[0] == le)
319                 actv[0] = actv[1];
320         if (actv[1] == le)
321                 actv[1] = actv[0];
322
323         /* Last link of this priority? => select other ones if available */
324         if (actv[0] == le)
325                 node_select_active_links(n);
326
327         if (tipc_node_is_up(n))
328                 tipc_link_failover_send_queue(l);
329         else
330                 node_lost_contact(n);
331 }
332
333 bool tipc_node_is_up(struct tipc_node *n)
334 {
335         return n->active_links[0];
336 }
337
338 void tipc_node_check_dest(struct tipc_node *n, struct tipc_bearer *b,
339                           bool *link_up, bool *addr_match,
340                           struct tipc_media_addr *maddr)
341 {
342         struct tipc_link *l = n->links[b->identity].link;
343         struct tipc_media_addr *curr = &n->links[b->identity].maddr;
344
345         *link_up = l && tipc_link_is_up(l);
346         *addr_match = l && !memcmp(curr, maddr, sizeof(*maddr));
347 }
348
349 bool tipc_node_update_dest(struct tipc_node *n,  struct tipc_bearer *b,
350                            struct tipc_media_addr *maddr)
351 {
352         struct tipc_link *l = n->links[b->identity].link;
353         struct tipc_media_addr *curr = &n->links[b->identity].maddr;
354         struct sk_buff_head *inputq = &n->links[b->identity].inputq;
355
356         if (!l)
357                 l = tipc_link_create(n, b, maddr, inputq, &n->bclink.namedq);
358         if (!l)
359                 return false;
360         memcpy(&l->media_addr, maddr, sizeof(*maddr));
361         memcpy(curr, maddr, sizeof(*maddr));
362         tipc_link_reset(l);
363         return true;
364 }
365
366 void tipc_node_attach_link(struct tipc_node *n_ptr, struct tipc_link *l_ptr)
367 {
368         n_ptr->links[l_ptr->bearer_id].link = l_ptr;
369         n_ptr->link_cnt++;
370 }
371
372 void tipc_node_detach_link(struct tipc_node *n_ptr, struct tipc_link *l_ptr)
373 {
374         int i;
375
376         for (i = 0; i < MAX_BEARERS; i++) {
377                 if (l_ptr != n_ptr->links[i].link)
378                         continue;
379                 n_ptr->links[i].link = NULL;
380                 n_ptr->link_cnt--;
381         }
382 }
383
384 static void node_established_contact(struct tipc_node *n_ptr)
385 {
386         n_ptr->action_flags |= TIPC_NOTIFY_NODE_UP;
387         n_ptr->bclink.oos_state = 0;
388         n_ptr->bclink.acked = tipc_bclink_get_last_sent(n_ptr->net);
389         tipc_bclink_add_node(n_ptr->net, n_ptr->addr);
390 }
391
392 static void node_lost_contact(struct tipc_node *n_ptr)
393 {
394         char addr_string[16];
395         struct tipc_sock_conn *conn, *safe;
396         struct list_head *conns = &n_ptr->conn_sks;
397         struct sk_buff *skb;
398         struct tipc_net *tn = net_generic(n_ptr->net, tipc_net_id);
399         uint i;
400
401         pr_debug("Lost contact with %s\n",
402                  tipc_addr_string_fill(addr_string, n_ptr->addr));
403
404         /* Flush broadcast link info associated with lost node */
405         if (n_ptr->bclink.recv_permitted) {
406                 __skb_queue_purge(&n_ptr->bclink.deferdq);
407
408                 if (n_ptr->bclink.reasm_buf) {
409                         kfree_skb(n_ptr->bclink.reasm_buf);
410                         n_ptr->bclink.reasm_buf = NULL;
411                 }
412
413                 tipc_bclink_remove_node(n_ptr->net, n_ptr->addr);
414                 tipc_bclink_acknowledge(n_ptr, INVALID_LINK_SEQ);
415
416                 n_ptr->bclink.recv_permitted = false;
417         }
418
419         /* Abort any ongoing link failover */
420         for (i = 0; i < MAX_BEARERS; i++) {
421                 struct tipc_link *l_ptr = n_ptr->links[i].link;
422                 if (!l_ptr)
423                         continue;
424                 l_ptr->flags &= ~LINK_FAILINGOVER;
425                 l_ptr->failover_checkpt = 0;
426                 l_ptr->failover_pkts = 0;
427                 kfree_skb(l_ptr->failover_skb);
428                 l_ptr->failover_skb = NULL;
429                 tipc_link_reset_fragments(l_ptr);
430         }
431
432         n_ptr->action_flags &= ~TIPC_WAIT_OWN_LINKS_DOWN;
433
434         /* Prevent re-contact with node until cleanup is done */
435         n_ptr->action_flags |= TIPC_WAIT_PEER_LINKS_DOWN;
436
437         /* Notify publications from this node */
438         n_ptr->action_flags |= TIPC_NOTIFY_NODE_DOWN;
439
440         /* Notify sockets connected to node */
441         list_for_each_entry_safe(conn, safe, conns, list) {
442                 skb = tipc_msg_create(TIPC_CRITICAL_IMPORTANCE, TIPC_CONN_MSG,
443                                       SHORT_H_SIZE, 0, tn->own_addr,
444                                       conn->peer_node, conn->port,
445                                       conn->peer_port, TIPC_ERR_NO_NODE);
446                 if (likely(skb)) {
447                         skb_queue_tail(n_ptr->inputq, skb);
448                         n_ptr->action_flags |= TIPC_MSG_EVT;
449                 }
450                 list_del(&conn->list);
451                 kfree(conn);
452         }
453 }
454
455 /**
456  * tipc_node_get_linkname - get the name of a link
457  *
458  * @bearer_id: id of the bearer
459  * @node: peer node address
460  * @linkname: link name output buffer
461  *
462  * Returns 0 on success
463  */
464 int tipc_node_get_linkname(struct net *net, u32 bearer_id, u32 addr,
465                            char *linkname, size_t len)
466 {
467         struct tipc_link *link;
468         int err = -EINVAL;
469         struct tipc_node *node = tipc_node_find(net, addr);
470
471         if (!node)
472                 return err;
473
474         if (bearer_id >= MAX_BEARERS)
475                 goto exit;
476
477         tipc_node_lock(node);
478         link = node->links[bearer_id].link;
479         if (link) {
480                 strncpy(linkname, link->name, len);
481                 err = 0;
482         }
483 exit:
484         tipc_node_unlock(node);
485         tipc_node_put(node);
486         return err;
487 }
488
489 void tipc_node_unlock(struct tipc_node *node)
490 {
491         struct net *net = node->net;
492         u32 addr = 0;
493         u32 flags = node->action_flags;
494         u32 link_id = 0;
495         struct list_head *publ_list;
496         struct sk_buff_head *inputq = node->inputq;
497         struct sk_buff_head *namedq;
498
499         if (likely(!flags || (flags == TIPC_MSG_EVT))) {
500                 node->action_flags = 0;
501                 spin_unlock_bh(&node->lock);
502                 if (flags == TIPC_MSG_EVT)
503                         tipc_sk_rcv(net, inputq);
504                 return;
505         }
506
507         addr = node->addr;
508         link_id = node->link_id;
509         namedq = node->namedq;
510         publ_list = &node->publ_list;
511
512         node->action_flags &= ~(TIPC_MSG_EVT |
513                                 TIPC_NOTIFY_NODE_DOWN | TIPC_NOTIFY_NODE_UP |
514                                 TIPC_NOTIFY_LINK_DOWN | TIPC_NOTIFY_LINK_UP |
515                                 TIPC_WAKEUP_BCAST_USERS | TIPC_BCAST_MSG_EVT |
516                                 TIPC_NAMED_MSG_EVT | TIPC_BCAST_RESET);
517
518         spin_unlock_bh(&node->lock);
519
520         if (flags & TIPC_NOTIFY_NODE_DOWN)
521                 tipc_publ_notify(net, publ_list, addr);
522
523         if (flags & TIPC_WAKEUP_BCAST_USERS)
524                 tipc_bclink_wakeup_users(net);
525
526         if (flags & TIPC_NOTIFY_NODE_UP)
527                 tipc_named_node_up(net, addr);
528
529         if (flags & TIPC_NOTIFY_LINK_UP)
530                 tipc_nametbl_publish(net, TIPC_LINK_STATE, addr, addr,
531                                      TIPC_NODE_SCOPE, link_id, addr);
532
533         if (flags & TIPC_NOTIFY_LINK_DOWN)
534                 tipc_nametbl_withdraw(net, TIPC_LINK_STATE, addr,
535                                       link_id, addr);
536
537         if (flags & TIPC_MSG_EVT)
538                 tipc_sk_rcv(net, inputq);
539
540         if (flags & TIPC_NAMED_MSG_EVT)
541                 tipc_named_rcv(net, namedq);
542
543         if (flags & TIPC_BCAST_MSG_EVT)
544                 tipc_bclink_input(net);
545
546         if (flags & TIPC_BCAST_RESET)
547                 tipc_link_reset_all(node);
548 }
549
550 /* Caller should hold node lock for the passed node */
551 static int __tipc_nl_add_node(struct tipc_nl_msg *msg, struct tipc_node *node)
552 {
553         void *hdr;
554         struct nlattr *attrs;
555
556         hdr = genlmsg_put(msg->skb, msg->portid, msg->seq, &tipc_genl_family,
557                           NLM_F_MULTI, TIPC_NL_NODE_GET);
558         if (!hdr)
559                 return -EMSGSIZE;
560
561         attrs = nla_nest_start(msg->skb, TIPC_NLA_NODE);
562         if (!attrs)
563                 goto msg_full;
564
565         if (nla_put_u32(msg->skb, TIPC_NLA_NODE_ADDR, node->addr))
566                 goto attr_msg_full;
567         if (tipc_node_is_up(node))
568                 if (nla_put_flag(msg->skb, TIPC_NLA_NODE_UP))
569                         goto attr_msg_full;
570
571         nla_nest_end(msg->skb, attrs);
572         genlmsg_end(msg->skb, hdr);
573
574         return 0;
575
576 attr_msg_full:
577         nla_nest_cancel(msg->skb, attrs);
578 msg_full:
579         genlmsg_cancel(msg->skb, hdr);
580
581         return -EMSGSIZE;
582 }
583
584 int tipc_nl_node_dump(struct sk_buff *skb, struct netlink_callback *cb)
585 {
586         int err;
587         struct net *net = sock_net(skb->sk);
588         struct tipc_net *tn = net_generic(net, tipc_net_id);
589         int done = cb->args[0];
590         int last_addr = cb->args[1];
591         struct tipc_node *node;
592         struct tipc_nl_msg msg;
593
594         if (done)
595                 return 0;
596
597         msg.skb = skb;
598         msg.portid = NETLINK_CB(cb->skb).portid;
599         msg.seq = cb->nlh->nlmsg_seq;
600
601         rcu_read_lock();
602         if (last_addr) {
603                 node = tipc_node_find(net, last_addr);
604                 if (!node) {
605                         rcu_read_unlock();
606                         /* We never set seq or call nl_dump_check_consistent()
607                          * this means that setting prev_seq here will cause the
608                          * consistence check to fail in the netlink callback
609                          * handler. Resulting in the NLMSG_DONE message having
610                          * the NLM_F_DUMP_INTR flag set if the node state
611                          * changed while we released the lock.
612                          */
613                         cb->prev_seq = 1;
614                         return -EPIPE;
615                 }
616                 tipc_node_put(node);
617         }
618
619         list_for_each_entry_rcu(node, &tn->node_list, list) {
620                 if (last_addr) {
621                         if (node->addr == last_addr)
622                                 last_addr = 0;
623                         else
624                                 continue;
625                 }
626
627                 tipc_node_lock(node);
628                 err = __tipc_nl_add_node(&msg, node);
629                 if (err) {
630                         last_addr = node->addr;
631                         tipc_node_unlock(node);
632                         goto out;
633                 }
634
635                 tipc_node_unlock(node);
636         }
637         done = 1;
638 out:
639         cb->args[0] = done;
640         cb->args[1] = last_addr;
641         rcu_read_unlock();
642
643         return skb->len;
644 }