tipc: eliminate delayed link deletion at link failover
[cascardo/linux.git] / net / tipc / node.c
1 /*
2  * net/tipc/node.c: TIPC node management routines
3  *
4  * Copyright (c) 2000-2006, 2012-2014, Ericsson AB
5  * Copyright (c) 2005-2006, 2010-2014, Wind River Systems
6  * All rights reserved.
7  *
8  * Redistribution and use in source and binary forms, with or without
9  * modification, are permitted provided that the following conditions are met:
10  *
11  * 1. Redistributions of source code must retain the above copyright
12  *    notice, this list of conditions and the following disclaimer.
13  * 2. Redistributions in binary form must reproduce the above copyright
14  *    notice, this list of conditions and the following disclaimer in the
15  *    documentation and/or other materials provided with the distribution.
16  * 3. Neither the names of the copyright holders nor the names of its
17  *    contributors may be used to endorse or promote products derived from
18  *    this software without specific prior written permission.
19  *
20  * Alternatively, this software may be distributed under the terms of the
21  * GNU General Public License ("GPL") version 2 as published by the Free
22  * Software Foundation.
23  *
24  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
25  * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
26  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
27  * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE
28  * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
29  * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
30  * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
31  * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
32  * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
33  * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
34  * POSSIBILITY OF SUCH DAMAGE.
35  */
36
37 #include "core.h"
38 #include "link.h"
39 #include "node.h"
40 #include "name_distr.h"
41 #include "socket.h"
42
43 static void node_lost_contact(struct tipc_node *n_ptr);
44 static void node_established_contact(struct tipc_node *n_ptr);
45 static void tipc_node_delete(struct tipc_node *node);
46
47 struct tipc_sock_conn {
48         u32 port;
49         u32 peer_port;
50         u32 peer_node;
51         struct list_head list;
52 };
53
54 static const struct nla_policy tipc_nl_node_policy[TIPC_NLA_NODE_MAX + 1] = {
55         [TIPC_NLA_NODE_UNSPEC]          = { .type = NLA_UNSPEC },
56         [TIPC_NLA_NODE_ADDR]            = { .type = NLA_U32 },
57         [TIPC_NLA_NODE_UP]              = { .type = NLA_FLAG }
58 };
59
60 /*
61  * A trivial power-of-two bitmask technique is used for speed, since this
62  * operation is done for every incoming TIPC packet. The number of hash table
63  * entries has been chosen so that no hash chain exceeds 8 nodes and will
64  * usually be much smaller (typically only a single node).
65  */
66 static unsigned int tipc_hashfn(u32 addr)
67 {
68         return addr & (NODE_HTABLE_SIZE - 1);
69 }
70
71 static void tipc_node_kref_release(struct kref *kref)
72 {
73         struct tipc_node *node = container_of(kref, struct tipc_node, kref);
74
75         tipc_node_delete(node);
76 }
77
78 void tipc_node_put(struct tipc_node *node)
79 {
80         kref_put(&node->kref, tipc_node_kref_release);
81 }
82
83 static void tipc_node_get(struct tipc_node *node)
84 {
85         kref_get(&node->kref);
86 }
87
88 /*
89  * tipc_node_find - locate specified node object, if it exists
90  */
91 struct tipc_node *tipc_node_find(struct net *net, u32 addr)
92 {
93         struct tipc_net *tn = net_generic(net, tipc_net_id);
94         struct tipc_node *node;
95
96         if (unlikely(!in_own_cluster_exact(net, addr)))
97                 return NULL;
98
99         rcu_read_lock();
100         hlist_for_each_entry_rcu(node, &tn->node_htable[tipc_hashfn(addr)],
101                                  hash) {
102                 if (node->addr == addr) {
103                         tipc_node_get(node);
104                         rcu_read_unlock();
105                         return node;
106                 }
107         }
108         rcu_read_unlock();
109         return NULL;
110 }
111
112 struct tipc_node *tipc_node_create(struct net *net, u32 addr)
113 {
114         struct tipc_net *tn = net_generic(net, tipc_net_id);
115         struct tipc_node *n_ptr, *temp_node;
116
117         spin_lock_bh(&tn->node_list_lock);
118         n_ptr = tipc_node_find(net, addr);
119         if (n_ptr)
120                 goto exit;
121         n_ptr = kzalloc(sizeof(*n_ptr), GFP_ATOMIC);
122         if (!n_ptr) {
123                 pr_warn("Node creation failed, no memory\n");
124                 goto exit;
125         }
126         n_ptr->addr = addr;
127         n_ptr->net = net;
128         kref_init(&n_ptr->kref);
129         spin_lock_init(&n_ptr->lock);
130         INIT_HLIST_NODE(&n_ptr->hash);
131         INIT_LIST_HEAD(&n_ptr->list);
132         INIT_LIST_HEAD(&n_ptr->publ_list);
133         INIT_LIST_HEAD(&n_ptr->conn_sks);
134         __skb_queue_head_init(&n_ptr->bclink.deferdq);
135         hlist_add_head_rcu(&n_ptr->hash, &tn->node_htable[tipc_hashfn(addr)]);
136         list_for_each_entry_rcu(temp_node, &tn->node_list, list) {
137                 if (n_ptr->addr < temp_node->addr)
138                         break;
139         }
140         list_add_tail_rcu(&n_ptr->list, &temp_node->list);
141         n_ptr->action_flags = TIPC_WAIT_PEER_LINKS_DOWN;
142         n_ptr->signature = INVALID_NODE_SIG;
143         tipc_node_get(n_ptr);
144 exit:
145         spin_unlock_bh(&tn->node_list_lock);
146         return n_ptr;
147 }
148
149 static void tipc_node_delete(struct tipc_node *node)
150 {
151         list_del_rcu(&node->list);
152         hlist_del_rcu(&node->hash);
153         kfree_rcu(node, rcu);
154 }
155
156 void tipc_node_stop(struct net *net)
157 {
158         struct tipc_net *tn = net_generic(net, tipc_net_id);
159         struct tipc_node *node, *t_node;
160
161         spin_lock_bh(&tn->node_list_lock);
162         list_for_each_entry_safe(node, t_node, &tn->node_list, list)
163                 tipc_node_put(node);
164         spin_unlock_bh(&tn->node_list_lock);
165 }
166
167 int tipc_node_add_conn(struct net *net, u32 dnode, u32 port, u32 peer_port)
168 {
169         struct tipc_node *node;
170         struct tipc_sock_conn *conn;
171         int err = 0;
172
173         if (in_own_node(net, dnode))
174                 return 0;
175
176         node = tipc_node_find(net, dnode);
177         if (!node) {
178                 pr_warn("Connecting sock to node 0x%x failed\n", dnode);
179                 return -EHOSTUNREACH;
180         }
181         conn = kmalloc(sizeof(*conn), GFP_ATOMIC);
182         if (!conn) {
183                 err = -EHOSTUNREACH;
184                 goto exit;
185         }
186         conn->peer_node = dnode;
187         conn->port = port;
188         conn->peer_port = peer_port;
189
190         tipc_node_lock(node);
191         list_add_tail(&conn->list, &node->conn_sks);
192         tipc_node_unlock(node);
193 exit:
194         tipc_node_put(node);
195         return err;
196 }
197
198 void tipc_node_remove_conn(struct net *net, u32 dnode, u32 port)
199 {
200         struct tipc_node *node;
201         struct tipc_sock_conn *conn, *safe;
202
203         if (in_own_node(net, dnode))
204                 return;
205
206         node = tipc_node_find(net, dnode);
207         if (!node)
208                 return;
209
210         tipc_node_lock(node);
211         list_for_each_entry_safe(conn, safe, &node->conn_sks, list) {
212                 if (port != conn->port)
213                         continue;
214                 list_del(&conn->list);
215                 kfree(conn);
216         }
217         tipc_node_unlock(node);
218         tipc_node_put(node);
219 }
220
221 /**
222  * tipc_node_link_up - handle addition of link
223  *
224  * Link becomes active (alone or shared) or standby, depending on its priority.
225  */
226 void tipc_node_link_up(struct tipc_node *n_ptr, struct tipc_link *l_ptr)
227 {
228         struct tipc_link **active = &n_ptr->active_links[0];
229
230         n_ptr->working_links++;
231         n_ptr->action_flags |= TIPC_NOTIFY_LINK_UP;
232         n_ptr->link_id = l_ptr->peer_bearer_id << 16 | l_ptr->bearer_id;
233
234         pr_debug("Established link <%s> on network plane %c\n",
235                  l_ptr->name, l_ptr->net_plane);
236
237         if (!active[0]) {
238                 active[0] = active[1] = l_ptr;
239                 node_established_contact(n_ptr);
240                 goto exit;
241         }
242         if (l_ptr->priority < active[0]->priority) {
243                 pr_debug("New link <%s> becomes standby\n", l_ptr->name);
244                 goto exit;
245         }
246         tipc_link_dup_queue_xmit(active[0], l_ptr);
247         if (l_ptr->priority == active[0]->priority) {
248                 active[0] = l_ptr;
249                 goto exit;
250         }
251         pr_debug("Old link <%s> becomes standby\n", active[0]->name);
252         if (active[1] != active[0])
253                 pr_debug("Old link <%s> becomes standby\n", active[1]->name);
254         active[0] = active[1] = l_ptr;
255 exit:
256         /* Leave room for changeover header when returning 'mtu' to users: */
257         n_ptr->act_mtus[0] = active[0]->max_pkt - INT_H_SIZE;
258         n_ptr->act_mtus[1] = active[1]->max_pkt - INT_H_SIZE;
259 }
260
261 /**
262  * node_select_active_links - select active link
263  */
264 static void node_select_active_links(struct tipc_node *n_ptr)
265 {
266         struct tipc_link **active = &n_ptr->active_links[0];
267         u32 i;
268         u32 highest_prio = 0;
269
270         active[0] = active[1] = NULL;
271
272         for (i = 0; i < MAX_BEARERS; i++) {
273                 struct tipc_link *l_ptr = n_ptr->links[i];
274
275                 if (!l_ptr || !tipc_link_is_up(l_ptr) ||
276                     (l_ptr->priority < highest_prio))
277                         continue;
278
279                 if (l_ptr->priority > highest_prio) {
280                         highest_prio = l_ptr->priority;
281                         active[0] = active[1] = l_ptr;
282                 } else {
283                         active[1] = l_ptr;
284                 }
285         }
286 }
287
288 /**
289  * tipc_node_link_down - handle loss of link
290  */
291 void tipc_node_link_down(struct tipc_node *n_ptr, struct tipc_link *l_ptr)
292 {
293         struct tipc_net *tn = net_generic(n_ptr->net, tipc_net_id);
294         struct tipc_link **active;
295
296         n_ptr->working_links--;
297         n_ptr->action_flags |= TIPC_NOTIFY_LINK_DOWN;
298         n_ptr->link_id = l_ptr->peer_bearer_id << 16 | l_ptr->bearer_id;
299
300         if (!tipc_link_is_active(l_ptr)) {
301                 pr_debug("Lost standby link <%s> on network plane %c\n",
302                          l_ptr->name, l_ptr->net_plane);
303                 return;
304         }
305         pr_debug("Lost link <%s> on network plane %c\n",
306                  l_ptr->name, l_ptr->net_plane);
307
308         active = &n_ptr->active_links[0];
309         if (active[0] == l_ptr)
310                 active[0] = active[1];
311         if (active[1] == l_ptr)
312                 active[1] = active[0];
313         if (active[0] == l_ptr)
314                 node_select_active_links(n_ptr);
315         if (tipc_node_is_up(n_ptr))
316                 tipc_link_failover_send_queue(l_ptr);
317         else
318                 node_lost_contact(n_ptr);
319
320         /* Leave room for changeover header when returning 'mtu' to users: */
321         if (active[0]) {
322                 n_ptr->act_mtus[0] = active[0]->max_pkt - INT_H_SIZE;
323                 n_ptr->act_mtus[1] = active[1]->max_pkt - INT_H_SIZE;
324                 return;
325         }
326
327         /* Loopback link went down? No fragmentation needed from now on. */
328         if (n_ptr->addr == tn->own_addr) {
329                 n_ptr->act_mtus[0] = MAX_MSG_SIZE;
330                 n_ptr->act_mtus[1] = MAX_MSG_SIZE;
331         }
332 }
333
334 int tipc_node_active_links(struct tipc_node *n_ptr)
335 {
336         return n_ptr->active_links[0] != NULL;
337 }
338
339 int tipc_node_is_up(struct tipc_node *n_ptr)
340 {
341         return tipc_node_active_links(n_ptr);
342 }
343
344 void tipc_node_attach_link(struct tipc_node *n_ptr, struct tipc_link *l_ptr)
345 {
346         n_ptr->links[l_ptr->bearer_id] = l_ptr;
347         n_ptr->link_cnt++;
348 }
349
350 void tipc_node_detach_link(struct tipc_node *n_ptr, struct tipc_link *l_ptr)
351 {
352         int i;
353
354         for (i = 0; i < MAX_BEARERS; i++) {
355                 if (l_ptr != n_ptr->links[i])
356                         continue;
357                 n_ptr->links[i] = NULL;
358                 n_ptr->link_cnt--;
359         }
360 }
361
362 static void node_established_contact(struct tipc_node *n_ptr)
363 {
364         n_ptr->action_flags |= TIPC_NOTIFY_NODE_UP;
365         n_ptr->bclink.oos_state = 0;
366         n_ptr->bclink.acked = tipc_bclink_get_last_sent(n_ptr->net);
367         tipc_bclink_add_node(n_ptr->net, n_ptr->addr);
368 }
369
370 static void node_lost_contact(struct tipc_node *n_ptr)
371 {
372         char addr_string[16];
373         struct tipc_sock_conn *conn, *safe;
374         struct list_head *conns = &n_ptr->conn_sks;
375         struct sk_buff *skb;
376         struct tipc_net *tn = net_generic(n_ptr->net, tipc_net_id);
377         uint i;
378
379         pr_debug("Lost contact with %s\n",
380                  tipc_addr_string_fill(addr_string, n_ptr->addr));
381
382         /* Flush broadcast link info associated with lost node */
383         if (n_ptr->bclink.recv_permitted) {
384                 __skb_queue_purge(&n_ptr->bclink.deferdq);
385
386                 if (n_ptr->bclink.reasm_buf) {
387                         kfree_skb(n_ptr->bclink.reasm_buf);
388                         n_ptr->bclink.reasm_buf = NULL;
389                 }
390
391                 tipc_bclink_remove_node(n_ptr->net, n_ptr->addr);
392                 tipc_bclink_acknowledge(n_ptr, INVALID_LINK_SEQ);
393
394                 n_ptr->bclink.recv_permitted = false;
395         }
396
397         /* Abort any ongoing link failover */
398         for (i = 0; i < MAX_BEARERS; i++) {
399                 struct tipc_link *l_ptr = n_ptr->links[i];
400                 if (!l_ptr)
401                         continue;
402                 l_ptr->flags &= ~LINK_FAILINGOVER;
403                 l_ptr->failover_checkpt = 0;
404                 l_ptr->failover_pkts = 0;
405                 kfree_skb(l_ptr->failover_skb);
406                 l_ptr->failover_skb = NULL;
407                 tipc_link_reset_fragments(l_ptr);
408         }
409
410         n_ptr->action_flags &= ~TIPC_WAIT_OWN_LINKS_DOWN;
411
412         /* Prevent re-contact with node until cleanup is done */
413         n_ptr->action_flags |= TIPC_WAIT_PEER_LINKS_DOWN;
414
415         /* Notify publications from this node */
416         n_ptr->action_flags |= TIPC_NOTIFY_NODE_DOWN;
417
418         /* Notify sockets connected to node */
419         list_for_each_entry_safe(conn, safe, conns, list) {
420                 skb = tipc_msg_create(TIPC_CRITICAL_IMPORTANCE, TIPC_CONN_MSG,
421                                       SHORT_H_SIZE, 0, tn->own_addr,
422                                       conn->peer_node, conn->port,
423                                       conn->peer_port, TIPC_ERR_NO_NODE);
424                 if (likely(skb)) {
425                         skb_queue_tail(n_ptr->inputq, skb);
426                         n_ptr->action_flags |= TIPC_MSG_EVT;
427                 }
428                 list_del(&conn->list);
429                 kfree(conn);
430         }
431 }
432
433 /**
434  * tipc_node_get_linkname - get the name of a link
435  *
436  * @bearer_id: id of the bearer
437  * @node: peer node address
438  * @linkname: link name output buffer
439  *
440  * Returns 0 on success
441  */
442 int tipc_node_get_linkname(struct net *net, u32 bearer_id, u32 addr,
443                            char *linkname, size_t len)
444 {
445         struct tipc_link *link;
446         int err = -EINVAL;
447         struct tipc_node *node = tipc_node_find(net, addr);
448
449         if (!node)
450                 return err;
451
452         if (bearer_id >= MAX_BEARERS)
453                 goto exit;
454
455         tipc_node_lock(node);
456         link = node->links[bearer_id];
457         if (link) {
458                 strncpy(linkname, link->name, len);
459                 err = 0;
460         }
461 exit:
462         tipc_node_unlock(node);
463         tipc_node_put(node);
464         return err;
465 }
466
467 void tipc_node_unlock(struct tipc_node *node)
468 {
469         struct net *net = node->net;
470         u32 addr = 0;
471         u32 flags = node->action_flags;
472         u32 link_id = 0;
473         struct list_head *publ_list;
474         struct sk_buff_head *inputq = node->inputq;
475         struct sk_buff_head *namedq;
476
477         if (likely(!flags || (flags == TIPC_MSG_EVT))) {
478                 node->action_flags = 0;
479                 spin_unlock_bh(&node->lock);
480                 if (flags == TIPC_MSG_EVT)
481                         tipc_sk_rcv(net, inputq);
482                 return;
483         }
484
485         addr = node->addr;
486         link_id = node->link_id;
487         namedq = node->namedq;
488         publ_list = &node->publ_list;
489
490         node->action_flags &= ~(TIPC_MSG_EVT |
491                                 TIPC_NOTIFY_NODE_DOWN | TIPC_NOTIFY_NODE_UP |
492                                 TIPC_NOTIFY_LINK_DOWN | TIPC_NOTIFY_LINK_UP |
493                                 TIPC_WAKEUP_BCAST_USERS | TIPC_BCAST_MSG_EVT |
494                                 TIPC_NAMED_MSG_EVT | TIPC_BCAST_RESET);
495
496         spin_unlock_bh(&node->lock);
497
498         if (flags & TIPC_NOTIFY_NODE_DOWN)
499                 tipc_publ_notify(net, publ_list, addr);
500
501         if (flags & TIPC_WAKEUP_BCAST_USERS)
502                 tipc_bclink_wakeup_users(net);
503
504         if (flags & TIPC_NOTIFY_NODE_UP)
505                 tipc_named_node_up(net, addr);
506
507         if (flags & TIPC_NOTIFY_LINK_UP)
508                 tipc_nametbl_publish(net, TIPC_LINK_STATE, addr, addr,
509                                      TIPC_NODE_SCOPE, link_id, addr);
510
511         if (flags & TIPC_NOTIFY_LINK_DOWN)
512                 tipc_nametbl_withdraw(net, TIPC_LINK_STATE, addr,
513                                       link_id, addr);
514
515         if (flags & TIPC_MSG_EVT)
516                 tipc_sk_rcv(net, inputq);
517
518         if (flags & TIPC_NAMED_MSG_EVT)
519                 tipc_named_rcv(net, namedq);
520
521         if (flags & TIPC_BCAST_MSG_EVT)
522                 tipc_bclink_input(net);
523
524         if (flags & TIPC_BCAST_RESET)
525                 tipc_link_reset_all(node);
526 }
527
528 /* Caller should hold node lock for the passed node */
529 static int __tipc_nl_add_node(struct tipc_nl_msg *msg, struct tipc_node *node)
530 {
531         void *hdr;
532         struct nlattr *attrs;
533
534         hdr = genlmsg_put(msg->skb, msg->portid, msg->seq, &tipc_genl_family,
535                           NLM_F_MULTI, TIPC_NL_NODE_GET);
536         if (!hdr)
537                 return -EMSGSIZE;
538
539         attrs = nla_nest_start(msg->skb, TIPC_NLA_NODE);
540         if (!attrs)
541                 goto msg_full;
542
543         if (nla_put_u32(msg->skb, TIPC_NLA_NODE_ADDR, node->addr))
544                 goto attr_msg_full;
545         if (tipc_node_is_up(node))
546                 if (nla_put_flag(msg->skb, TIPC_NLA_NODE_UP))
547                         goto attr_msg_full;
548
549         nla_nest_end(msg->skb, attrs);
550         genlmsg_end(msg->skb, hdr);
551
552         return 0;
553
554 attr_msg_full:
555         nla_nest_cancel(msg->skb, attrs);
556 msg_full:
557         genlmsg_cancel(msg->skb, hdr);
558
559         return -EMSGSIZE;
560 }
561
562 int tipc_nl_node_dump(struct sk_buff *skb, struct netlink_callback *cb)
563 {
564         int err;
565         struct net *net = sock_net(skb->sk);
566         struct tipc_net *tn = net_generic(net, tipc_net_id);
567         int done = cb->args[0];
568         int last_addr = cb->args[1];
569         struct tipc_node *node;
570         struct tipc_nl_msg msg;
571
572         if (done)
573                 return 0;
574
575         msg.skb = skb;
576         msg.portid = NETLINK_CB(cb->skb).portid;
577         msg.seq = cb->nlh->nlmsg_seq;
578
579         rcu_read_lock();
580         if (last_addr) {
581                 node = tipc_node_find(net, last_addr);
582                 if (!node) {
583                         rcu_read_unlock();
584                         /* We never set seq or call nl_dump_check_consistent()
585                          * this means that setting prev_seq here will cause the
586                          * consistence check to fail in the netlink callback
587                          * handler. Resulting in the NLMSG_DONE message having
588                          * the NLM_F_DUMP_INTR flag set if the node state
589                          * changed while we released the lock.
590                          */
591                         cb->prev_seq = 1;
592                         return -EPIPE;
593                 }
594                 tipc_node_put(node);
595         }
596
597         list_for_each_entry_rcu(node, &tn->node_list, list) {
598                 if (last_addr) {
599                         if (node->addr == last_addr)
600                                 last_addr = 0;
601                         else
602                                 continue;
603                 }
604
605                 tipc_node_lock(node);
606                 err = __tipc_nl_add_node(&msg, node);
607                 if (err) {
608                         last_addr = node->addr;
609                         tipc_node_unlock(node);
610                         goto out;
611                 }
612
613                 tipc_node_unlock(node);
614         }
615         done = 1;
616 out:
617         cb->args[0] = done;
618         cb->args[1] = last_addr;
619         rcu_read_unlock();
620
621         return skb->len;
622 }