4528f122bcd2ff79806709efdeb9ae0faded50cc
[cascardo/linux.git] / net / netfilter / nf_tables_api.c
1 /*
2  * Copyright (c) 2007-2009 Patrick McHardy <kaber@trash.net>
3  *
4  * This program is free software; you can redistribute it and/or modify
5  * it under the terms of the GNU General Public License version 2 as
6  * published by the Free Software Foundation.
7  *
8  * Development of this code funded by Astaro AG (http://www.astaro.com/)
9  */
10
11 #include <linux/module.h>
12 #include <linux/init.h>
13 #include <linux/list.h>
14 #include <linux/skbuff.h>
15 #include <linux/netlink.h>
16 #include <linux/netfilter.h>
17 #include <linux/netfilter/nfnetlink.h>
18 #include <linux/netfilter/nf_tables.h>
19 #include <net/netfilter/nf_tables_core.h>
20 #include <net/netfilter/nf_tables.h>
21 #include <net/net_namespace.h>
22 #include <net/sock.h>
23
24 static LIST_HEAD(nf_tables_expressions);
25
26 /**
27  *      nft_register_afinfo - register nf_tables address family info
28  *
29  *      @afi: address family info to register
30  *
31  *      Register the address family for use with nf_tables. Returns zero on
32  *      success or a negative errno code otherwise.
33  */
34 int nft_register_afinfo(struct net *net, struct nft_af_info *afi)
35 {
36         INIT_LIST_HEAD(&afi->tables);
37         nfnl_lock(NFNL_SUBSYS_NFTABLES);
38         list_add_tail_rcu(&afi->list, &net->nft.af_info);
39         nfnl_unlock(NFNL_SUBSYS_NFTABLES);
40         return 0;
41 }
42 EXPORT_SYMBOL_GPL(nft_register_afinfo);
43
44 /**
45  *      nft_unregister_afinfo - unregister nf_tables address family info
46  *
47  *      @afi: address family info to unregister
48  *
49  *      Unregister the address family for use with nf_tables.
50  */
51 void nft_unregister_afinfo(struct nft_af_info *afi)
52 {
53         nfnl_lock(NFNL_SUBSYS_NFTABLES);
54         list_del_rcu(&afi->list);
55         nfnl_unlock(NFNL_SUBSYS_NFTABLES);
56 }
57 EXPORT_SYMBOL_GPL(nft_unregister_afinfo);
58
59 static struct nft_af_info *nft_afinfo_lookup(struct net *net, int family)
60 {
61         struct nft_af_info *afi;
62
63         list_for_each_entry(afi, &net->nft.af_info, list) {
64                 if (afi->family == family)
65                         return afi;
66         }
67         return NULL;
68 }
69
70 static struct nft_af_info *
71 nf_tables_afinfo_lookup(struct net *net, int family, bool autoload)
72 {
73         struct nft_af_info *afi;
74
75         afi = nft_afinfo_lookup(net, family);
76         if (afi != NULL)
77                 return afi;
78 #ifdef CONFIG_MODULES
79         if (autoload) {
80                 nfnl_unlock(NFNL_SUBSYS_NFTABLES);
81                 request_module("nft-afinfo-%u", family);
82                 nfnl_lock(NFNL_SUBSYS_NFTABLES);
83                 afi = nft_afinfo_lookup(net, family);
84                 if (afi != NULL)
85                         return ERR_PTR(-EAGAIN);
86         }
87 #endif
88         return ERR_PTR(-EAFNOSUPPORT);
89 }
90
91 static void nft_ctx_init(struct nft_ctx *ctx,
92                          const struct sk_buff *skb,
93                          const struct nlmsghdr *nlh,
94                          struct nft_af_info *afi,
95                          struct nft_table *table,
96                          struct nft_chain *chain,
97                          const struct nlattr * const *nla)
98 {
99         ctx->net        = sock_net(skb->sk);
100         ctx->afi        = afi;
101         ctx->table      = table;
102         ctx->chain      = chain;
103         ctx->nla        = nla;
104         ctx->portid     = NETLINK_CB(skb).portid;
105         ctx->report     = nlmsg_report(nlh);
106         ctx->seq        = nlh->nlmsg_seq;
107 }
108
109 static struct nft_trans *nft_trans_alloc(struct nft_ctx *ctx, int msg_type,
110                                          u32 size)
111 {
112         struct nft_trans *trans;
113
114         trans = kzalloc(sizeof(struct nft_trans) + size, GFP_KERNEL);
115         if (trans == NULL)
116                 return NULL;
117
118         trans->msg_type = msg_type;
119         trans->ctx      = *ctx;
120
121         return trans;
122 }
123
124 static void nft_trans_destroy(struct nft_trans *trans)
125 {
126         list_del(&trans->list);
127         kfree(trans);
128 }
129
130 static void nf_tables_unregister_hooks(const struct nft_table *table,
131                                        const struct nft_chain *chain,
132                                        unsigned int hook_nops)
133 {
134         if (!(table->flags & NFT_TABLE_F_DORMANT) &&
135             chain->flags & NFT_BASE_CHAIN)
136                 nf_unregister_hooks(nft_base_chain(chain)->ops, hook_nops);
137 }
138
139 /* Internal table flags */
140 #define NFT_TABLE_INACTIVE      (1 << 15)
141
142 static int nft_trans_table_add(struct nft_ctx *ctx, int msg_type)
143 {
144         struct nft_trans *trans;
145
146         trans = nft_trans_alloc(ctx, msg_type, sizeof(struct nft_trans_table));
147         if (trans == NULL)
148                 return -ENOMEM;
149
150         if (msg_type == NFT_MSG_NEWTABLE)
151                 ctx->table->flags |= NFT_TABLE_INACTIVE;
152
153         list_add_tail(&trans->list, &ctx->net->nft.commit_list);
154         return 0;
155 }
156
157 static int nft_deltable(struct nft_ctx *ctx)
158 {
159         int err;
160
161         err = nft_trans_table_add(ctx, NFT_MSG_DELTABLE);
162         if (err < 0)
163                 return err;
164
165         list_del_rcu(&ctx->table->list);
166         return err;
167 }
168
169 static int nft_trans_chain_add(struct nft_ctx *ctx, int msg_type)
170 {
171         struct nft_trans *trans;
172
173         trans = nft_trans_alloc(ctx, msg_type, sizeof(struct nft_trans_chain));
174         if (trans == NULL)
175                 return -ENOMEM;
176
177         if (msg_type == NFT_MSG_NEWCHAIN)
178                 ctx->chain->flags |= NFT_CHAIN_INACTIVE;
179
180         list_add_tail(&trans->list, &ctx->net->nft.commit_list);
181         return 0;
182 }
183
184 static int nft_delchain(struct nft_ctx *ctx)
185 {
186         int err;
187
188         err = nft_trans_chain_add(ctx, NFT_MSG_DELCHAIN);
189         if (err < 0)
190                 return err;
191
192         ctx->table->use--;
193         list_del_rcu(&ctx->chain->list);
194
195         return err;
196 }
197
198 static inline bool
199 nft_rule_is_active(struct net *net, const struct nft_rule *rule)
200 {
201         return (rule->genmask & nft_genmask_cur(net)) == 0;
202 }
203
204 static inline int
205 nft_rule_is_active_next(struct net *net, const struct nft_rule *rule)
206 {
207         return (rule->genmask & nft_genmask_next(net)) == 0;
208 }
209
210 static inline void
211 nft_rule_activate_next(struct net *net, struct nft_rule *rule)
212 {
213         /* Now inactive, will be active in the future */
214         rule->genmask = nft_genmask_cur(net);
215 }
216
217 static inline void
218 nft_rule_deactivate_next(struct net *net, struct nft_rule *rule)
219 {
220         rule->genmask = nft_genmask_next(net);
221 }
222
223 static inline void nft_rule_clear(struct net *net, struct nft_rule *rule)
224 {
225         rule->genmask &= ~nft_genmask_next(net);
226 }
227
228 static int
229 nf_tables_delrule_deactivate(struct nft_ctx *ctx, struct nft_rule *rule)
230 {
231         /* You cannot delete the same rule twice */
232         if (nft_rule_is_active_next(ctx->net, rule)) {
233                 nft_rule_deactivate_next(ctx->net, rule);
234                 ctx->chain->use--;
235                 return 0;
236         }
237         return -ENOENT;
238 }
239
240 static struct nft_trans *nft_trans_rule_add(struct nft_ctx *ctx, int msg_type,
241                                             struct nft_rule *rule)
242 {
243         struct nft_trans *trans;
244
245         trans = nft_trans_alloc(ctx, msg_type, sizeof(struct nft_trans_rule));
246         if (trans == NULL)
247                 return NULL;
248
249         nft_trans_rule(trans) = rule;
250         list_add_tail(&trans->list, &ctx->net->nft.commit_list);
251
252         return trans;
253 }
254
255 static int nft_delrule(struct nft_ctx *ctx, struct nft_rule *rule)
256 {
257         struct nft_trans *trans;
258         int err;
259
260         trans = nft_trans_rule_add(ctx, NFT_MSG_DELRULE, rule);
261         if (trans == NULL)
262                 return -ENOMEM;
263
264         err = nf_tables_delrule_deactivate(ctx, rule);
265         if (err < 0) {
266                 nft_trans_destroy(trans);
267                 return err;
268         }
269
270         return 0;
271 }
272
273 static int nft_delrule_by_chain(struct nft_ctx *ctx)
274 {
275         struct nft_rule *rule;
276         int err;
277
278         list_for_each_entry(rule, &ctx->chain->rules, list) {
279                 err = nft_delrule(ctx, rule);
280                 if (err < 0)
281                         return err;
282         }
283         return 0;
284 }
285
286 /* Internal set flag */
287 #define NFT_SET_INACTIVE        (1 << 15)
288
289 static int nft_trans_set_add(struct nft_ctx *ctx, int msg_type,
290                              struct nft_set *set)
291 {
292         struct nft_trans *trans;
293
294         trans = nft_trans_alloc(ctx, msg_type, sizeof(struct nft_trans_set));
295         if (trans == NULL)
296                 return -ENOMEM;
297
298         if (msg_type == NFT_MSG_NEWSET && ctx->nla[NFTA_SET_ID] != NULL) {
299                 nft_trans_set_id(trans) =
300                         ntohl(nla_get_be32(ctx->nla[NFTA_SET_ID]));
301                 set->flags |= NFT_SET_INACTIVE;
302         }
303         nft_trans_set(trans) = set;
304         list_add_tail(&trans->list, &ctx->net->nft.commit_list);
305
306         return 0;
307 }
308
309 static int nft_delset(struct nft_ctx *ctx, struct nft_set *set)
310 {
311         int err;
312
313         err = nft_trans_set_add(ctx, NFT_MSG_DELSET, set);
314         if (err < 0)
315                 return err;
316
317         list_del_rcu(&set->list);
318         ctx->table->use--;
319
320         return err;
321 }
322
323 /*
324  * Tables
325  */
326
327 static struct nft_table *nft_table_lookup(const struct nft_af_info *afi,
328                                           const struct nlattr *nla)
329 {
330         struct nft_table *table;
331
332         list_for_each_entry(table, &afi->tables, list) {
333                 if (!nla_strcmp(nla, table->name))
334                         return table;
335         }
336         return NULL;
337 }
338
339 static struct nft_table *nf_tables_table_lookup(const struct nft_af_info *afi,
340                                                 const struct nlattr *nla)
341 {
342         struct nft_table *table;
343
344         if (nla == NULL)
345                 return ERR_PTR(-EINVAL);
346
347         table = nft_table_lookup(afi, nla);
348         if (table != NULL)
349                 return table;
350
351         return ERR_PTR(-ENOENT);
352 }
353
354 static inline u64 nf_tables_alloc_handle(struct nft_table *table)
355 {
356         return ++table->hgenerator;
357 }
358
359 static const struct nf_chain_type *chain_type[AF_MAX][NFT_CHAIN_T_MAX];
360
361 static const struct nf_chain_type *
362 __nf_tables_chain_type_lookup(int family, const struct nlattr *nla)
363 {
364         int i;
365
366         for (i = 0; i < NFT_CHAIN_T_MAX; i++) {
367                 if (chain_type[family][i] != NULL &&
368                     !nla_strcmp(nla, chain_type[family][i]->name))
369                         return chain_type[family][i];
370         }
371         return NULL;
372 }
373
374 static const struct nf_chain_type *
375 nf_tables_chain_type_lookup(const struct nft_af_info *afi,
376                             const struct nlattr *nla,
377                             bool autoload)
378 {
379         const struct nf_chain_type *type;
380
381         type = __nf_tables_chain_type_lookup(afi->family, nla);
382         if (type != NULL)
383                 return type;
384 #ifdef CONFIG_MODULES
385         if (autoload) {
386                 nfnl_unlock(NFNL_SUBSYS_NFTABLES);
387                 request_module("nft-chain-%u-%.*s", afi->family,
388                                nla_len(nla), (const char *)nla_data(nla));
389                 nfnl_lock(NFNL_SUBSYS_NFTABLES);
390                 type = __nf_tables_chain_type_lookup(afi->family, nla);
391                 if (type != NULL)
392                         return ERR_PTR(-EAGAIN);
393         }
394 #endif
395         return ERR_PTR(-ENOENT);
396 }
397
398 static const struct nla_policy nft_table_policy[NFTA_TABLE_MAX + 1] = {
399         [NFTA_TABLE_NAME]       = { .type = NLA_STRING,
400                                     .len = NFT_TABLE_MAXNAMELEN - 1 },
401         [NFTA_TABLE_FLAGS]      = { .type = NLA_U32 },
402         [NFTA_TABLE_DEV]        = { .type = NLA_STRING,
403                                     .len = IFNAMSIZ - 1 },
404 };
405
406 static int nf_tables_fill_table_info(struct sk_buff *skb, struct net *net,
407                                      u32 portid, u32 seq, int event, u32 flags,
408                                      int family, const struct nft_table *table)
409 {
410         struct nlmsghdr *nlh;
411         struct nfgenmsg *nfmsg;
412
413         event |= NFNL_SUBSYS_NFTABLES << 8;
414         nlh = nlmsg_put(skb, portid, seq, event, sizeof(struct nfgenmsg), flags);
415         if (nlh == NULL)
416                 goto nla_put_failure;
417
418         nfmsg = nlmsg_data(nlh);
419         nfmsg->nfgen_family     = family;
420         nfmsg->version          = NFNETLINK_V0;
421         nfmsg->res_id           = htons(net->nft.base_seq & 0xffff);
422
423         if (nla_put_string(skb, NFTA_TABLE_NAME, table->name) ||
424             nla_put_be32(skb, NFTA_TABLE_FLAGS, htonl(table->flags)) ||
425             nla_put_be32(skb, NFTA_TABLE_USE, htonl(table->use)))
426                 goto nla_put_failure;
427
428         if (table->dev &&
429             nla_put_string(skb, NFTA_TABLE_DEV, table->dev->name))
430                 goto nla_put_failure;
431
432         nlmsg_end(skb, nlh);
433         return 0;
434
435 nla_put_failure:
436         nlmsg_trim(skb, nlh);
437         return -1;
438 }
439
440 static int nf_tables_table_notify(const struct nft_ctx *ctx, int event)
441 {
442         struct sk_buff *skb;
443         int err;
444
445         if (!ctx->report &&
446             !nfnetlink_has_listeners(ctx->net, NFNLGRP_NFTABLES))
447                 return 0;
448
449         err = -ENOBUFS;
450         skb = nlmsg_new(NLMSG_GOODSIZE, GFP_KERNEL);
451         if (skb == NULL)
452                 goto err;
453
454         err = nf_tables_fill_table_info(skb, ctx->net, ctx->portid, ctx->seq,
455                                         event, 0, ctx->afi->family, ctx->table);
456         if (err < 0) {
457                 kfree_skb(skb);
458                 goto err;
459         }
460
461         err = nfnetlink_send(skb, ctx->net, ctx->portid, NFNLGRP_NFTABLES,
462                              ctx->report, GFP_KERNEL);
463 err:
464         if (err < 0) {
465                 nfnetlink_set_err(ctx->net, ctx->portid, NFNLGRP_NFTABLES,
466                                   err);
467         }
468         return err;
469 }
470
471 static int nf_tables_dump_tables(struct sk_buff *skb,
472                                  struct netlink_callback *cb)
473 {
474         const struct nfgenmsg *nfmsg = nlmsg_data(cb->nlh);
475         const struct nft_af_info *afi;
476         const struct nft_table *table;
477         unsigned int idx = 0, s_idx = cb->args[0];
478         struct net *net = sock_net(skb->sk);
479         int family = nfmsg->nfgen_family;
480
481         rcu_read_lock();
482         cb->seq = net->nft.base_seq;
483
484         list_for_each_entry_rcu(afi, &net->nft.af_info, list) {
485                 if (family != NFPROTO_UNSPEC && family != afi->family)
486                         continue;
487
488                 list_for_each_entry_rcu(table, &afi->tables, list) {
489                         if (idx < s_idx)
490                                 goto cont;
491                         if (idx > s_idx)
492                                 memset(&cb->args[1], 0,
493                                        sizeof(cb->args) - sizeof(cb->args[0]));
494                         if (nf_tables_fill_table_info(skb, net,
495                                                       NETLINK_CB(cb->skb).portid,
496                                                       cb->nlh->nlmsg_seq,
497                                                       NFT_MSG_NEWTABLE,
498                                                       NLM_F_MULTI,
499                                                       afi->family, table) < 0)
500                                 goto done;
501
502                         nl_dump_check_consistent(cb, nlmsg_hdr(skb));
503 cont:
504                         idx++;
505                 }
506         }
507 done:
508         rcu_read_unlock();
509         cb->args[0] = idx;
510         return skb->len;
511 }
512
513 static int nf_tables_gettable(struct sock *nlsk, struct sk_buff *skb,
514                               const struct nlmsghdr *nlh,
515                               const struct nlattr * const nla[])
516 {
517         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
518         const struct nft_af_info *afi;
519         const struct nft_table *table;
520         struct sk_buff *skb2;
521         struct net *net = sock_net(skb->sk);
522         int family = nfmsg->nfgen_family;
523         int err;
524
525         if (nlh->nlmsg_flags & NLM_F_DUMP) {
526                 struct netlink_dump_control c = {
527                         .dump = nf_tables_dump_tables,
528                 };
529                 return netlink_dump_start(nlsk, skb, nlh, &c);
530         }
531
532         afi = nf_tables_afinfo_lookup(net, family, false);
533         if (IS_ERR(afi))
534                 return PTR_ERR(afi);
535
536         table = nf_tables_table_lookup(afi, nla[NFTA_TABLE_NAME]);
537         if (IS_ERR(table))
538                 return PTR_ERR(table);
539         if (table->flags & NFT_TABLE_INACTIVE)
540                 return -ENOENT;
541
542         skb2 = alloc_skb(NLMSG_GOODSIZE, GFP_KERNEL);
543         if (!skb2)
544                 return -ENOMEM;
545
546         err = nf_tables_fill_table_info(skb2, net, NETLINK_CB(skb).portid,
547                                         nlh->nlmsg_seq, NFT_MSG_NEWTABLE, 0,
548                                         family, table);
549         if (err < 0)
550                 goto err;
551
552         return nlmsg_unicast(nlsk, skb2, NETLINK_CB(skb).portid);
553
554 err:
555         kfree_skb(skb2);
556         return err;
557 }
558
559 static int nf_tables_table_enable(const struct nft_af_info *afi,
560                                   struct nft_table *table)
561 {
562         struct nft_chain *chain;
563         int err, i = 0;
564
565         list_for_each_entry(chain, &table->chains, list) {
566                 if (!(chain->flags & NFT_BASE_CHAIN))
567                         continue;
568
569                 err = nf_register_hooks(nft_base_chain(chain)->ops, afi->nops);
570                 if (err < 0)
571                         goto err;
572
573                 i++;
574         }
575         return 0;
576 err:
577         list_for_each_entry(chain, &table->chains, list) {
578                 if (!(chain->flags & NFT_BASE_CHAIN))
579                         continue;
580
581                 if (i-- <= 0)
582                         break;
583
584                 nf_unregister_hooks(nft_base_chain(chain)->ops, afi->nops);
585         }
586         return err;
587 }
588
589 static void nf_tables_table_disable(const struct nft_af_info *afi,
590                                    struct nft_table *table)
591 {
592         struct nft_chain *chain;
593
594         list_for_each_entry(chain, &table->chains, list) {
595                 if (chain->flags & NFT_BASE_CHAIN)
596                         nf_unregister_hooks(nft_base_chain(chain)->ops,
597                                             afi->nops);
598         }
599 }
600
601 static int nf_tables_updtable(struct nft_ctx *ctx)
602 {
603         struct nft_trans *trans;
604         u32 flags;
605         int ret = 0;
606
607         if (!ctx->nla[NFTA_TABLE_FLAGS])
608                 return 0;
609
610         flags = ntohl(nla_get_be32(ctx->nla[NFTA_TABLE_FLAGS]));
611         if (flags & ~NFT_TABLE_F_DORMANT)
612                 return -EINVAL;
613
614         if (flags == ctx->table->flags)
615                 return 0;
616
617         if ((ctx->afi->flags & NFT_AF_NEEDS_DEV) &&
618             ctx->nla[NFTA_TABLE_DEV] &&
619             nla_strcmp(ctx->nla[NFTA_TABLE_DEV], ctx->table->dev->name))
620                 return -EOPNOTSUPP;
621
622         trans = nft_trans_alloc(ctx, NFT_MSG_NEWTABLE,
623                                 sizeof(struct nft_trans_table));
624         if (trans == NULL)
625                 return -ENOMEM;
626
627         if ((flags & NFT_TABLE_F_DORMANT) &&
628             !(ctx->table->flags & NFT_TABLE_F_DORMANT)) {
629                 nft_trans_table_enable(trans) = false;
630         } else if (!(flags & NFT_TABLE_F_DORMANT) &&
631                    ctx->table->flags & NFT_TABLE_F_DORMANT) {
632                 ret = nf_tables_table_enable(ctx->afi, ctx->table);
633                 if (ret >= 0) {
634                         ctx->table->flags &= ~NFT_TABLE_F_DORMANT;
635                         nft_trans_table_enable(trans) = true;
636                 }
637         }
638         if (ret < 0)
639                 goto err;
640
641         nft_trans_table_update(trans) = true;
642         list_add_tail(&trans->list, &ctx->net->nft.commit_list);
643         return 0;
644 err:
645         nft_trans_destroy(trans);
646         return ret;
647 }
648
649 static int nf_tables_newtable(struct sock *nlsk, struct sk_buff *skb,
650                               const struct nlmsghdr *nlh,
651                               const struct nlattr * const nla[])
652 {
653         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
654         const struct nlattr *name;
655         struct nft_af_info *afi;
656         struct nft_table *table;
657         struct net *net = sock_net(skb->sk);
658         int family = nfmsg->nfgen_family;
659         struct net_device *dev = NULL;
660         u32 flags = 0;
661         struct nft_ctx ctx;
662         int err;
663
664         afi = nf_tables_afinfo_lookup(net, family, true);
665         if (IS_ERR(afi))
666                 return PTR_ERR(afi);
667
668         name = nla[NFTA_TABLE_NAME];
669         table = nf_tables_table_lookup(afi, name);
670         if (IS_ERR(table)) {
671                 if (PTR_ERR(table) != -ENOENT)
672                         return PTR_ERR(table);
673                 table = NULL;
674         }
675
676         if (table != NULL) {
677                 if (table->flags & NFT_TABLE_INACTIVE)
678                         return -ENOENT;
679                 if (nlh->nlmsg_flags & NLM_F_EXCL)
680                         return -EEXIST;
681                 if (nlh->nlmsg_flags & NLM_F_REPLACE)
682                         return -EOPNOTSUPP;
683
684                 nft_ctx_init(&ctx, skb, nlh, afi, table, NULL, nla);
685                 return nf_tables_updtable(&ctx);
686         }
687
688         if (nla[NFTA_TABLE_FLAGS]) {
689                 flags = ntohl(nla_get_be32(nla[NFTA_TABLE_FLAGS]));
690                 if (flags & ~NFT_TABLE_F_DORMANT)
691                         return -EINVAL;
692         }
693
694         if (afi->flags & NFT_AF_NEEDS_DEV) {
695                 char ifname[IFNAMSIZ];
696
697                 if (!nla[NFTA_TABLE_DEV])
698                         return -EOPNOTSUPP;
699
700                 nla_strlcpy(ifname, nla[NFTA_TABLE_DEV], IFNAMSIZ);
701                 dev = dev_get_by_name(net, ifname);
702                 if (!dev)
703                         return -ENOENT;
704         } else if (nla[NFTA_TABLE_DEV]) {
705                 return -EOPNOTSUPP;
706         }
707
708         err = -EAFNOSUPPORT;
709         if (!try_module_get(afi->owner))
710                 goto err1;
711
712         err = -ENOMEM;
713         table = kzalloc(sizeof(*table), GFP_KERNEL);
714         if (table == NULL)
715                 goto err2;
716
717         nla_strlcpy(table->name, name, NFT_TABLE_MAXNAMELEN);
718         INIT_LIST_HEAD(&table->chains);
719         INIT_LIST_HEAD(&table->sets);
720         table->flags = flags;
721         table->dev   = dev;
722
723         nft_ctx_init(&ctx, skb, nlh, afi, table, NULL, nla);
724         err = nft_trans_table_add(&ctx, NFT_MSG_NEWTABLE);
725         if (err < 0)
726                 goto err3;
727
728         list_add_tail_rcu(&table->list, &afi->tables);
729         return 0;
730 err3:
731         kfree(table);
732 err2:
733         module_put(afi->owner);
734 err1:
735         if (dev != NULL)
736                 dev_put(dev);
737
738         return err;
739 }
740
741 static int nft_flush_table(struct nft_ctx *ctx)
742 {
743         int err;
744         struct nft_chain *chain, *nc;
745         struct nft_set *set, *ns;
746
747         list_for_each_entry(chain, &ctx->table->chains, list) {
748                 ctx->chain = chain;
749
750                 err = nft_delrule_by_chain(ctx);
751                 if (err < 0)
752                         goto out;
753         }
754
755         list_for_each_entry_safe(set, ns, &ctx->table->sets, list) {
756                 if (set->flags & NFT_SET_ANONYMOUS &&
757                     !list_empty(&set->bindings))
758                         continue;
759
760                 err = nft_delset(ctx, set);
761                 if (err < 0)
762                         goto out;
763         }
764
765         list_for_each_entry_safe(chain, nc, &ctx->table->chains, list) {
766                 ctx->chain = chain;
767
768                 err = nft_delchain(ctx);
769                 if (err < 0)
770                         goto out;
771         }
772
773         err = nft_deltable(ctx);
774 out:
775         return err;
776 }
777
778 static int nft_flush(struct nft_ctx *ctx, int family)
779 {
780         struct nft_af_info *afi;
781         struct nft_table *table, *nt;
782         const struct nlattr * const *nla = ctx->nla;
783         int err = 0;
784
785         list_for_each_entry(afi, &ctx->net->nft.af_info, list) {
786                 if (family != AF_UNSPEC && afi->family != family)
787                         continue;
788
789                 ctx->afi = afi;
790                 list_for_each_entry_safe(table, nt, &afi->tables, list) {
791                         if (nla[NFTA_TABLE_NAME] &&
792                             nla_strcmp(nla[NFTA_TABLE_NAME], table->name) != 0)
793                                 continue;
794
795                         ctx->table = table;
796
797                         err = nft_flush_table(ctx);
798                         if (err < 0)
799                                 goto out;
800                 }
801         }
802 out:
803         return err;
804 }
805
806 static int nf_tables_deltable(struct sock *nlsk, struct sk_buff *skb,
807                               const struct nlmsghdr *nlh,
808                               const struct nlattr * const nla[])
809 {
810         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
811         struct nft_af_info *afi;
812         struct nft_table *table;
813         struct net *net = sock_net(skb->sk);
814         int family = nfmsg->nfgen_family;
815         struct nft_ctx ctx;
816
817         nft_ctx_init(&ctx, skb, nlh, NULL, NULL, NULL, nla);
818         if (family == AF_UNSPEC || nla[NFTA_TABLE_NAME] == NULL)
819                 return nft_flush(&ctx, family);
820
821         afi = nf_tables_afinfo_lookup(net, family, false);
822         if (IS_ERR(afi))
823                 return PTR_ERR(afi);
824
825         table = nf_tables_table_lookup(afi, nla[NFTA_TABLE_NAME]);
826         if (IS_ERR(table))
827                 return PTR_ERR(table);
828         if (table->flags & NFT_TABLE_INACTIVE)
829                 return -ENOENT;
830
831         ctx.afi = afi;
832         ctx.table = table;
833
834         return nft_flush_table(&ctx);
835 }
836
837 static void nf_tables_table_destroy(struct nft_ctx *ctx)
838 {
839         BUG_ON(ctx->table->use > 0);
840
841         if (ctx->table->dev)
842                 dev_put(ctx->table->dev);
843
844         kfree(ctx->table);
845         module_put(ctx->afi->owner);
846 }
847
848 int nft_register_chain_type(const struct nf_chain_type *ctype)
849 {
850         int err = 0;
851
852         nfnl_lock(NFNL_SUBSYS_NFTABLES);
853         if (chain_type[ctype->family][ctype->type] != NULL) {
854                 err = -EBUSY;
855                 goto out;
856         }
857         chain_type[ctype->family][ctype->type] = ctype;
858 out:
859         nfnl_unlock(NFNL_SUBSYS_NFTABLES);
860         return err;
861 }
862 EXPORT_SYMBOL_GPL(nft_register_chain_type);
863
864 void nft_unregister_chain_type(const struct nf_chain_type *ctype)
865 {
866         nfnl_lock(NFNL_SUBSYS_NFTABLES);
867         chain_type[ctype->family][ctype->type] = NULL;
868         nfnl_unlock(NFNL_SUBSYS_NFTABLES);
869 }
870 EXPORT_SYMBOL_GPL(nft_unregister_chain_type);
871
872 /*
873  * Chains
874  */
875
876 static struct nft_chain *
877 nf_tables_chain_lookup_byhandle(const struct nft_table *table, u64 handle)
878 {
879         struct nft_chain *chain;
880
881         list_for_each_entry(chain, &table->chains, list) {
882                 if (chain->handle == handle)
883                         return chain;
884         }
885
886         return ERR_PTR(-ENOENT);
887 }
888
889 static struct nft_chain *nf_tables_chain_lookup(const struct nft_table *table,
890                                                 const struct nlattr *nla)
891 {
892         struct nft_chain *chain;
893
894         if (nla == NULL)
895                 return ERR_PTR(-EINVAL);
896
897         list_for_each_entry(chain, &table->chains, list) {
898                 if (!nla_strcmp(nla, chain->name))
899                         return chain;
900         }
901
902         return ERR_PTR(-ENOENT);
903 }
904
905 static const struct nla_policy nft_chain_policy[NFTA_CHAIN_MAX + 1] = {
906         [NFTA_CHAIN_TABLE]      = { .type = NLA_STRING },
907         [NFTA_CHAIN_HANDLE]     = { .type = NLA_U64 },
908         [NFTA_CHAIN_NAME]       = { .type = NLA_STRING,
909                                     .len = NFT_CHAIN_MAXNAMELEN - 1 },
910         [NFTA_CHAIN_HOOK]       = { .type = NLA_NESTED },
911         [NFTA_CHAIN_POLICY]     = { .type = NLA_U32 },
912         [NFTA_CHAIN_TYPE]       = { .type = NLA_STRING },
913         [NFTA_CHAIN_COUNTERS]   = { .type = NLA_NESTED },
914 };
915
916 static const struct nla_policy nft_hook_policy[NFTA_HOOK_MAX + 1] = {
917         [NFTA_HOOK_HOOKNUM]     = { .type = NLA_U32 },
918         [NFTA_HOOK_PRIORITY]    = { .type = NLA_U32 },
919 };
920
921 static int nft_dump_stats(struct sk_buff *skb, struct nft_stats __percpu *stats)
922 {
923         struct nft_stats *cpu_stats, total;
924         struct nlattr *nest;
925         unsigned int seq;
926         u64 pkts, bytes;
927         int cpu;
928
929         memset(&total, 0, sizeof(total));
930         for_each_possible_cpu(cpu) {
931                 cpu_stats = per_cpu_ptr(stats, cpu);
932                 do {
933                         seq = u64_stats_fetch_begin_irq(&cpu_stats->syncp);
934                         pkts = cpu_stats->pkts;
935                         bytes = cpu_stats->bytes;
936                 } while (u64_stats_fetch_retry_irq(&cpu_stats->syncp, seq));
937                 total.pkts += pkts;
938                 total.bytes += bytes;
939         }
940         nest = nla_nest_start(skb, NFTA_CHAIN_COUNTERS);
941         if (nest == NULL)
942                 goto nla_put_failure;
943
944         if (nla_put_be64(skb, NFTA_COUNTER_PACKETS, cpu_to_be64(total.pkts)) ||
945             nla_put_be64(skb, NFTA_COUNTER_BYTES, cpu_to_be64(total.bytes)))
946                 goto nla_put_failure;
947
948         nla_nest_end(skb, nest);
949         return 0;
950
951 nla_put_failure:
952         return -ENOSPC;
953 }
954
955 static int nf_tables_fill_chain_info(struct sk_buff *skb, struct net *net,
956                                      u32 portid, u32 seq, int event, u32 flags,
957                                      int family, const struct nft_table *table,
958                                      const struct nft_chain *chain)
959 {
960         struct nlmsghdr *nlh;
961         struct nfgenmsg *nfmsg;
962
963         event |= NFNL_SUBSYS_NFTABLES << 8;
964         nlh = nlmsg_put(skb, portid, seq, event, sizeof(struct nfgenmsg), flags);
965         if (nlh == NULL)
966                 goto nla_put_failure;
967
968         nfmsg = nlmsg_data(nlh);
969         nfmsg->nfgen_family     = family;
970         nfmsg->version          = NFNETLINK_V0;
971         nfmsg->res_id           = htons(net->nft.base_seq & 0xffff);
972
973         if (nla_put_string(skb, NFTA_CHAIN_TABLE, table->name))
974                 goto nla_put_failure;
975         if (nla_put_be64(skb, NFTA_CHAIN_HANDLE, cpu_to_be64(chain->handle)))
976                 goto nla_put_failure;
977         if (nla_put_string(skb, NFTA_CHAIN_NAME, chain->name))
978                 goto nla_put_failure;
979
980         if (chain->flags & NFT_BASE_CHAIN) {
981                 const struct nft_base_chain *basechain = nft_base_chain(chain);
982                 const struct nf_hook_ops *ops = &basechain->ops[0];
983                 struct nlattr *nest;
984
985                 nest = nla_nest_start(skb, NFTA_CHAIN_HOOK);
986                 if (nest == NULL)
987                         goto nla_put_failure;
988                 if (nla_put_be32(skb, NFTA_HOOK_HOOKNUM, htonl(ops->hooknum)))
989                         goto nla_put_failure;
990                 if (nla_put_be32(skb, NFTA_HOOK_PRIORITY, htonl(ops->priority)))
991                         goto nla_put_failure;
992                 nla_nest_end(skb, nest);
993
994                 if (nla_put_be32(skb, NFTA_CHAIN_POLICY,
995                                  htonl(basechain->policy)))
996                         goto nla_put_failure;
997
998                 if (nla_put_string(skb, NFTA_CHAIN_TYPE, basechain->type->name))
999                         goto nla_put_failure;
1000
1001                 if (nft_dump_stats(skb, nft_base_chain(chain)->stats))
1002                         goto nla_put_failure;
1003         }
1004
1005         if (nla_put_be32(skb, NFTA_CHAIN_USE, htonl(chain->use)))
1006                 goto nla_put_failure;
1007
1008         nlmsg_end(skb, nlh);
1009         return 0;
1010
1011 nla_put_failure:
1012         nlmsg_trim(skb, nlh);
1013         return -1;
1014 }
1015
1016 static int nf_tables_chain_notify(const struct nft_ctx *ctx, int event)
1017 {
1018         struct sk_buff *skb;
1019         int err;
1020
1021         if (!ctx->report &&
1022             !nfnetlink_has_listeners(ctx->net, NFNLGRP_NFTABLES))
1023                 return 0;
1024
1025         err = -ENOBUFS;
1026         skb = nlmsg_new(NLMSG_GOODSIZE, GFP_KERNEL);
1027         if (skb == NULL)
1028                 goto err;
1029
1030         err = nf_tables_fill_chain_info(skb, ctx->net, ctx->portid, ctx->seq,
1031                                         event, 0, ctx->afi->family, ctx->table,
1032                                         ctx->chain);
1033         if (err < 0) {
1034                 kfree_skb(skb);
1035                 goto err;
1036         }
1037
1038         err = nfnetlink_send(skb, ctx->net, ctx->portid, NFNLGRP_NFTABLES,
1039                              ctx->report, GFP_KERNEL);
1040 err:
1041         if (err < 0) {
1042                 nfnetlink_set_err(ctx->net, ctx->portid, NFNLGRP_NFTABLES,
1043                                   err);
1044         }
1045         return err;
1046 }
1047
1048 static int nf_tables_dump_chains(struct sk_buff *skb,
1049                                  struct netlink_callback *cb)
1050 {
1051         const struct nfgenmsg *nfmsg = nlmsg_data(cb->nlh);
1052         const struct nft_af_info *afi;
1053         const struct nft_table *table;
1054         const struct nft_chain *chain;
1055         unsigned int idx = 0, s_idx = cb->args[0];
1056         struct net *net = sock_net(skb->sk);
1057         int family = nfmsg->nfgen_family;
1058
1059         rcu_read_lock();
1060         cb->seq = net->nft.base_seq;
1061
1062         list_for_each_entry_rcu(afi, &net->nft.af_info, list) {
1063                 if (family != NFPROTO_UNSPEC && family != afi->family)
1064                         continue;
1065
1066                 list_for_each_entry_rcu(table, &afi->tables, list) {
1067                         list_for_each_entry_rcu(chain, &table->chains, list) {
1068                                 if (idx < s_idx)
1069                                         goto cont;
1070                                 if (idx > s_idx)
1071                                         memset(&cb->args[1], 0,
1072                                                sizeof(cb->args) - sizeof(cb->args[0]));
1073                                 if (nf_tables_fill_chain_info(skb, net,
1074                                                               NETLINK_CB(cb->skb).portid,
1075                                                               cb->nlh->nlmsg_seq,
1076                                                               NFT_MSG_NEWCHAIN,
1077                                                               NLM_F_MULTI,
1078                                                               afi->family, table, chain) < 0)
1079                                         goto done;
1080
1081                                 nl_dump_check_consistent(cb, nlmsg_hdr(skb));
1082 cont:
1083                                 idx++;
1084                         }
1085                 }
1086         }
1087 done:
1088         rcu_read_unlock();
1089         cb->args[0] = idx;
1090         return skb->len;
1091 }
1092
1093 static int nf_tables_getchain(struct sock *nlsk, struct sk_buff *skb,
1094                               const struct nlmsghdr *nlh,
1095                               const struct nlattr * const nla[])
1096 {
1097         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
1098         const struct nft_af_info *afi;
1099         const struct nft_table *table;
1100         const struct nft_chain *chain;
1101         struct sk_buff *skb2;
1102         struct net *net = sock_net(skb->sk);
1103         int family = nfmsg->nfgen_family;
1104         int err;
1105
1106         if (nlh->nlmsg_flags & NLM_F_DUMP) {
1107                 struct netlink_dump_control c = {
1108                         .dump = nf_tables_dump_chains,
1109                 };
1110                 return netlink_dump_start(nlsk, skb, nlh, &c);
1111         }
1112
1113         afi = nf_tables_afinfo_lookup(net, family, false);
1114         if (IS_ERR(afi))
1115                 return PTR_ERR(afi);
1116
1117         table = nf_tables_table_lookup(afi, nla[NFTA_CHAIN_TABLE]);
1118         if (IS_ERR(table))
1119                 return PTR_ERR(table);
1120         if (table->flags & NFT_TABLE_INACTIVE)
1121                 return -ENOENT;
1122
1123         chain = nf_tables_chain_lookup(table, nla[NFTA_CHAIN_NAME]);
1124         if (IS_ERR(chain))
1125                 return PTR_ERR(chain);
1126         if (chain->flags & NFT_CHAIN_INACTIVE)
1127                 return -ENOENT;
1128
1129         skb2 = alloc_skb(NLMSG_GOODSIZE, GFP_KERNEL);
1130         if (!skb2)
1131                 return -ENOMEM;
1132
1133         err = nf_tables_fill_chain_info(skb2, net, NETLINK_CB(skb).portid,
1134                                         nlh->nlmsg_seq, NFT_MSG_NEWCHAIN, 0,
1135                                         family, table, chain);
1136         if (err < 0)
1137                 goto err;
1138
1139         return nlmsg_unicast(nlsk, skb2, NETLINK_CB(skb).portid);
1140
1141 err:
1142         kfree_skb(skb2);
1143         return err;
1144 }
1145
1146 static const struct nla_policy nft_counter_policy[NFTA_COUNTER_MAX + 1] = {
1147         [NFTA_COUNTER_PACKETS]  = { .type = NLA_U64 },
1148         [NFTA_COUNTER_BYTES]    = { .type = NLA_U64 },
1149 };
1150
1151 static struct nft_stats __percpu *nft_stats_alloc(const struct nlattr *attr)
1152 {
1153         struct nlattr *tb[NFTA_COUNTER_MAX+1];
1154         struct nft_stats __percpu *newstats;
1155         struct nft_stats *stats;
1156         int err;
1157
1158         err = nla_parse_nested(tb, NFTA_COUNTER_MAX, attr, nft_counter_policy);
1159         if (err < 0)
1160                 return ERR_PTR(err);
1161
1162         if (!tb[NFTA_COUNTER_BYTES] || !tb[NFTA_COUNTER_PACKETS])
1163                 return ERR_PTR(-EINVAL);
1164
1165         newstats = netdev_alloc_pcpu_stats(struct nft_stats);
1166         if (newstats == NULL)
1167                 return ERR_PTR(-ENOMEM);
1168
1169         /* Restore old counters on this cpu, no problem. Per-cpu statistics
1170          * are not exposed to userspace.
1171          */
1172         preempt_disable();
1173         stats = this_cpu_ptr(newstats);
1174         stats->bytes = be64_to_cpu(nla_get_be64(tb[NFTA_COUNTER_BYTES]));
1175         stats->pkts = be64_to_cpu(nla_get_be64(tb[NFTA_COUNTER_PACKETS]));
1176         preempt_enable();
1177
1178         return newstats;
1179 }
1180
1181 static void nft_chain_stats_replace(struct nft_base_chain *chain,
1182                                     struct nft_stats __percpu *newstats)
1183 {
1184         if (newstats == NULL)
1185                 return;
1186
1187         if (chain->stats) {
1188                 struct nft_stats __percpu *oldstats =
1189                                 nft_dereference(chain->stats);
1190
1191                 rcu_assign_pointer(chain->stats, newstats);
1192                 synchronize_rcu();
1193                 free_percpu(oldstats);
1194         } else
1195                 rcu_assign_pointer(chain->stats, newstats);
1196 }
1197
1198 static void nf_tables_chain_destroy(struct nft_chain *chain)
1199 {
1200         BUG_ON(chain->use > 0);
1201
1202         if (chain->flags & NFT_BASE_CHAIN) {
1203                 module_put(nft_base_chain(chain)->type->owner);
1204                 free_percpu(nft_base_chain(chain)->stats);
1205                 kfree(nft_base_chain(chain));
1206         } else {
1207                 kfree(chain);
1208         }
1209 }
1210
1211 static int nf_tables_newchain(struct sock *nlsk, struct sk_buff *skb,
1212                               const struct nlmsghdr *nlh,
1213                               const struct nlattr * const nla[])
1214 {
1215         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
1216         const struct nlattr * uninitialized_var(name);
1217         struct nft_af_info *afi;
1218         struct nft_table *table;
1219         struct nft_chain *chain;
1220         struct nft_base_chain *basechain = NULL;
1221         struct nlattr *ha[NFTA_HOOK_MAX + 1];
1222         struct net *net = sock_net(skb->sk);
1223         int family = nfmsg->nfgen_family;
1224         u8 policy = NF_ACCEPT;
1225         u64 handle = 0;
1226         unsigned int i;
1227         struct nft_stats __percpu *stats;
1228         int err;
1229         bool create;
1230         struct nft_ctx ctx;
1231
1232         create = nlh->nlmsg_flags & NLM_F_CREATE ? true : false;
1233
1234         afi = nf_tables_afinfo_lookup(net, family, true);
1235         if (IS_ERR(afi))
1236                 return PTR_ERR(afi);
1237
1238         table = nf_tables_table_lookup(afi, nla[NFTA_CHAIN_TABLE]);
1239         if (IS_ERR(table))
1240                 return PTR_ERR(table);
1241
1242         chain = NULL;
1243         name = nla[NFTA_CHAIN_NAME];
1244
1245         if (nla[NFTA_CHAIN_HANDLE]) {
1246                 handle = be64_to_cpu(nla_get_be64(nla[NFTA_CHAIN_HANDLE]));
1247                 chain = nf_tables_chain_lookup_byhandle(table, handle);
1248                 if (IS_ERR(chain))
1249                         return PTR_ERR(chain);
1250         } else {
1251                 chain = nf_tables_chain_lookup(table, name);
1252                 if (IS_ERR(chain)) {
1253                         if (PTR_ERR(chain) != -ENOENT)
1254                                 return PTR_ERR(chain);
1255                         chain = NULL;
1256                 }
1257         }
1258
1259         if (nla[NFTA_CHAIN_POLICY]) {
1260                 if ((chain != NULL &&
1261                     !(chain->flags & NFT_BASE_CHAIN)))
1262                         return -EOPNOTSUPP;
1263
1264                 if (chain == NULL &&
1265                     nla[NFTA_CHAIN_HOOK] == NULL)
1266                         return -EOPNOTSUPP;
1267
1268                 policy = ntohl(nla_get_be32(nla[NFTA_CHAIN_POLICY]));
1269                 switch (policy) {
1270                 case NF_DROP:
1271                 case NF_ACCEPT:
1272                         break;
1273                 default:
1274                         return -EINVAL;
1275                 }
1276         }
1277
1278         if (chain != NULL) {
1279                 struct nft_stats *stats = NULL;
1280                 struct nft_trans *trans;
1281
1282                 if (chain->flags & NFT_CHAIN_INACTIVE)
1283                         return -ENOENT;
1284                 if (nlh->nlmsg_flags & NLM_F_EXCL)
1285                         return -EEXIST;
1286                 if (nlh->nlmsg_flags & NLM_F_REPLACE)
1287                         return -EOPNOTSUPP;
1288
1289                 if (nla[NFTA_CHAIN_HANDLE] && name &&
1290                     !IS_ERR(nf_tables_chain_lookup(table, nla[NFTA_CHAIN_NAME])))
1291                         return -EEXIST;
1292
1293                 if (nla[NFTA_CHAIN_COUNTERS]) {
1294                         if (!(chain->flags & NFT_BASE_CHAIN))
1295                                 return -EOPNOTSUPP;
1296
1297                         stats = nft_stats_alloc(nla[NFTA_CHAIN_COUNTERS]);
1298                         if (IS_ERR(stats))
1299                                 return PTR_ERR(stats);
1300                 }
1301
1302                 nft_ctx_init(&ctx, skb, nlh, afi, table, chain, nla);
1303                 trans = nft_trans_alloc(&ctx, NFT_MSG_NEWCHAIN,
1304                                         sizeof(struct nft_trans_chain));
1305                 if (trans == NULL) {
1306                         free_percpu(stats);
1307                         return -ENOMEM;
1308                 }
1309
1310                 nft_trans_chain_stats(trans) = stats;
1311                 nft_trans_chain_update(trans) = true;
1312
1313                 if (nla[NFTA_CHAIN_POLICY])
1314                         nft_trans_chain_policy(trans) = policy;
1315                 else
1316                         nft_trans_chain_policy(trans) = -1;
1317
1318                 if (nla[NFTA_CHAIN_HANDLE] && name) {
1319                         nla_strlcpy(nft_trans_chain_name(trans), name,
1320                                     NFT_CHAIN_MAXNAMELEN);
1321                 }
1322                 list_add_tail(&trans->list, &net->nft.commit_list);
1323                 return 0;
1324         }
1325
1326         if (table->use == UINT_MAX)
1327                 return -EOVERFLOW;
1328
1329         if (nla[NFTA_CHAIN_HOOK]) {
1330                 const struct nf_chain_type *type;
1331                 struct nf_hook_ops *ops;
1332                 nf_hookfn *hookfn;
1333                 u32 hooknum, priority;
1334
1335                 type = chain_type[family][NFT_CHAIN_T_DEFAULT];
1336                 if (nla[NFTA_CHAIN_TYPE]) {
1337                         type = nf_tables_chain_type_lookup(afi,
1338                                                            nla[NFTA_CHAIN_TYPE],
1339                                                            create);
1340                         if (IS_ERR(type))
1341                                 return PTR_ERR(type);
1342                 }
1343
1344                 err = nla_parse_nested(ha, NFTA_HOOK_MAX, nla[NFTA_CHAIN_HOOK],
1345                                        nft_hook_policy);
1346                 if (err < 0)
1347                         return err;
1348                 if (ha[NFTA_HOOK_HOOKNUM] == NULL ||
1349                     ha[NFTA_HOOK_PRIORITY] == NULL)
1350                         return -EINVAL;
1351
1352                 hooknum = ntohl(nla_get_be32(ha[NFTA_HOOK_HOOKNUM]));
1353                 if (hooknum >= afi->nhooks)
1354                         return -EINVAL;
1355                 priority = ntohl(nla_get_be32(ha[NFTA_HOOK_PRIORITY]));
1356
1357                 if (!(type->hook_mask & (1 << hooknum)))
1358                         return -EOPNOTSUPP;
1359                 if (!try_module_get(type->owner))
1360                         return -ENOENT;
1361                 hookfn = type->hooks[hooknum];
1362
1363                 basechain = kzalloc(sizeof(*basechain), GFP_KERNEL);
1364                 if (basechain == NULL) {
1365                         module_put(type->owner);
1366                         return -ENOMEM;
1367                 }
1368
1369                 if (nla[NFTA_CHAIN_COUNTERS]) {
1370                         stats = nft_stats_alloc(nla[NFTA_CHAIN_COUNTERS]);
1371                         if (IS_ERR(stats)) {
1372                                 module_put(type->owner);
1373                                 kfree(basechain);
1374                                 return PTR_ERR(stats);
1375                         }
1376                         basechain->stats = stats;
1377                 } else {
1378                         stats = netdev_alloc_pcpu_stats(struct nft_stats);
1379                         if (stats == NULL) {
1380                                 module_put(type->owner);
1381                                 kfree(basechain);
1382                                 return -ENOMEM;
1383                         }
1384                         rcu_assign_pointer(basechain->stats, stats);
1385                 }
1386
1387                 write_pnet(&basechain->pnet, net);
1388                 basechain->type = type;
1389                 chain = &basechain->chain;
1390
1391                 for (i = 0; i < afi->nops; i++) {
1392                         ops = &basechain->ops[i];
1393                         ops->pf         = family;
1394                         ops->owner      = afi->owner;
1395                         ops->hooknum    = hooknum;
1396                         ops->priority   = priority;
1397                         ops->priv       = chain;
1398                         ops->hook       = afi->hooks[ops->hooknum];
1399                         ops->dev        = table->dev;
1400                         if (hookfn)
1401                                 ops->hook = hookfn;
1402                         if (afi->hook_ops_init)
1403                                 afi->hook_ops_init(ops, i);
1404                 }
1405
1406                 chain->flags |= NFT_BASE_CHAIN;
1407                 basechain->policy = policy;
1408         } else {
1409                 chain = kzalloc(sizeof(*chain), GFP_KERNEL);
1410                 if (chain == NULL)
1411                         return -ENOMEM;
1412         }
1413
1414         INIT_LIST_HEAD(&chain->rules);
1415         chain->handle = nf_tables_alloc_handle(table);
1416         chain->table = table;
1417         nla_strlcpy(chain->name, name, NFT_CHAIN_MAXNAMELEN);
1418
1419         if (!(table->flags & NFT_TABLE_F_DORMANT) &&
1420             chain->flags & NFT_BASE_CHAIN) {
1421                 err = nf_register_hooks(nft_base_chain(chain)->ops, afi->nops);
1422                 if (err < 0)
1423                         goto err1;
1424         }
1425
1426         nft_ctx_init(&ctx, skb, nlh, afi, table, chain, nla);
1427         err = nft_trans_chain_add(&ctx, NFT_MSG_NEWCHAIN);
1428         if (err < 0)
1429                 goto err2;
1430
1431         table->use++;
1432         list_add_tail_rcu(&chain->list, &table->chains);
1433         return 0;
1434 err2:
1435         nf_tables_unregister_hooks(table, chain, afi->nops);
1436 err1:
1437         nf_tables_chain_destroy(chain);
1438         return err;
1439 }
1440
1441 static int nf_tables_delchain(struct sock *nlsk, struct sk_buff *skb,
1442                               const struct nlmsghdr *nlh,
1443                               const struct nlattr * const nla[])
1444 {
1445         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
1446         struct nft_af_info *afi;
1447         struct nft_table *table;
1448         struct nft_chain *chain;
1449         struct net *net = sock_net(skb->sk);
1450         int family = nfmsg->nfgen_family;
1451         struct nft_ctx ctx;
1452
1453         afi = nf_tables_afinfo_lookup(net, family, false);
1454         if (IS_ERR(afi))
1455                 return PTR_ERR(afi);
1456
1457         table = nf_tables_table_lookup(afi, nla[NFTA_CHAIN_TABLE]);
1458         if (IS_ERR(table))
1459                 return PTR_ERR(table);
1460         if (table->flags & NFT_TABLE_INACTIVE)
1461                 return -ENOENT;
1462
1463         chain = nf_tables_chain_lookup(table, nla[NFTA_CHAIN_NAME]);
1464         if (IS_ERR(chain))
1465                 return PTR_ERR(chain);
1466         if (chain->flags & NFT_CHAIN_INACTIVE)
1467                 return -ENOENT;
1468         if (chain->use > 0)
1469                 return -EBUSY;
1470
1471         nft_ctx_init(&ctx, skb, nlh, afi, table, chain, nla);
1472
1473         return nft_delchain(&ctx);
1474 }
1475
1476 /*
1477  * Expressions
1478  */
1479
1480 /**
1481  *      nft_register_expr - register nf_tables expr type
1482  *      @ops: expr type
1483  *
1484  *      Registers the expr type for use with nf_tables. Returns zero on
1485  *      success or a negative errno code otherwise.
1486  */
1487 int nft_register_expr(struct nft_expr_type *type)
1488 {
1489         nfnl_lock(NFNL_SUBSYS_NFTABLES);
1490         if (type->family == NFPROTO_UNSPEC)
1491                 list_add_tail_rcu(&type->list, &nf_tables_expressions);
1492         else
1493                 list_add_rcu(&type->list, &nf_tables_expressions);
1494         nfnl_unlock(NFNL_SUBSYS_NFTABLES);
1495         return 0;
1496 }
1497 EXPORT_SYMBOL_GPL(nft_register_expr);
1498
1499 /**
1500  *      nft_unregister_expr - unregister nf_tables expr type
1501  *      @ops: expr type
1502  *
1503  *      Unregisters the expr typefor use with nf_tables.
1504  */
1505 void nft_unregister_expr(struct nft_expr_type *type)
1506 {
1507         nfnl_lock(NFNL_SUBSYS_NFTABLES);
1508         list_del_rcu(&type->list);
1509         nfnl_unlock(NFNL_SUBSYS_NFTABLES);
1510 }
1511 EXPORT_SYMBOL_GPL(nft_unregister_expr);
1512
1513 static const struct nft_expr_type *__nft_expr_type_get(u8 family,
1514                                                        struct nlattr *nla)
1515 {
1516         const struct nft_expr_type *type;
1517
1518         list_for_each_entry(type, &nf_tables_expressions, list) {
1519                 if (!nla_strcmp(nla, type->name) &&
1520                     (!type->family || type->family == family))
1521                         return type;
1522         }
1523         return NULL;
1524 }
1525
1526 static const struct nft_expr_type *nft_expr_type_get(u8 family,
1527                                                      struct nlattr *nla)
1528 {
1529         const struct nft_expr_type *type;
1530
1531         if (nla == NULL)
1532                 return ERR_PTR(-EINVAL);
1533
1534         type = __nft_expr_type_get(family, nla);
1535         if (type != NULL && try_module_get(type->owner))
1536                 return type;
1537
1538 #ifdef CONFIG_MODULES
1539         if (type == NULL) {
1540                 nfnl_unlock(NFNL_SUBSYS_NFTABLES);
1541                 request_module("nft-expr-%u-%.*s", family,
1542                                nla_len(nla), (char *)nla_data(nla));
1543                 nfnl_lock(NFNL_SUBSYS_NFTABLES);
1544                 if (__nft_expr_type_get(family, nla))
1545                         return ERR_PTR(-EAGAIN);
1546
1547                 nfnl_unlock(NFNL_SUBSYS_NFTABLES);
1548                 request_module("nft-expr-%.*s",
1549                                nla_len(nla), (char *)nla_data(nla));
1550                 nfnl_lock(NFNL_SUBSYS_NFTABLES);
1551                 if (__nft_expr_type_get(family, nla))
1552                         return ERR_PTR(-EAGAIN);
1553         }
1554 #endif
1555         return ERR_PTR(-ENOENT);
1556 }
1557
1558 static const struct nla_policy nft_expr_policy[NFTA_EXPR_MAX + 1] = {
1559         [NFTA_EXPR_NAME]        = { .type = NLA_STRING },
1560         [NFTA_EXPR_DATA]        = { .type = NLA_NESTED },
1561 };
1562
1563 static int nf_tables_fill_expr_info(struct sk_buff *skb,
1564                                     const struct nft_expr *expr)
1565 {
1566         if (nla_put_string(skb, NFTA_EXPR_NAME, expr->ops->type->name))
1567                 goto nla_put_failure;
1568
1569         if (expr->ops->dump) {
1570                 struct nlattr *data = nla_nest_start(skb, NFTA_EXPR_DATA);
1571                 if (data == NULL)
1572                         goto nla_put_failure;
1573                 if (expr->ops->dump(skb, expr) < 0)
1574                         goto nla_put_failure;
1575                 nla_nest_end(skb, data);
1576         }
1577
1578         return skb->len;
1579
1580 nla_put_failure:
1581         return -1;
1582 };
1583
1584 int nft_expr_dump(struct sk_buff *skb, unsigned int attr,
1585                   const struct nft_expr *expr)
1586 {
1587         struct nlattr *nest;
1588
1589         nest = nla_nest_start(skb, attr);
1590         if (!nest)
1591                 goto nla_put_failure;
1592         if (nf_tables_fill_expr_info(skb, expr) < 0)
1593                 goto nla_put_failure;
1594         nla_nest_end(skb, nest);
1595         return 0;
1596
1597 nla_put_failure:
1598         return -1;
1599 }
1600
1601 struct nft_expr_info {
1602         const struct nft_expr_ops       *ops;
1603         struct nlattr                   *tb[NFT_EXPR_MAXATTR + 1];
1604 };
1605
1606 static int nf_tables_expr_parse(const struct nft_ctx *ctx,
1607                                 const struct nlattr *nla,
1608                                 struct nft_expr_info *info)
1609 {
1610         const struct nft_expr_type *type;
1611         const struct nft_expr_ops *ops;
1612         struct nlattr *tb[NFTA_EXPR_MAX + 1];
1613         int err;
1614
1615         err = nla_parse_nested(tb, NFTA_EXPR_MAX, nla, nft_expr_policy);
1616         if (err < 0)
1617                 return err;
1618
1619         type = nft_expr_type_get(ctx->afi->family, tb[NFTA_EXPR_NAME]);
1620         if (IS_ERR(type))
1621                 return PTR_ERR(type);
1622
1623         if (tb[NFTA_EXPR_DATA]) {
1624                 err = nla_parse_nested(info->tb, type->maxattr,
1625                                        tb[NFTA_EXPR_DATA], type->policy);
1626                 if (err < 0)
1627                         goto err1;
1628         } else
1629                 memset(info->tb, 0, sizeof(info->tb[0]) * (type->maxattr + 1));
1630
1631         if (type->select_ops != NULL) {
1632                 ops = type->select_ops(ctx,
1633                                        (const struct nlattr * const *)info->tb);
1634                 if (IS_ERR(ops)) {
1635                         err = PTR_ERR(ops);
1636                         goto err1;
1637                 }
1638         } else
1639                 ops = type->ops;
1640
1641         info->ops = ops;
1642         return 0;
1643
1644 err1:
1645         module_put(type->owner);
1646         return err;
1647 }
1648
1649 static int nf_tables_newexpr(const struct nft_ctx *ctx,
1650                              const struct nft_expr_info *info,
1651                              struct nft_expr *expr)
1652 {
1653         const struct nft_expr_ops *ops = info->ops;
1654         int err;
1655
1656         expr->ops = ops;
1657         if (ops->init) {
1658                 err = ops->init(ctx, expr, (const struct nlattr **)info->tb);
1659                 if (err < 0)
1660                         goto err1;
1661         }
1662
1663         return 0;
1664
1665 err1:
1666         expr->ops = NULL;
1667         return err;
1668 }
1669
1670 static void nf_tables_expr_destroy(const struct nft_ctx *ctx,
1671                                    struct nft_expr *expr)
1672 {
1673         if (expr->ops->destroy)
1674                 expr->ops->destroy(ctx, expr);
1675         module_put(expr->ops->type->owner);
1676 }
1677
1678 struct nft_expr *nft_expr_init(const struct nft_ctx *ctx,
1679                                const struct nlattr *nla)
1680 {
1681         struct nft_expr_info info;
1682         struct nft_expr *expr;
1683         int err;
1684
1685         err = nf_tables_expr_parse(ctx, nla, &info);
1686         if (err < 0)
1687                 goto err1;
1688
1689         err = -ENOMEM;
1690         expr = kzalloc(info.ops->size, GFP_KERNEL);
1691         if (expr == NULL)
1692                 goto err2;
1693
1694         err = nf_tables_newexpr(ctx, &info, expr);
1695         if (err < 0)
1696                 goto err2;
1697
1698         return expr;
1699 err2:
1700         module_put(info.ops->type->owner);
1701 err1:
1702         return ERR_PTR(err);
1703 }
1704
1705 void nft_expr_destroy(const struct nft_ctx *ctx, struct nft_expr *expr)
1706 {
1707         nf_tables_expr_destroy(ctx, expr);
1708         kfree(expr);
1709 }
1710
1711 /*
1712  * Rules
1713  */
1714
1715 static struct nft_rule *__nf_tables_rule_lookup(const struct nft_chain *chain,
1716                                                 u64 handle)
1717 {
1718         struct nft_rule *rule;
1719
1720         // FIXME: this sucks
1721         list_for_each_entry(rule, &chain->rules, list) {
1722                 if (handle == rule->handle)
1723                         return rule;
1724         }
1725
1726         return ERR_PTR(-ENOENT);
1727 }
1728
1729 static struct nft_rule *nf_tables_rule_lookup(const struct nft_chain *chain,
1730                                               const struct nlattr *nla)
1731 {
1732         if (nla == NULL)
1733                 return ERR_PTR(-EINVAL);
1734
1735         return __nf_tables_rule_lookup(chain, be64_to_cpu(nla_get_be64(nla)));
1736 }
1737
1738 static const struct nla_policy nft_rule_policy[NFTA_RULE_MAX + 1] = {
1739         [NFTA_RULE_TABLE]       = { .type = NLA_STRING },
1740         [NFTA_RULE_CHAIN]       = { .type = NLA_STRING,
1741                                     .len = NFT_CHAIN_MAXNAMELEN - 1 },
1742         [NFTA_RULE_HANDLE]      = { .type = NLA_U64 },
1743         [NFTA_RULE_EXPRESSIONS] = { .type = NLA_NESTED },
1744         [NFTA_RULE_COMPAT]      = { .type = NLA_NESTED },
1745         [NFTA_RULE_POSITION]    = { .type = NLA_U64 },
1746         [NFTA_RULE_USERDATA]    = { .type = NLA_BINARY,
1747                                     .len = NFT_USERDATA_MAXLEN },
1748 };
1749
1750 static int nf_tables_fill_rule_info(struct sk_buff *skb, struct net *net,
1751                                     u32 portid, u32 seq, int event,
1752                                     u32 flags, int family,
1753                                     const struct nft_table *table,
1754                                     const struct nft_chain *chain,
1755                                     const struct nft_rule *rule)
1756 {
1757         struct nlmsghdr *nlh;
1758         struct nfgenmsg *nfmsg;
1759         const struct nft_expr *expr, *next;
1760         struct nlattr *list;
1761         const struct nft_rule *prule;
1762         int type = event | NFNL_SUBSYS_NFTABLES << 8;
1763
1764         nlh = nlmsg_put(skb, portid, seq, type, sizeof(struct nfgenmsg),
1765                         flags);
1766         if (nlh == NULL)
1767                 goto nla_put_failure;
1768
1769         nfmsg = nlmsg_data(nlh);
1770         nfmsg->nfgen_family     = family;
1771         nfmsg->version          = NFNETLINK_V0;
1772         nfmsg->res_id           = htons(net->nft.base_seq & 0xffff);
1773
1774         if (nla_put_string(skb, NFTA_RULE_TABLE, table->name))
1775                 goto nla_put_failure;
1776         if (nla_put_string(skb, NFTA_RULE_CHAIN, chain->name))
1777                 goto nla_put_failure;
1778         if (nla_put_be64(skb, NFTA_RULE_HANDLE, cpu_to_be64(rule->handle)))
1779                 goto nla_put_failure;
1780
1781         if ((event != NFT_MSG_DELRULE) && (rule->list.prev != &chain->rules)) {
1782                 prule = list_entry(rule->list.prev, struct nft_rule, list);
1783                 if (nla_put_be64(skb, NFTA_RULE_POSITION,
1784                                  cpu_to_be64(prule->handle)))
1785                         goto nla_put_failure;
1786         }
1787
1788         list = nla_nest_start(skb, NFTA_RULE_EXPRESSIONS);
1789         if (list == NULL)
1790                 goto nla_put_failure;
1791         nft_rule_for_each_expr(expr, next, rule) {
1792                 if (nft_expr_dump(skb, NFTA_LIST_ELEM, expr) < 0)
1793                         goto nla_put_failure;
1794         }
1795         nla_nest_end(skb, list);
1796
1797         if (rule->udata) {
1798                 struct nft_userdata *udata = nft_userdata(rule);
1799                 if (nla_put(skb, NFTA_RULE_USERDATA, udata->len + 1,
1800                             udata->data) < 0)
1801                         goto nla_put_failure;
1802         }
1803
1804         nlmsg_end(skb, nlh);
1805         return 0;
1806
1807 nla_put_failure:
1808         nlmsg_trim(skb, nlh);
1809         return -1;
1810 }
1811
1812 static int nf_tables_rule_notify(const struct nft_ctx *ctx,
1813                                  const struct nft_rule *rule,
1814                                  int event)
1815 {
1816         struct sk_buff *skb;
1817         int err;
1818
1819         if (!ctx->report &&
1820             !nfnetlink_has_listeners(ctx->net, NFNLGRP_NFTABLES))
1821                 return 0;
1822
1823         err = -ENOBUFS;
1824         skb = nlmsg_new(NLMSG_GOODSIZE, GFP_KERNEL);
1825         if (skb == NULL)
1826                 goto err;
1827
1828         err = nf_tables_fill_rule_info(skb, ctx->net, ctx->portid, ctx->seq,
1829                                        event, 0, ctx->afi->family, ctx->table,
1830                                        ctx->chain, rule);
1831         if (err < 0) {
1832                 kfree_skb(skb);
1833                 goto err;
1834         }
1835
1836         err = nfnetlink_send(skb, ctx->net, ctx->portid, NFNLGRP_NFTABLES,
1837                              ctx->report, GFP_KERNEL);
1838 err:
1839         if (err < 0) {
1840                 nfnetlink_set_err(ctx->net, ctx->portid, NFNLGRP_NFTABLES,
1841                                   err);
1842         }
1843         return err;
1844 }
1845
1846 static int nf_tables_dump_rules(struct sk_buff *skb,
1847                                 struct netlink_callback *cb)
1848 {
1849         const struct nfgenmsg *nfmsg = nlmsg_data(cb->nlh);
1850         const struct nft_af_info *afi;
1851         const struct nft_table *table;
1852         const struct nft_chain *chain;
1853         const struct nft_rule *rule;
1854         unsigned int idx = 0, s_idx = cb->args[0];
1855         struct net *net = sock_net(skb->sk);
1856         int family = nfmsg->nfgen_family;
1857
1858         rcu_read_lock();
1859         cb->seq = net->nft.base_seq;
1860
1861         list_for_each_entry_rcu(afi, &net->nft.af_info, list) {
1862                 if (family != NFPROTO_UNSPEC && family != afi->family)
1863                         continue;
1864
1865                 list_for_each_entry_rcu(table, &afi->tables, list) {
1866                         list_for_each_entry_rcu(chain, &table->chains, list) {
1867                                 list_for_each_entry_rcu(rule, &chain->rules, list) {
1868                                         if (!nft_rule_is_active(net, rule))
1869                                                 goto cont;
1870                                         if (idx < s_idx)
1871                                                 goto cont;
1872                                         if (idx > s_idx)
1873                                                 memset(&cb->args[1], 0,
1874                                                        sizeof(cb->args) - sizeof(cb->args[0]));
1875                                         if (nf_tables_fill_rule_info(skb, net, NETLINK_CB(cb->skb).portid,
1876                                                                       cb->nlh->nlmsg_seq,
1877                                                                       NFT_MSG_NEWRULE,
1878                                                                       NLM_F_MULTI | NLM_F_APPEND,
1879                                                                       afi->family, table, chain, rule) < 0)
1880                                                 goto done;
1881
1882                                         nl_dump_check_consistent(cb, nlmsg_hdr(skb));
1883 cont:
1884                                         idx++;
1885                                 }
1886                         }
1887                 }
1888         }
1889 done:
1890         rcu_read_unlock();
1891
1892         cb->args[0] = idx;
1893         return skb->len;
1894 }
1895
1896 static int nf_tables_getrule(struct sock *nlsk, struct sk_buff *skb,
1897                              const struct nlmsghdr *nlh,
1898                              const struct nlattr * const nla[])
1899 {
1900         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
1901         const struct nft_af_info *afi;
1902         const struct nft_table *table;
1903         const struct nft_chain *chain;
1904         const struct nft_rule *rule;
1905         struct sk_buff *skb2;
1906         struct net *net = sock_net(skb->sk);
1907         int family = nfmsg->nfgen_family;
1908         int err;
1909
1910         if (nlh->nlmsg_flags & NLM_F_DUMP) {
1911                 struct netlink_dump_control c = {
1912                         .dump = nf_tables_dump_rules,
1913                 };
1914                 return netlink_dump_start(nlsk, skb, nlh, &c);
1915         }
1916
1917         afi = nf_tables_afinfo_lookup(net, family, false);
1918         if (IS_ERR(afi))
1919                 return PTR_ERR(afi);
1920
1921         table = nf_tables_table_lookup(afi, nla[NFTA_RULE_TABLE]);
1922         if (IS_ERR(table))
1923                 return PTR_ERR(table);
1924         if (table->flags & NFT_TABLE_INACTIVE)
1925                 return -ENOENT;
1926
1927         chain = nf_tables_chain_lookup(table, nla[NFTA_RULE_CHAIN]);
1928         if (IS_ERR(chain))
1929                 return PTR_ERR(chain);
1930         if (chain->flags & NFT_CHAIN_INACTIVE)
1931                 return -ENOENT;
1932
1933         rule = nf_tables_rule_lookup(chain, nla[NFTA_RULE_HANDLE]);
1934         if (IS_ERR(rule))
1935                 return PTR_ERR(rule);
1936
1937         skb2 = alloc_skb(NLMSG_GOODSIZE, GFP_KERNEL);
1938         if (!skb2)
1939                 return -ENOMEM;
1940
1941         err = nf_tables_fill_rule_info(skb2, net, NETLINK_CB(skb).portid,
1942                                        nlh->nlmsg_seq, NFT_MSG_NEWRULE, 0,
1943                                        family, table, chain, rule);
1944         if (err < 0)
1945                 goto err;
1946
1947         return nlmsg_unicast(nlsk, skb2, NETLINK_CB(skb).portid);
1948
1949 err:
1950         kfree_skb(skb2);
1951         return err;
1952 }
1953
1954 static void nf_tables_rule_destroy(const struct nft_ctx *ctx,
1955                                    struct nft_rule *rule)
1956 {
1957         struct nft_expr *expr;
1958
1959         /*
1960          * Careful: some expressions might not be initialized in case this
1961          * is called on error from nf_tables_newrule().
1962          */
1963         expr = nft_expr_first(rule);
1964         while (expr->ops && expr != nft_expr_last(rule)) {
1965                 nf_tables_expr_destroy(ctx, expr);
1966                 expr = nft_expr_next(expr);
1967         }
1968         kfree(rule);
1969 }
1970
1971 #define NFT_RULE_MAXEXPRS       128
1972
1973 static struct nft_expr_info *info;
1974
1975 static int nf_tables_newrule(struct sock *nlsk, struct sk_buff *skb,
1976                              const struct nlmsghdr *nlh,
1977                              const struct nlattr * const nla[])
1978 {
1979         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
1980         struct nft_af_info *afi;
1981         struct net *net = sock_net(skb->sk);
1982         struct nft_table *table;
1983         struct nft_chain *chain;
1984         struct nft_rule *rule, *old_rule = NULL;
1985         struct nft_userdata *udata;
1986         struct nft_trans *trans = NULL;
1987         struct nft_expr *expr;
1988         struct nft_ctx ctx;
1989         struct nlattr *tmp;
1990         unsigned int size, i, n, ulen = 0, usize = 0;
1991         int err, rem;
1992         bool create;
1993         u64 handle, pos_handle;
1994
1995         create = nlh->nlmsg_flags & NLM_F_CREATE ? true : false;
1996
1997         afi = nf_tables_afinfo_lookup(net, nfmsg->nfgen_family, create);
1998         if (IS_ERR(afi))
1999                 return PTR_ERR(afi);
2000
2001         table = nf_tables_table_lookup(afi, nla[NFTA_RULE_TABLE]);
2002         if (IS_ERR(table))
2003                 return PTR_ERR(table);
2004
2005         chain = nf_tables_chain_lookup(table, nla[NFTA_RULE_CHAIN]);
2006         if (IS_ERR(chain))
2007                 return PTR_ERR(chain);
2008
2009         if (nla[NFTA_RULE_HANDLE]) {
2010                 handle = be64_to_cpu(nla_get_be64(nla[NFTA_RULE_HANDLE]));
2011                 rule = __nf_tables_rule_lookup(chain, handle);
2012                 if (IS_ERR(rule))
2013                         return PTR_ERR(rule);
2014
2015                 if (nlh->nlmsg_flags & NLM_F_EXCL)
2016                         return -EEXIST;
2017                 if (nlh->nlmsg_flags & NLM_F_REPLACE)
2018                         old_rule = rule;
2019                 else
2020                         return -EOPNOTSUPP;
2021         } else {
2022                 if (!create || nlh->nlmsg_flags & NLM_F_REPLACE)
2023                         return -EINVAL;
2024                 handle = nf_tables_alloc_handle(table);
2025
2026                 if (chain->use == UINT_MAX)
2027                         return -EOVERFLOW;
2028         }
2029
2030         if (nla[NFTA_RULE_POSITION]) {
2031                 if (!(nlh->nlmsg_flags & NLM_F_CREATE))
2032                         return -EOPNOTSUPP;
2033
2034                 pos_handle = be64_to_cpu(nla_get_be64(nla[NFTA_RULE_POSITION]));
2035                 old_rule = __nf_tables_rule_lookup(chain, pos_handle);
2036                 if (IS_ERR(old_rule))
2037                         return PTR_ERR(old_rule);
2038         }
2039
2040         nft_ctx_init(&ctx, skb, nlh, afi, table, chain, nla);
2041
2042         n = 0;
2043         size = 0;
2044         if (nla[NFTA_RULE_EXPRESSIONS]) {
2045                 nla_for_each_nested(tmp, nla[NFTA_RULE_EXPRESSIONS], rem) {
2046                         err = -EINVAL;
2047                         if (nla_type(tmp) != NFTA_LIST_ELEM)
2048                                 goto err1;
2049                         if (n == NFT_RULE_MAXEXPRS)
2050                                 goto err1;
2051                         err = nf_tables_expr_parse(&ctx, tmp, &info[n]);
2052                         if (err < 0)
2053                                 goto err1;
2054                         size += info[n].ops->size;
2055                         n++;
2056                 }
2057         }
2058         /* Check for overflow of dlen field */
2059         err = -EFBIG;
2060         if (size >= 1 << 12)
2061                 goto err1;
2062
2063         if (nla[NFTA_RULE_USERDATA]) {
2064                 ulen = nla_len(nla[NFTA_RULE_USERDATA]);
2065                 if (ulen > 0)
2066                         usize = sizeof(struct nft_userdata) + ulen;
2067         }
2068
2069         err = -ENOMEM;
2070         rule = kzalloc(sizeof(*rule) + size + usize, GFP_KERNEL);
2071         if (rule == NULL)
2072                 goto err1;
2073
2074         nft_rule_activate_next(net, rule);
2075
2076         rule->handle = handle;
2077         rule->dlen   = size;
2078         rule->udata  = ulen ? 1 : 0;
2079
2080         if (ulen) {
2081                 udata = nft_userdata(rule);
2082                 udata->len = ulen - 1;
2083                 nla_memcpy(udata->data, nla[NFTA_RULE_USERDATA], ulen);
2084         }
2085
2086         expr = nft_expr_first(rule);
2087         for (i = 0; i < n; i++) {
2088                 err = nf_tables_newexpr(&ctx, &info[i], expr);
2089                 if (err < 0)
2090                         goto err2;
2091                 info[i].ops = NULL;
2092                 expr = nft_expr_next(expr);
2093         }
2094
2095         if (nlh->nlmsg_flags & NLM_F_REPLACE) {
2096                 if (nft_rule_is_active_next(net, old_rule)) {
2097                         trans = nft_trans_rule_add(&ctx, NFT_MSG_DELRULE,
2098                                                    old_rule);
2099                         if (trans == NULL) {
2100                                 err = -ENOMEM;
2101                                 goto err2;
2102                         }
2103                         nft_rule_deactivate_next(net, old_rule);
2104                         chain->use--;
2105                         list_add_tail_rcu(&rule->list, &old_rule->list);
2106                 } else {
2107                         err = -ENOENT;
2108                         goto err2;
2109                 }
2110         } else if (nlh->nlmsg_flags & NLM_F_APPEND)
2111                 if (old_rule)
2112                         list_add_rcu(&rule->list, &old_rule->list);
2113                 else
2114                         list_add_tail_rcu(&rule->list, &chain->rules);
2115         else {
2116                 if (old_rule)
2117                         list_add_tail_rcu(&rule->list, &old_rule->list);
2118                 else
2119                         list_add_rcu(&rule->list, &chain->rules);
2120         }
2121
2122         if (nft_trans_rule_add(&ctx, NFT_MSG_NEWRULE, rule) == NULL) {
2123                 err = -ENOMEM;
2124                 goto err3;
2125         }
2126         chain->use++;
2127         return 0;
2128
2129 err3:
2130         list_del_rcu(&rule->list);
2131 err2:
2132         nf_tables_rule_destroy(&ctx, rule);
2133 err1:
2134         for (i = 0; i < n; i++) {
2135                 if (info[i].ops != NULL)
2136                         module_put(info[i].ops->type->owner);
2137         }
2138         return err;
2139 }
2140
2141 static int nf_tables_delrule(struct sock *nlsk, struct sk_buff *skb,
2142                              const struct nlmsghdr *nlh,
2143                              const struct nlattr * const nla[])
2144 {
2145         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
2146         struct nft_af_info *afi;
2147         struct net *net = sock_net(skb->sk);
2148         struct nft_table *table;
2149         struct nft_chain *chain = NULL;
2150         struct nft_rule *rule;
2151         int family = nfmsg->nfgen_family, err = 0;
2152         struct nft_ctx ctx;
2153
2154         afi = nf_tables_afinfo_lookup(net, family, false);
2155         if (IS_ERR(afi))
2156                 return PTR_ERR(afi);
2157
2158         table = nf_tables_table_lookup(afi, nla[NFTA_RULE_TABLE]);
2159         if (IS_ERR(table))
2160                 return PTR_ERR(table);
2161         if (table->flags & NFT_TABLE_INACTIVE)
2162                 return -ENOENT;
2163
2164         if (nla[NFTA_RULE_CHAIN]) {
2165                 chain = nf_tables_chain_lookup(table, nla[NFTA_RULE_CHAIN]);
2166                 if (IS_ERR(chain))
2167                         return PTR_ERR(chain);
2168         }
2169
2170         nft_ctx_init(&ctx, skb, nlh, afi, table, chain, nla);
2171
2172         if (chain) {
2173                 if (nla[NFTA_RULE_HANDLE]) {
2174                         rule = nf_tables_rule_lookup(chain,
2175                                                      nla[NFTA_RULE_HANDLE]);
2176                         if (IS_ERR(rule))
2177                                 return PTR_ERR(rule);
2178
2179                         err = nft_delrule(&ctx, rule);
2180                 } else {
2181                         err = nft_delrule_by_chain(&ctx);
2182                 }
2183         } else {
2184                 list_for_each_entry(chain, &table->chains, list) {
2185                         ctx.chain = chain;
2186                         err = nft_delrule_by_chain(&ctx);
2187                         if (err < 0)
2188                                 break;
2189                 }
2190         }
2191
2192         return err;
2193 }
2194
2195 /*
2196  * Sets
2197  */
2198
2199 static LIST_HEAD(nf_tables_set_ops);
2200
2201 int nft_register_set(struct nft_set_ops *ops)
2202 {
2203         nfnl_lock(NFNL_SUBSYS_NFTABLES);
2204         list_add_tail_rcu(&ops->list, &nf_tables_set_ops);
2205         nfnl_unlock(NFNL_SUBSYS_NFTABLES);
2206         return 0;
2207 }
2208 EXPORT_SYMBOL_GPL(nft_register_set);
2209
2210 void nft_unregister_set(struct nft_set_ops *ops)
2211 {
2212         nfnl_lock(NFNL_SUBSYS_NFTABLES);
2213         list_del_rcu(&ops->list);
2214         nfnl_unlock(NFNL_SUBSYS_NFTABLES);
2215 }
2216 EXPORT_SYMBOL_GPL(nft_unregister_set);
2217
2218 /*
2219  * Select a set implementation based on the data characteristics and the
2220  * given policy. The total memory use might not be known if no size is
2221  * given, in that case the amount of memory per element is used.
2222  */
2223 static const struct nft_set_ops *
2224 nft_select_set_ops(const struct nlattr * const nla[],
2225                    const struct nft_set_desc *desc,
2226                    enum nft_set_policies policy)
2227 {
2228         const struct nft_set_ops *ops, *bops;
2229         struct nft_set_estimate est, best;
2230         u32 features;
2231
2232 #ifdef CONFIG_MODULES
2233         if (list_empty(&nf_tables_set_ops)) {
2234                 nfnl_unlock(NFNL_SUBSYS_NFTABLES);
2235                 request_module("nft-set");
2236                 nfnl_lock(NFNL_SUBSYS_NFTABLES);
2237                 if (!list_empty(&nf_tables_set_ops))
2238                         return ERR_PTR(-EAGAIN);
2239         }
2240 #endif
2241         features = 0;
2242         if (nla[NFTA_SET_FLAGS] != NULL) {
2243                 features = ntohl(nla_get_be32(nla[NFTA_SET_FLAGS]));
2244                 features &= NFT_SET_INTERVAL | NFT_SET_MAP | NFT_SET_TIMEOUT;
2245         }
2246
2247         bops       = NULL;
2248         best.size  = ~0;
2249         best.class = ~0;
2250
2251         list_for_each_entry(ops, &nf_tables_set_ops, list) {
2252                 if ((ops->features & features) != features)
2253                         continue;
2254                 if (!ops->estimate(desc, features, &est))
2255                         continue;
2256
2257                 switch (policy) {
2258                 case NFT_SET_POL_PERFORMANCE:
2259                         if (est.class < best.class)
2260                                 break;
2261                         if (est.class == best.class && est.size < best.size)
2262                                 break;
2263                         continue;
2264                 case NFT_SET_POL_MEMORY:
2265                         if (est.size < best.size)
2266                                 break;
2267                         if (est.size == best.size && est.class < best.class)
2268                                 break;
2269                         continue;
2270                 default:
2271                         break;
2272                 }
2273
2274                 if (!try_module_get(ops->owner))
2275                         continue;
2276                 if (bops != NULL)
2277                         module_put(bops->owner);
2278
2279                 bops = ops;
2280                 best = est;
2281         }
2282
2283         if (bops != NULL)
2284                 return bops;
2285
2286         return ERR_PTR(-EOPNOTSUPP);
2287 }
2288
2289 static const struct nla_policy nft_set_policy[NFTA_SET_MAX + 1] = {
2290         [NFTA_SET_TABLE]                = { .type = NLA_STRING },
2291         [NFTA_SET_NAME]                 = { .type = NLA_STRING,
2292                                             .len = IFNAMSIZ - 1 },
2293         [NFTA_SET_FLAGS]                = { .type = NLA_U32 },
2294         [NFTA_SET_KEY_TYPE]             = { .type = NLA_U32 },
2295         [NFTA_SET_KEY_LEN]              = { .type = NLA_U32 },
2296         [NFTA_SET_DATA_TYPE]            = { .type = NLA_U32 },
2297         [NFTA_SET_DATA_LEN]             = { .type = NLA_U32 },
2298         [NFTA_SET_POLICY]               = { .type = NLA_U32 },
2299         [NFTA_SET_DESC]                 = { .type = NLA_NESTED },
2300         [NFTA_SET_ID]                   = { .type = NLA_U32 },
2301         [NFTA_SET_TIMEOUT]              = { .type = NLA_U64 },
2302         [NFTA_SET_GC_INTERVAL]          = { .type = NLA_U32 },
2303 };
2304
2305 static const struct nla_policy nft_set_desc_policy[NFTA_SET_DESC_MAX + 1] = {
2306         [NFTA_SET_DESC_SIZE]            = { .type = NLA_U32 },
2307 };
2308
2309 static int nft_ctx_init_from_setattr(struct nft_ctx *ctx,
2310                                      const struct sk_buff *skb,
2311                                      const struct nlmsghdr *nlh,
2312                                      const struct nlattr * const nla[])
2313 {
2314         struct net *net = sock_net(skb->sk);
2315         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
2316         struct nft_af_info *afi = NULL;
2317         struct nft_table *table = NULL;
2318
2319         if (nfmsg->nfgen_family != NFPROTO_UNSPEC) {
2320                 afi = nf_tables_afinfo_lookup(net, nfmsg->nfgen_family, false);
2321                 if (IS_ERR(afi))
2322                         return PTR_ERR(afi);
2323         }
2324
2325         if (nla[NFTA_SET_TABLE] != NULL) {
2326                 if (afi == NULL)
2327                         return -EAFNOSUPPORT;
2328
2329                 table = nf_tables_table_lookup(afi, nla[NFTA_SET_TABLE]);
2330                 if (IS_ERR(table))
2331                         return PTR_ERR(table);
2332                 if (table->flags & NFT_TABLE_INACTIVE)
2333                         return -ENOENT;
2334         }
2335
2336         nft_ctx_init(ctx, skb, nlh, afi, table, NULL, nla);
2337         return 0;
2338 }
2339
2340 struct nft_set *nf_tables_set_lookup(const struct nft_table *table,
2341                                      const struct nlattr *nla)
2342 {
2343         struct nft_set *set;
2344
2345         if (nla == NULL)
2346                 return ERR_PTR(-EINVAL);
2347
2348         list_for_each_entry(set, &table->sets, list) {
2349                 if (!nla_strcmp(nla, set->name))
2350                         return set;
2351         }
2352         return ERR_PTR(-ENOENT);
2353 }
2354
2355 struct nft_set *nf_tables_set_lookup_byid(const struct net *net,
2356                                           const struct nlattr *nla)
2357 {
2358         struct nft_trans *trans;
2359         u32 id = ntohl(nla_get_be32(nla));
2360
2361         list_for_each_entry(trans, &net->nft.commit_list, list) {
2362                 if (trans->msg_type == NFT_MSG_NEWSET &&
2363                     id == nft_trans_set_id(trans))
2364                         return nft_trans_set(trans);
2365         }
2366         return ERR_PTR(-ENOENT);
2367 }
2368
2369 static int nf_tables_set_alloc_name(struct nft_ctx *ctx, struct nft_set *set,
2370                                     const char *name)
2371 {
2372         const struct nft_set *i;
2373         const char *p;
2374         unsigned long *inuse;
2375         unsigned int n = 0, min = 0;
2376
2377         p = strnchr(name, IFNAMSIZ, '%');
2378         if (p != NULL) {
2379                 if (p[1] != 'd' || strchr(p + 2, '%'))
2380                         return -EINVAL;
2381
2382                 inuse = (unsigned long *)get_zeroed_page(GFP_KERNEL);
2383                 if (inuse == NULL)
2384                         return -ENOMEM;
2385 cont:
2386                 list_for_each_entry(i, &ctx->table->sets, list) {
2387                         int tmp;
2388
2389                         if (!sscanf(i->name, name, &tmp))
2390                                 continue;
2391                         if (tmp < min || tmp >= min + BITS_PER_BYTE * PAGE_SIZE)
2392                                 continue;
2393
2394                         set_bit(tmp - min, inuse);
2395                 }
2396
2397                 n = find_first_zero_bit(inuse, BITS_PER_BYTE * PAGE_SIZE);
2398                 if (n >= BITS_PER_BYTE * PAGE_SIZE) {
2399                         min += BITS_PER_BYTE * PAGE_SIZE;
2400                         memset(inuse, 0, PAGE_SIZE);
2401                         goto cont;
2402                 }
2403                 free_page((unsigned long)inuse);
2404         }
2405
2406         snprintf(set->name, sizeof(set->name), name, min + n);
2407         list_for_each_entry(i, &ctx->table->sets, list) {
2408                 if (!strcmp(set->name, i->name))
2409                         return -ENFILE;
2410         }
2411         return 0;
2412 }
2413
2414 static int nf_tables_fill_set(struct sk_buff *skb, const struct nft_ctx *ctx,
2415                               const struct nft_set *set, u16 event, u16 flags)
2416 {
2417         struct nfgenmsg *nfmsg;
2418         struct nlmsghdr *nlh;
2419         struct nlattr *desc;
2420         u32 portid = ctx->portid;
2421         u32 seq = ctx->seq;
2422
2423         event |= NFNL_SUBSYS_NFTABLES << 8;
2424         nlh = nlmsg_put(skb, portid, seq, event, sizeof(struct nfgenmsg),
2425                         flags);
2426         if (nlh == NULL)
2427                 goto nla_put_failure;
2428
2429         nfmsg = nlmsg_data(nlh);
2430         nfmsg->nfgen_family     = ctx->afi->family;
2431         nfmsg->version          = NFNETLINK_V0;
2432         nfmsg->res_id           = htons(ctx->net->nft.base_seq & 0xffff);
2433
2434         if (nla_put_string(skb, NFTA_SET_TABLE, ctx->table->name))
2435                 goto nla_put_failure;
2436         if (nla_put_string(skb, NFTA_SET_NAME, set->name))
2437                 goto nla_put_failure;
2438         if (set->flags != 0)
2439                 if (nla_put_be32(skb, NFTA_SET_FLAGS, htonl(set->flags)))
2440                         goto nla_put_failure;
2441
2442         if (nla_put_be32(skb, NFTA_SET_KEY_TYPE, htonl(set->ktype)))
2443                 goto nla_put_failure;
2444         if (nla_put_be32(skb, NFTA_SET_KEY_LEN, htonl(set->klen)))
2445                 goto nla_put_failure;
2446         if (set->flags & NFT_SET_MAP) {
2447                 if (nla_put_be32(skb, NFTA_SET_DATA_TYPE, htonl(set->dtype)))
2448                         goto nla_put_failure;
2449                 if (nla_put_be32(skb, NFTA_SET_DATA_LEN, htonl(set->dlen)))
2450                         goto nla_put_failure;
2451         }
2452
2453         if (set->timeout &&
2454             nla_put_be64(skb, NFTA_SET_TIMEOUT, cpu_to_be64(set->timeout)))
2455                 goto nla_put_failure;
2456         if (set->gc_int &&
2457             nla_put_be32(skb, NFTA_SET_GC_INTERVAL, htonl(set->gc_int)))
2458                 goto nla_put_failure;
2459
2460         if (set->policy != NFT_SET_POL_PERFORMANCE) {
2461                 if (nla_put_be32(skb, NFTA_SET_POLICY, htonl(set->policy)))
2462                         goto nla_put_failure;
2463         }
2464
2465         desc = nla_nest_start(skb, NFTA_SET_DESC);
2466         if (desc == NULL)
2467                 goto nla_put_failure;
2468         if (set->size &&
2469             nla_put_be32(skb, NFTA_SET_DESC_SIZE, htonl(set->size)))
2470                 goto nla_put_failure;
2471         nla_nest_end(skb, desc);
2472
2473         nlmsg_end(skb, nlh);
2474         return 0;
2475
2476 nla_put_failure:
2477         nlmsg_trim(skb, nlh);
2478         return -1;
2479 }
2480
2481 static int nf_tables_set_notify(const struct nft_ctx *ctx,
2482                                 const struct nft_set *set,
2483                                 int event, gfp_t gfp_flags)
2484 {
2485         struct sk_buff *skb;
2486         u32 portid = ctx->portid;
2487         int err;
2488
2489         if (!ctx->report &&
2490             !nfnetlink_has_listeners(ctx->net, NFNLGRP_NFTABLES))
2491                 return 0;
2492
2493         err = -ENOBUFS;
2494         skb = nlmsg_new(NLMSG_GOODSIZE, gfp_flags);
2495         if (skb == NULL)
2496                 goto err;
2497
2498         err = nf_tables_fill_set(skb, ctx, set, event, 0);
2499         if (err < 0) {
2500                 kfree_skb(skb);
2501                 goto err;
2502         }
2503
2504         err = nfnetlink_send(skb, ctx->net, portid, NFNLGRP_NFTABLES,
2505                              ctx->report, gfp_flags);
2506 err:
2507         if (err < 0)
2508                 nfnetlink_set_err(ctx->net, portid, NFNLGRP_NFTABLES, err);
2509         return err;
2510 }
2511
2512 static int nf_tables_dump_sets(struct sk_buff *skb, struct netlink_callback *cb)
2513 {
2514         const struct nft_set *set;
2515         unsigned int idx, s_idx = cb->args[0];
2516         struct nft_af_info *afi;
2517         struct nft_table *table, *cur_table = (struct nft_table *)cb->args[2];
2518         struct net *net = sock_net(skb->sk);
2519         int cur_family = cb->args[3];
2520         struct nft_ctx *ctx = cb->data, ctx_set;
2521
2522         if (cb->args[1])
2523                 return skb->len;
2524
2525         rcu_read_lock();
2526         cb->seq = net->nft.base_seq;
2527
2528         list_for_each_entry_rcu(afi, &net->nft.af_info, list) {
2529                 if (ctx->afi && ctx->afi != afi)
2530                         continue;
2531
2532                 if (cur_family) {
2533                         if (afi->family != cur_family)
2534                                 continue;
2535
2536                         cur_family = 0;
2537                 }
2538                 list_for_each_entry_rcu(table, &afi->tables, list) {
2539                         if (ctx->table && ctx->table != table)
2540                                 continue;
2541
2542                         if (cur_table) {
2543                                 if (cur_table != table)
2544                                         continue;
2545
2546                                 cur_table = NULL;
2547                         }
2548                         idx = 0;
2549                         list_for_each_entry_rcu(set, &table->sets, list) {
2550                                 if (idx < s_idx)
2551                                         goto cont;
2552
2553                                 ctx_set = *ctx;
2554                                 ctx_set.table = table;
2555                                 ctx_set.afi = afi;
2556                                 if (nf_tables_fill_set(skb, &ctx_set, set,
2557                                                        NFT_MSG_NEWSET,
2558                                                        NLM_F_MULTI) < 0) {
2559                                         cb->args[0] = idx;
2560                                         cb->args[2] = (unsigned long) table;
2561                                         cb->args[3] = afi->family;
2562                                         goto done;
2563                                 }
2564                                 nl_dump_check_consistent(cb, nlmsg_hdr(skb));
2565 cont:
2566                                 idx++;
2567                         }
2568                         if (s_idx)
2569                                 s_idx = 0;
2570                 }
2571         }
2572         cb->args[1] = 1;
2573 done:
2574         rcu_read_unlock();
2575         return skb->len;
2576 }
2577
2578 static int nf_tables_dump_sets_done(struct netlink_callback *cb)
2579 {
2580         kfree(cb->data);
2581         return 0;
2582 }
2583
2584 static int nf_tables_getset(struct sock *nlsk, struct sk_buff *skb,
2585                             const struct nlmsghdr *nlh,
2586                             const struct nlattr * const nla[])
2587 {
2588         const struct nft_set *set;
2589         struct nft_ctx ctx;
2590         struct sk_buff *skb2;
2591         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
2592         int err;
2593
2594         /* Verify existence before starting dump */
2595         err = nft_ctx_init_from_setattr(&ctx, skb, nlh, nla);
2596         if (err < 0)
2597                 return err;
2598
2599         if (nlh->nlmsg_flags & NLM_F_DUMP) {
2600                 struct netlink_dump_control c = {
2601                         .dump = nf_tables_dump_sets,
2602                         .done = nf_tables_dump_sets_done,
2603                 };
2604                 struct nft_ctx *ctx_dump;
2605
2606                 ctx_dump = kmalloc(sizeof(*ctx_dump), GFP_KERNEL);
2607                 if (ctx_dump == NULL)
2608                         return -ENOMEM;
2609
2610                 *ctx_dump = ctx;
2611                 c.data = ctx_dump;
2612
2613                 return netlink_dump_start(nlsk, skb, nlh, &c);
2614         }
2615
2616         /* Only accept unspec with dump */
2617         if (nfmsg->nfgen_family == NFPROTO_UNSPEC)
2618                 return -EAFNOSUPPORT;
2619
2620         set = nf_tables_set_lookup(ctx.table, nla[NFTA_SET_NAME]);
2621         if (IS_ERR(set))
2622                 return PTR_ERR(set);
2623         if (set->flags & NFT_SET_INACTIVE)
2624                 return -ENOENT;
2625
2626         skb2 = alloc_skb(NLMSG_GOODSIZE, GFP_KERNEL);
2627         if (skb2 == NULL)
2628                 return -ENOMEM;
2629
2630         err = nf_tables_fill_set(skb2, &ctx, set, NFT_MSG_NEWSET, 0);
2631         if (err < 0)
2632                 goto err;
2633
2634         return nlmsg_unicast(nlsk, skb2, NETLINK_CB(skb).portid);
2635
2636 err:
2637         kfree_skb(skb2);
2638         return err;
2639 }
2640
2641 static int nf_tables_set_desc_parse(const struct nft_ctx *ctx,
2642                                     struct nft_set_desc *desc,
2643                                     const struct nlattr *nla)
2644 {
2645         struct nlattr *da[NFTA_SET_DESC_MAX + 1];
2646         int err;
2647
2648         err = nla_parse_nested(da, NFTA_SET_DESC_MAX, nla, nft_set_desc_policy);
2649         if (err < 0)
2650                 return err;
2651
2652         if (da[NFTA_SET_DESC_SIZE] != NULL)
2653                 desc->size = ntohl(nla_get_be32(da[NFTA_SET_DESC_SIZE]));
2654
2655         return 0;
2656 }
2657
2658 static int nf_tables_newset(struct sock *nlsk, struct sk_buff *skb,
2659                             const struct nlmsghdr *nlh,
2660                             const struct nlattr * const nla[])
2661 {
2662         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
2663         const struct nft_set_ops *ops;
2664         struct nft_af_info *afi;
2665         struct net *net = sock_net(skb->sk);
2666         struct nft_table *table;
2667         struct nft_set *set;
2668         struct nft_ctx ctx;
2669         char name[IFNAMSIZ];
2670         unsigned int size;
2671         bool create;
2672         u64 timeout;
2673         u32 ktype, dtype, flags, policy, gc_int;
2674         struct nft_set_desc desc;
2675         int err;
2676
2677         if (nla[NFTA_SET_TABLE] == NULL ||
2678             nla[NFTA_SET_NAME] == NULL ||
2679             nla[NFTA_SET_KEY_LEN] == NULL ||
2680             nla[NFTA_SET_ID] == NULL)
2681                 return -EINVAL;
2682
2683         memset(&desc, 0, sizeof(desc));
2684
2685         ktype = NFT_DATA_VALUE;
2686         if (nla[NFTA_SET_KEY_TYPE] != NULL) {
2687                 ktype = ntohl(nla_get_be32(nla[NFTA_SET_KEY_TYPE]));
2688                 if ((ktype & NFT_DATA_RESERVED_MASK) == NFT_DATA_RESERVED_MASK)
2689                         return -EINVAL;
2690         }
2691
2692         desc.klen = ntohl(nla_get_be32(nla[NFTA_SET_KEY_LEN]));
2693         if (desc.klen == 0 || desc.klen > NFT_DATA_VALUE_MAXLEN)
2694                 return -EINVAL;
2695
2696         flags = 0;
2697         if (nla[NFTA_SET_FLAGS] != NULL) {
2698                 flags = ntohl(nla_get_be32(nla[NFTA_SET_FLAGS]));
2699                 if (flags & ~(NFT_SET_ANONYMOUS | NFT_SET_CONSTANT |
2700                               NFT_SET_INTERVAL | NFT_SET_TIMEOUT |
2701                               NFT_SET_MAP | NFT_SET_EVAL))
2702                         return -EINVAL;
2703                 /* Only one of both operations is supported */
2704                 if ((flags & (NFT_SET_MAP | NFT_SET_EVAL)) ==
2705                              (NFT_SET_MAP | NFT_SET_EVAL))
2706                         return -EOPNOTSUPP;
2707         }
2708
2709         dtype = 0;
2710         if (nla[NFTA_SET_DATA_TYPE] != NULL) {
2711                 if (!(flags & NFT_SET_MAP))
2712                         return -EINVAL;
2713
2714                 dtype = ntohl(nla_get_be32(nla[NFTA_SET_DATA_TYPE]));
2715                 if ((dtype & NFT_DATA_RESERVED_MASK) == NFT_DATA_RESERVED_MASK &&
2716                     dtype != NFT_DATA_VERDICT)
2717                         return -EINVAL;
2718
2719                 if (dtype != NFT_DATA_VERDICT) {
2720                         if (nla[NFTA_SET_DATA_LEN] == NULL)
2721                                 return -EINVAL;
2722                         desc.dlen = ntohl(nla_get_be32(nla[NFTA_SET_DATA_LEN]));
2723                         if (desc.dlen == 0 || desc.dlen > NFT_DATA_VALUE_MAXLEN)
2724                                 return -EINVAL;
2725                 } else
2726                         desc.dlen = sizeof(struct nft_verdict);
2727         } else if (flags & NFT_SET_MAP)
2728                 return -EINVAL;
2729
2730         timeout = 0;
2731         if (nla[NFTA_SET_TIMEOUT] != NULL) {
2732                 if (!(flags & NFT_SET_TIMEOUT))
2733                         return -EINVAL;
2734                 timeout = be64_to_cpu(nla_get_be64(nla[NFTA_SET_TIMEOUT]));
2735         }
2736         gc_int = 0;
2737         if (nla[NFTA_SET_GC_INTERVAL] != NULL) {
2738                 if (!(flags & NFT_SET_TIMEOUT))
2739                         return -EINVAL;
2740                 gc_int = ntohl(nla_get_be32(nla[NFTA_SET_GC_INTERVAL]));
2741         }
2742
2743         policy = NFT_SET_POL_PERFORMANCE;
2744         if (nla[NFTA_SET_POLICY] != NULL)
2745                 policy = ntohl(nla_get_be32(nla[NFTA_SET_POLICY]));
2746
2747         if (nla[NFTA_SET_DESC] != NULL) {
2748                 err = nf_tables_set_desc_parse(&ctx, &desc, nla[NFTA_SET_DESC]);
2749                 if (err < 0)
2750                         return err;
2751         }
2752
2753         create = nlh->nlmsg_flags & NLM_F_CREATE ? true : false;
2754
2755         afi = nf_tables_afinfo_lookup(net, nfmsg->nfgen_family, create);
2756         if (IS_ERR(afi))
2757                 return PTR_ERR(afi);
2758
2759         table = nf_tables_table_lookup(afi, nla[NFTA_SET_TABLE]);
2760         if (IS_ERR(table))
2761                 return PTR_ERR(table);
2762
2763         nft_ctx_init(&ctx, skb, nlh, afi, table, NULL, nla);
2764
2765         set = nf_tables_set_lookup(table, nla[NFTA_SET_NAME]);
2766         if (IS_ERR(set)) {
2767                 if (PTR_ERR(set) != -ENOENT)
2768                         return PTR_ERR(set);
2769                 set = NULL;
2770         }
2771
2772         if (set != NULL) {
2773                 if (nlh->nlmsg_flags & NLM_F_EXCL)
2774                         return -EEXIST;
2775                 if (nlh->nlmsg_flags & NLM_F_REPLACE)
2776                         return -EOPNOTSUPP;
2777                 return 0;
2778         }
2779
2780         if (!(nlh->nlmsg_flags & NLM_F_CREATE))
2781                 return -ENOENT;
2782
2783         ops = nft_select_set_ops(nla, &desc, policy);
2784         if (IS_ERR(ops))
2785                 return PTR_ERR(ops);
2786
2787         size = 0;
2788         if (ops->privsize != NULL)
2789                 size = ops->privsize(nla);
2790
2791         err = -ENOMEM;
2792         set = kzalloc(sizeof(*set) + size, GFP_KERNEL);
2793         if (set == NULL)
2794                 goto err1;
2795
2796         nla_strlcpy(name, nla[NFTA_SET_NAME], sizeof(set->name));
2797         err = nf_tables_set_alloc_name(&ctx, set, name);
2798         if (err < 0)
2799                 goto err2;
2800
2801         INIT_LIST_HEAD(&set->bindings);
2802         write_pnet(&set->pnet, net);
2803         set->ops   = ops;
2804         set->ktype = ktype;
2805         set->klen  = desc.klen;
2806         set->dtype = dtype;
2807         set->dlen  = desc.dlen;
2808         set->flags = flags;
2809         set->size  = desc.size;
2810         set->policy = policy;
2811         set->timeout = timeout;
2812         set->gc_int = gc_int;
2813
2814         err = ops->init(set, &desc, nla);
2815         if (err < 0)
2816                 goto err2;
2817
2818         err = nft_trans_set_add(&ctx, NFT_MSG_NEWSET, set);
2819         if (err < 0)
2820                 goto err2;
2821
2822         list_add_tail_rcu(&set->list, &table->sets);
2823         table->use++;
2824         return 0;
2825
2826 err2:
2827         kfree(set);
2828 err1:
2829         module_put(ops->owner);
2830         return err;
2831 }
2832
2833 static void nft_set_destroy(struct nft_set *set)
2834 {
2835         set->ops->destroy(set);
2836         module_put(set->ops->owner);
2837         kfree(set);
2838 }
2839
2840 static void nf_tables_set_destroy(const struct nft_ctx *ctx, struct nft_set *set)
2841 {
2842         list_del_rcu(&set->list);
2843         nf_tables_set_notify(ctx, set, NFT_MSG_DELSET, GFP_ATOMIC);
2844         nft_set_destroy(set);
2845 }
2846
2847 static int nf_tables_delset(struct sock *nlsk, struct sk_buff *skb,
2848                             const struct nlmsghdr *nlh,
2849                             const struct nlattr * const nla[])
2850 {
2851         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
2852         struct nft_set *set;
2853         struct nft_ctx ctx;
2854         int err;
2855
2856         if (nfmsg->nfgen_family == NFPROTO_UNSPEC)
2857                 return -EAFNOSUPPORT;
2858         if (nla[NFTA_SET_TABLE] == NULL)
2859                 return -EINVAL;
2860
2861         err = nft_ctx_init_from_setattr(&ctx, skb, nlh, nla);
2862         if (err < 0)
2863                 return err;
2864
2865         set = nf_tables_set_lookup(ctx.table, nla[NFTA_SET_NAME]);
2866         if (IS_ERR(set))
2867                 return PTR_ERR(set);
2868         if (set->flags & NFT_SET_INACTIVE)
2869                 return -ENOENT;
2870         if (!list_empty(&set->bindings))
2871                 return -EBUSY;
2872
2873         return nft_delset(&ctx, set);
2874 }
2875
2876 static int nf_tables_bind_check_setelem(const struct nft_ctx *ctx,
2877                                         const struct nft_set *set,
2878                                         const struct nft_set_iter *iter,
2879                                         const struct nft_set_elem *elem)
2880 {
2881         const struct nft_set_ext *ext = nft_set_elem_ext(set, elem->priv);
2882         enum nft_registers dreg;
2883
2884         dreg = nft_type_to_reg(set->dtype);
2885         return nft_validate_register_store(ctx, dreg, nft_set_ext_data(ext),
2886                                            set->dtype == NFT_DATA_VERDICT ?
2887                                            NFT_DATA_VERDICT : NFT_DATA_VALUE,
2888                                            set->dlen);
2889 }
2890
2891 int nf_tables_bind_set(const struct nft_ctx *ctx, struct nft_set *set,
2892                        struct nft_set_binding *binding)
2893 {
2894         struct nft_set_binding *i;
2895         struct nft_set_iter iter;
2896
2897         if (!list_empty(&set->bindings) && set->flags & NFT_SET_ANONYMOUS)
2898                 return -EBUSY;
2899
2900         if (binding->flags & NFT_SET_MAP) {
2901                 /* If the set is already bound to the same chain all
2902                  * jumps are already validated for that chain.
2903                  */
2904                 list_for_each_entry(i, &set->bindings, list) {
2905                         if (binding->flags & NFT_SET_MAP &&
2906                             i->chain == binding->chain)
2907                                 goto bind;
2908                 }
2909
2910                 iter.skip       = 0;
2911                 iter.count      = 0;
2912                 iter.err        = 0;
2913                 iter.fn         = nf_tables_bind_check_setelem;
2914
2915                 set->ops->walk(ctx, set, &iter);
2916                 if (iter.err < 0) {
2917                         /* Destroy anonymous sets if binding fails */
2918                         if (set->flags & NFT_SET_ANONYMOUS)
2919                                 nf_tables_set_destroy(ctx, set);
2920
2921                         return iter.err;
2922                 }
2923         }
2924 bind:
2925         binding->chain = ctx->chain;
2926         list_add_tail_rcu(&binding->list, &set->bindings);
2927         return 0;
2928 }
2929
2930 void nf_tables_unbind_set(const struct nft_ctx *ctx, struct nft_set *set,
2931                           struct nft_set_binding *binding)
2932 {
2933         list_del_rcu(&binding->list);
2934
2935         if (list_empty(&set->bindings) && set->flags & NFT_SET_ANONYMOUS &&
2936             !(set->flags & NFT_SET_INACTIVE))
2937                 nf_tables_set_destroy(ctx, set);
2938 }
2939
2940 const struct nft_set_ext_type nft_set_ext_types[] = {
2941         [NFT_SET_EXT_KEY]               = {
2942                 .align  = __alignof__(u32),
2943         },
2944         [NFT_SET_EXT_DATA]              = {
2945                 .align  = __alignof__(u32),
2946         },
2947         [NFT_SET_EXT_EXPR]              = {
2948                 .align  = __alignof__(struct nft_expr),
2949         },
2950         [NFT_SET_EXT_FLAGS]             = {
2951                 .len    = sizeof(u8),
2952                 .align  = __alignof__(u8),
2953         },
2954         [NFT_SET_EXT_TIMEOUT]           = {
2955                 .len    = sizeof(u64),
2956                 .align  = __alignof__(u64),
2957         },
2958         [NFT_SET_EXT_EXPIRATION]        = {
2959                 .len    = sizeof(unsigned long),
2960                 .align  = __alignof__(unsigned long),
2961         },
2962         [NFT_SET_EXT_USERDATA]          = {
2963                 .len    = sizeof(struct nft_userdata),
2964                 .align  = __alignof__(struct nft_userdata),
2965         },
2966 };
2967 EXPORT_SYMBOL_GPL(nft_set_ext_types);
2968
2969 /*
2970  * Set elements
2971  */
2972
2973 static const struct nla_policy nft_set_elem_policy[NFTA_SET_ELEM_MAX + 1] = {
2974         [NFTA_SET_ELEM_KEY]             = { .type = NLA_NESTED },
2975         [NFTA_SET_ELEM_DATA]            = { .type = NLA_NESTED },
2976         [NFTA_SET_ELEM_FLAGS]           = { .type = NLA_U32 },
2977         [NFTA_SET_ELEM_TIMEOUT]         = { .type = NLA_U64 },
2978         [NFTA_SET_ELEM_USERDATA]        = { .type = NLA_BINARY,
2979                                             .len = NFT_USERDATA_MAXLEN },
2980 };
2981
2982 static const struct nla_policy nft_set_elem_list_policy[NFTA_SET_ELEM_LIST_MAX + 1] = {
2983         [NFTA_SET_ELEM_LIST_TABLE]      = { .type = NLA_STRING },
2984         [NFTA_SET_ELEM_LIST_SET]        = { .type = NLA_STRING },
2985         [NFTA_SET_ELEM_LIST_ELEMENTS]   = { .type = NLA_NESTED },
2986         [NFTA_SET_ELEM_LIST_SET_ID]     = { .type = NLA_U32 },
2987 };
2988
2989 static int nft_ctx_init_from_elemattr(struct nft_ctx *ctx,
2990                                       const struct sk_buff *skb,
2991                                       const struct nlmsghdr *nlh,
2992                                       const struct nlattr * const nla[],
2993                                       bool trans)
2994 {
2995         const struct nfgenmsg *nfmsg = nlmsg_data(nlh);
2996         struct nft_af_info *afi;
2997         struct nft_table *table;
2998         struct net *net = sock_net(skb->sk);
2999
3000         afi = nf_tables_afinfo_lookup(net, nfmsg->nfgen_family, false);
3001         if (IS_ERR(afi))
3002                 return PTR_ERR(afi);
3003
3004         table = nf_tables_table_lookup(afi, nla[NFTA_SET_ELEM_LIST_TABLE]);
3005         if (IS_ERR(table))
3006                 return PTR_ERR(table);
3007         if (!trans && (table->flags & NFT_TABLE_INACTIVE))
3008                 return -ENOENT;
3009
3010         nft_ctx_init(ctx, skb, nlh, afi, table, NULL, nla);
3011         return 0;
3012 }
3013
3014 static int nf_tables_fill_setelem(struct sk_buff *skb,
3015                                   const struct nft_set *set,
3016                                   const struct nft_set_elem *elem)
3017 {
3018         const struct nft_set_ext *ext = nft_set_elem_ext(set, elem->priv);
3019         unsigned char *b = skb_tail_pointer(skb);
3020         struct nlattr *nest;
3021
3022         nest = nla_nest_start(skb, NFTA_LIST_ELEM);
3023         if (nest == NULL)
3024                 goto nla_put_failure;
3025
3026         if (nft_data_dump(skb, NFTA_SET_ELEM_KEY, nft_set_ext_key(ext),
3027                           NFT_DATA_VALUE, set->klen) < 0)
3028                 goto nla_put_failure;
3029
3030         if (nft_set_ext_exists(ext, NFT_SET_EXT_DATA) &&
3031             nft_data_dump(skb, NFTA_SET_ELEM_DATA, nft_set_ext_data(ext),
3032                           set->dtype == NFT_DATA_VERDICT ? NFT_DATA_VERDICT : NFT_DATA_VALUE,
3033                           set->dlen) < 0)
3034                 goto nla_put_failure;
3035
3036         if (nft_set_ext_exists(ext, NFT_SET_EXT_EXPR) &&
3037             nft_expr_dump(skb, NFTA_SET_ELEM_EXPR, nft_set_ext_expr(ext)) < 0)
3038                 goto nla_put_failure;
3039
3040         if (nft_set_ext_exists(ext, NFT_SET_EXT_FLAGS) &&
3041             nla_put_be32(skb, NFTA_SET_ELEM_FLAGS,
3042                          htonl(*nft_set_ext_flags(ext))))
3043                 goto nla_put_failure;
3044
3045         if (nft_set_ext_exists(ext, NFT_SET_EXT_TIMEOUT) &&
3046             nla_put_be64(skb, NFTA_SET_ELEM_TIMEOUT,
3047                          cpu_to_be64(*nft_set_ext_timeout(ext))))
3048                 goto nla_put_failure;
3049
3050         if (nft_set_ext_exists(ext, NFT_SET_EXT_EXPIRATION)) {
3051                 unsigned long expires, now = jiffies;
3052
3053                 expires = *nft_set_ext_expiration(ext);
3054                 if (time_before(now, expires))
3055                         expires -= now;
3056                 else
3057                         expires = 0;
3058
3059                 if (nla_put_be64(skb, NFTA_SET_ELEM_EXPIRATION,
3060                                  cpu_to_be64(jiffies_to_msecs(expires))))
3061                         goto nla_put_failure;
3062         }
3063
3064         if (nft_set_ext_exists(ext, NFT_SET_EXT_USERDATA)) {
3065                 struct nft_userdata *udata;
3066
3067                 udata = nft_set_ext_userdata(ext);
3068                 if (nla_put(skb, NFTA_SET_ELEM_USERDATA,
3069                             udata->len + 1, udata->data))
3070                         goto nla_put_failure;
3071         }
3072
3073         nla_nest_end(skb, nest);
3074         return 0;
3075
3076 nla_put_failure:
3077         nlmsg_trim(skb, b);
3078         return -EMSGSIZE;
3079 }
3080
3081 struct nft_set_dump_args {
3082         const struct netlink_callback   *cb;
3083         struct nft_set_iter             iter;
3084         struct sk_buff                  *skb;
3085 };
3086
3087 static int nf_tables_dump_setelem(const struct nft_ctx *ctx,
3088                                   const struct nft_set *set,
3089                                   const struct nft_set_iter *iter,
3090                                   const struct nft_set_elem *elem)
3091 {
3092         struct nft_set_dump_args *args;
3093
3094         args = container_of(iter, struct nft_set_dump_args, iter);
3095         return nf_tables_fill_setelem(args->skb, set, elem);
3096 }
3097
3098 static int nf_tables_dump_set(struct sk_buff *skb, struct netlink_callback *cb)
3099 {
3100         const struct nft_set *set;
3101         struct nft_set_dump_args args;
3102         struct nft_ctx ctx;
3103         struct nlattr *nla[NFTA_SET_ELEM_LIST_MAX + 1];
3104         struct nfgenmsg *nfmsg;
3105         struct nlmsghdr *nlh;
3106         struct nlattr *nest;
3107         u32 portid, seq;
3108         int event, err;
3109
3110         err = nlmsg_parse(cb->nlh, sizeof(struct nfgenmsg), nla,
3111                           NFTA_SET_ELEM_LIST_MAX, nft_set_elem_list_policy);
3112         if (err < 0)
3113                 return err;
3114
3115         err = nft_ctx_init_from_elemattr(&ctx, cb->skb, cb->nlh, (void *)nla,
3116                                          false);
3117         if (err < 0)
3118                 return err;
3119
3120         set = nf_tables_set_lookup(ctx.table, nla[NFTA_SET_ELEM_LIST_SET]);
3121         if (IS_ERR(set))
3122                 return PTR_ERR(set);
3123         if (set->flags & NFT_SET_INACTIVE)
3124                 return -ENOENT;
3125
3126         event  = NFT_MSG_NEWSETELEM;
3127         event |= NFNL_SUBSYS_NFTABLES << 8;
3128         portid = NETLINK_CB(cb->skb).portid;
3129         seq    = cb->nlh->nlmsg_seq;
3130
3131         nlh = nlmsg_put(skb, portid, seq, event, sizeof(struct nfgenmsg),
3132                         NLM_F_MULTI);
3133         if (nlh == NULL)
3134                 goto nla_put_failure;
3135
3136         nfmsg = nlmsg_data(nlh);
3137         nfmsg->nfgen_family = ctx.afi->family;
3138         nfmsg->version      = NFNETLINK_V0;
3139         nfmsg->res_id       = htons(ctx.net->nft.base_seq & 0xffff);
3140
3141         if (nla_put_string(skb, NFTA_SET_ELEM_LIST_TABLE, ctx.table->name))
3142                 goto nla_put_failure;
3143         if (nla_put_string(skb, NFTA_SET_ELEM_LIST_SET, set->name))
3144                 goto nla_put_failure;
3145
3146         nest = nla_nest_start(skb, NFTA_SET_ELEM_LIST_ELEMENTS);
3147         if (nest == NULL)
3148                 goto nla_put_failure;
3149
3150         args.cb         = cb;
3151         args.skb        = skb;
3152         args.iter.skip  = cb->args[0];
3153         args.iter.count = 0;
3154         args.iter.err   = 0;
3155         args.iter.fn    = nf_tables_dump_setelem;
3156         set->ops->walk(&ctx, set, &args.iter);
3157
3158         nla_nest_end(skb, nest);
3159         nlmsg_end(skb, nlh);
3160
3161         if (args.iter.err && args.iter.err != -EMSGSIZE)
3162                 return args.iter.err;
3163         if (args.iter.count == cb->args[0])
3164                 return 0;
3165
3166         cb->args[0] = args.iter.count;
3167         return skb->len;
3168
3169 nla_put_failure:
3170         return -ENOSPC;
3171 }
3172
3173 static int nf_tables_getsetelem(struct sock *nlsk, struct sk_buff *skb,
3174                                 const struct nlmsghdr *nlh,
3175                                 const struct nlattr * const nla[])
3176 {
3177         const struct nft_set *set;
3178         struct nft_ctx ctx;
3179         int err;
3180
3181         err = nft_ctx_init_from_elemattr(&ctx, skb, nlh, nla, false);
3182         if (err < 0)
3183                 return err;
3184
3185         set = nf_tables_set_lookup(ctx.table, nla[NFTA_SET_ELEM_LIST_SET]);
3186         if (IS_ERR(set))
3187                 return PTR_ERR(set);
3188         if (set->flags & NFT_SET_INACTIVE)
3189                 return -ENOENT;
3190
3191         if (nlh->nlmsg_flags & NLM_F_DUMP) {
3192                 struct netlink_dump_control c = {
3193                         .dump = nf_tables_dump_set,
3194                 };
3195                 return netlink_dump_start(nlsk, skb, nlh, &c);
3196         }
3197         return -EOPNOTSUPP;
3198 }
3199
3200 static int nf_tables_fill_setelem_info(struct sk_buff *skb,
3201                                        const struct nft_ctx *ctx, u32 seq,
3202                                        u32 portid, int event, u16 flags,
3203                                        const struct nft_set *set,
3204                                        const struct nft_set_elem *elem)
3205 {
3206         struct nfgenmsg *nfmsg;
3207         struct nlmsghdr *nlh;
3208         struct nlattr *nest;
3209         int err;
3210
3211         event |= NFNL_SUBSYS_NFTABLES << 8;
3212         nlh = nlmsg_put(skb, portid, seq, event, sizeof(struct nfgenmsg),
3213                         flags);
3214         if (nlh == NULL)
3215                 goto nla_put_failure;
3216
3217         nfmsg = nlmsg_data(nlh);
3218         nfmsg->nfgen_family     = ctx->afi->family;
3219         nfmsg->version          = NFNETLINK_V0;
3220         nfmsg->res_id           = htons(ctx->net->nft.base_seq & 0xffff);
3221
3222         if (nla_put_string(skb, NFTA_SET_TABLE, ctx->table->name))
3223                 goto nla_put_failure;
3224         if (nla_put_string(skb, NFTA_SET_NAME, set->name))
3225                 goto nla_put_failure;
3226
3227         nest = nla_nest_start(skb, NFTA_SET_ELEM_LIST_ELEMENTS);
3228         if (nest == NULL)
3229                 goto nla_put_failure;
3230
3231         err = nf_tables_fill_setelem(skb, set, elem);
3232         if (err < 0)
3233                 goto nla_put_failure;
3234
3235         nla_nest_end(skb, nest);
3236
3237         nlmsg_end(skb, nlh);
3238         return 0;
3239
3240 nla_put_failure:
3241         nlmsg_trim(skb, nlh);
3242         return -1;
3243 }
3244
3245 static int nf_tables_setelem_notify(const struct nft_ctx *ctx,
3246                                     const struct nft_set *set,
3247                                     const struct nft_set_elem *elem,
3248                                     int event, u16 flags)
3249 {
3250         struct net *net = ctx->net;
3251         u32 portid = ctx->portid;
3252         struct sk_buff *skb;
3253         int err;
3254
3255         if (!ctx->report && !nfnetlink_has_listeners(net, NFNLGRP_NFTABLES))
3256                 return 0;
3257
3258         err = -ENOBUFS;
3259         skb = nlmsg_new(NLMSG_GOODSIZE, GFP_KERNEL);
3260         if (skb == NULL)
3261                 goto err;
3262
3263         err = nf_tables_fill_setelem_info(skb, ctx, 0, portid, event, flags,
3264                                           set, elem);
3265         if (err < 0) {
3266                 kfree_skb(skb);
3267                 goto err;
3268         }
3269
3270         err = nfnetlink_send(skb, net, portid, NFNLGRP_NFTABLES, ctx->report,
3271                              GFP_KERNEL);
3272 err:
3273         if (err < 0)
3274                 nfnetlink_set_err(net, portid, NFNLGRP_NFTABLES, err);
3275         return err;
3276 }
3277
3278 static struct nft_trans *nft_trans_elem_alloc(struct nft_ctx *ctx,
3279                                               int msg_type,
3280                                               struct nft_set *set)
3281 {
3282         struct nft_trans *trans;
3283
3284         trans = nft_trans_alloc(ctx, msg_type, sizeof(struct nft_trans_elem));
3285         if (trans == NULL)
3286                 return NULL;
3287
3288         nft_trans_elem_set(trans) = set;
3289         return trans;
3290 }
3291
3292 void *nft_set_elem_init(const struct nft_set *set,
3293                         const struct nft_set_ext_tmpl *tmpl,
3294                         const u32 *key, const u32 *data,
3295                         u64 timeout, gfp_t gfp)
3296 {
3297         struct nft_set_ext *ext;
3298         void *elem;
3299
3300         elem = kzalloc(set->ops->elemsize + tmpl->len, gfp);
3301         if (elem == NULL)
3302                 return NULL;
3303
3304         ext = nft_set_elem_ext(set, elem);
3305         nft_set_ext_init(ext, tmpl);
3306
3307         memcpy(nft_set_ext_key(ext), key, set->klen);
3308         if (nft_set_ext_exists(ext, NFT_SET_EXT_DATA))
3309                 memcpy(nft_set_ext_data(ext), data, set->dlen);
3310         if (nft_set_ext_exists(ext, NFT_SET_EXT_EXPIRATION))
3311                 *nft_set_ext_expiration(ext) =
3312                         jiffies + msecs_to_jiffies(timeout);
3313         if (nft_set_ext_exists(ext, NFT_SET_EXT_TIMEOUT))
3314                 *nft_set_ext_timeout(ext) = timeout;
3315
3316         return elem;
3317 }
3318
3319 void nft_set_elem_destroy(const struct nft_set *set, void *elem)
3320 {
3321         struct nft_set_ext *ext = nft_set_elem_ext(set, elem);
3322
3323         nft_data_uninit(nft_set_ext_key(ext), NFT_DATA_VALUE);
3324         if (nft_set_ext_exists(ext, NFT_SET_EXT_DATA))
3325                 nft_data_uninit(nft_set_ext_data(ext), set->dtype);
3326         if (nft_set_ext_exists(ext, NFT_SET_EXT_EXPR))
3327                 nf_tables_expr_destroy(NULL, nft_set_ext_expr(ext));
3328
3329         kfree(elem);
3330 }
3331 EXPORT_SYMBOL_GPL(nft_set_elem_destroy);
3332
3333 static int nft_add_set_elem(struct nft_ctx *ctx, struct nft_set *set,
3334                             const struct nlattr *attr)
3335 {
3336         struct nlattr *nla[NFTA_SET_ELEM_MAX + 1];
3337         struct nft_data_desc d1, d2;
3338         struct nft_set_ext_tmpl tmpl;
3339         struct nft_set_ext *ext;
3340         struct nft_set_elem elem;
3341         struct nft_set_binding *binding;
3342         struct nft_userdata *udata;
3343         struct nft_data data;
3344         enum nft_registers dreg;
3345         struct nft_trans *trans;
3346         u64 timeout;
3347         u32 flags;
3348         u8 ulen;
3349         int err;
3350
3351         err = nla_parse_nested(nla, NFTA_SET_ELEM_MAX, attr,
3352                                nft_set_elem_policy);
3353         if (err < 0)
3354                 return err;
3355
3356         if (nla[NFTA_SET_ELEM_KEY] == NULL)
3357                 return -EINVAL;
3358
3359         nft_set_ext_prepare(&tmpl);
3360
3361         flags = 0;
3362         if (nla[NFTA_SET_ELEM_FLAGS] != NULL) {
3363                 flags = ntohl(nla_get_be32(nla[NFTA_SET_ELEM_FLAGS]));
3364                 if (flags & ~NFT_SET_ELEM_INTERVAL_END)
3365                         return -EINVAL;
3366                 if (!(set->flags & NFT_SET_INTERVAL) &&
3367                     flags & NFT_SET_ELEM_INTERVAL_END)
3368                         return -EINVAL;
3369                 if (flags != 0)
3370                         nft_set_ext_add(&tmpl, NFT_SET_EXT_FLAGS);
3371         }
3372
3373         if (set->flags & NFT_SET_MAP) {
3374                 if (nla[NFTA_SET_ELEM_DATA] == NULL &&
3375                     !(flags & NFT_SET_ELEM_INTERVAL_END))
3376                         return -EINVAL;
3377                 if (nla[NFTA_SET_ELEM_DATA] != NULL &&
3378                     flags & NFT_SET_ELEM_INTERVAL_END)
3379                         return -EINVAL;
3380         } else {
3381                 if (nla[NFTA_SET_ELEM_DATA] != NULL)
3382                         return -EINVAL;
3383         }
3384
3385         timeout = 0;
3386         if (nla[NFTA_SET_ELEM_TIMEOUT] != NULL) {
3387                 if (!(set->flags & NFT_SET_TIMEOUT))
3388                         return -EINVAL;
3389                 timeout = be64_to_cpu(nla_get_be64(nla[NFTA_SET_ELEM_TIMEOUT]));
3390         } else if (set->flags & NFT_SET_TIMEOUT) {
3391                 timeout = set->timeout;
3392         }
3393
3394         err = nft_data_init(ctx, &elem.key.val, sizeof(elem.key), &d1,
3395                             nla[NFTA_SET_ELEM_KEY]);
3396         if (err < 0)
3397                 goto err1;
3398         err = -EINVAL;
3399         if (d1.type != NFT_DATA_VALUE || d1.len != set->klen)
3400                 goto err2;
3401
3402         nft_set_ext_add_length(&tmpl, NFT_SET_EXT_KEY, d1.len);
3403         if (timeout > 0) {
3404                 nft_set_ext_add(&tmpl, NFT_SET_EXT_EXPIRATION);
3405                 if (timeout != set->timeout)
3406                         nft_set_ext_add(&tmpl, NFT_SET_EXT_TIMEOUT);
3407         }
3408
3409         if (nla[NFTA_SET_ELEM_DATA] != NULL) {
3410                 err = nft_data_init(ctx, &data, sizeof(data), &d2,
3411                                     nla[NFTA_SET_ELEM_DATA]);
3412                 if (err < 0)
3413                         goto err2;
3414
3415                 err = -EINVAL;
3416                 if (set->dtype != NFT_DATA_VERDICT && d2.len != set->dlen)
3417                         goto err3;
3418
3419                 dreg = nft_type_to_reg(set->dtype);
3420                 list_for_each_entry(binding, &set->bindings, list) {
3421                         struct nft_ctx bind_ctx = {
3422                                 .afi    = ctx->afi,
3423                                 .table  = ctx->table,
3424                                 .chain  = (struct nft_chain *)binding->chain,
3425                         };
3426
3427                         if (!(binding->flags & NFT_SET_MAP))
3428                                 continue;
3429
3430                         err = nft_validate_register_store(&bind_ctx, dreg,
3431                                                           &data,
3432                                                           d2.type, d2.len);
3433                         if (err < 0)
3434                                 goto err3;
3435                 }
3436
3437                 nft_set_ext_add_length(&tmpl, NFT_SET_EXT_DATA, d2.len);
3438         }
3439
3440         /* The full maximum length of userdata can exceed the maximum
3441          * offset value (U8_MAX) for following extensions, therefor it
3442          * must be the last extension added.
3443          */
3444         ulen = 0;
3445         if (nla[NFTA_SET_ELEM_USERDATA] != NULL) {
3446                 ulen = nla_len(nla[NFTA_SET_ELEM_USERDATA]);
3447                 if (ulen > 0)
3448                         nft_set_ext_add_length(&tmpl, NFT_SET_EXT_USERDATA,
3449                                                ulen);
3450         }
3451
3452         err = -ENOMEM;
3453         elem.priv = nft_set_elem_init(set, &tmpl, elem.key.val.data, data.data,
3454                                       timeout, GFP_KERNEL);
3455         if (elem.priv == NULL)
3456                 goto err3;
3457
3458         ext = nft_set_elem_ext(set, elem.priv);
3459         if (flags)
3460                 *nft_set_ext_flags(ext) = flags;
3461         if (ulen > 0) {
3462                 udata = nft_set_ext_userdata(ext);
3463                 udata->len = ulen - 1;
3464                 nla_memcpy(&udata->data, nla[NFTA_SET_ELEM_USERDATA], ulen);
3465         }
3466
3467         trans = nft_trans_elem_alloc(ctx, NFT_MSG_NEWSETELEM, set);
3468         if (trans == NULL)
3469                 goto err4;
3470
3471         ext->genmask = nft_genmask_cur(ctx->net) | NFT_SET_ELEM_BUSY_MASK;
3472         err = set->ops->insert(set, &elem);
3473         if (err < 0)
3474                 goto err5;
3475
3476         nft_trans_elem(trans) = elem;
3477         list_add_tail(&trans->list, &ctx->net->nft.commit_list);
3478         return 0;
3479
3480 err5:
3481         kfree(trans);
3482 err4:
3483         kfree(elem.priv);
3484 err3:
3485         if (nla[NFTA_SET_ELEM_DATA] != NULL)
3486                 nft_data_uninit(&data, d2.type);
3487 err2:
3488         nft_data_uninit(&elem.key.val, d1.type);
3489 err1:
3490         return err;
3491 }
3492
3493 static int nf_tables_newsetelem(struct sock *nlsk, struct sk_buff *skb,
3494                                 const struct nlmsghdr *nlh,
3495                                 const struct nlattr * const nla[])
3496 {
3497         struct net *net = sock_net(skb->sk);
3498         const struct nlattr *attr;
3499         struct nft_set *set;
3500         struct nft_ctx ctx;
3501         int rem, err = 0;
3502
3503         if (nla[NFTA_SET_ELEM_LIST_ELEMENTS] == NULL)
3504                 return -EINVAL;
3505
3506         err = nft_ctx_init_from_elemattr(&ctx, skb, nlh, nla, true);
3507         if (err < 0)
3508                 return err;
3509
3510         set = nf_tables_set_lookup(ctx.table, nla[NFTA_SET_ELEM_LIST_SET]);
3511         if (IS_ERR(set)) {
3512                 if (nla[NFTA_SET_ELEM_LIST_SET_ID]) {
3513                         set = nf_tables_set_lookup_byid(net,
3514                                         nla[NFTA_SET_ELEM_LIST_SET_ID]);
3515                 }
3516                 if (IS_ERR(set))
3517                         return PTR_ERR(set);
3518         }
3519
3520         if (!list_empty(&set->bindings) && set->flags & NFT_SET_CONSTANT)
3521                 return -EBUSY;
3522
3523         nla_for_each_nested(attr, nla[NFTA_SET_ELEM_LIST_ELEMENTS], rem) {
3524                 if (set->size &&
3525                     !atomic_add_unless(&set->nelems, 1, set->size + set->ndeact))
3526                         return -ENFILE;
3527
3528                 err = nft_add_set_elem(&ctx, set, attr);
3529                 if (err < 0) {
3530                         atomic_dec(&set->nelems);
3531                         break;
3532                 }
3533         }
3534         return err;
3535 }
3536
3537 static int nft_del_setelem(struct nft_ctx *ctx, struct nft_set *set,
3538                            const struct nlattr *attr)
3539 {
3540         struct nlattr *nla[NFTA_SET_ELEM_MAX + 1];
3541         struct nft_data_desc desc;
3542         struct nft_set_elem elem;
3543         struct nft_trans *trans;
3544         int err;
3545
3546         err = nla_parse_nested(nla, NFTA_SET_ELEM_MAX, attr,
3547                                nft_set_elem_policy);
3548         if (err < 0)
3549                 goto err1;
3550
3551         err = -EINVAL;
3552         if (nla[NFTA_SET_ELEM_KEY] == NULL)
3553                 goto err1;
3554
3555         err = nft_data_init(ctx, &elem.key.val, sizeof(elem.key), &desc,
3556                             nla[NFTA_SET_ELEM_KEY]);
3557         if (err < 0)
3558                 goto err1;
3559
3560         err = -EINVAL;
3561         if (desc.type != NFT_DATA_VALUE || desc.len != set->klen)
3562                 goto err2;
3563
3564         trans = nft_trans_elem_alloc(ctx, NFT_MSG_DELSETELEM, set);
3565         if (trans == NULL) {
3566                 err = -ENOMEM;
3567                 goto err2;
3568         }
3569
3570         elem.priv = set->ops->deactivate(set, &elem);
3571         if (elem.priv == NULL) {
3572                 err = -ENOENT;
3573                 goto err3;
3574         }
3575
3576         nft_trans_elem(trans) = elem;
3577         list_add_tail(&trans->list, &ctx->net->nft.commit_list);
3578         return 0;
3579
3580 err3:
3581         kfree(trans);
3582 err2:
3583         nft_data_uninit(&elem.key.val, desc.type);
3584 err1:
3585         return err;
3586 }
3587
3588 static int nf_tables_delsetelem(struct sock *nlsk, struct sk_buff *skb,
3589                                 const struct nlmsghdr *nlh,
3590                                 const struct nlattr * const nla[])
3591 {
3592         const struct nlattr *attr;
3593         struct nft_set *set;
3594         struct nft_ctx ctx;
3595         int rem, err = 0;
3596
3597         if (nla[NFTA_SET_ELEM_LIST_ELEMENTS] == NULL)
3598                 return -EINVAL;
3599
3600         err = nft_ctx_init_from_elemattr(&ctx, skb, nlh, nla, false);
3601         if (err < 0)
3602                 return err;
3603
3604         set = nf_tables_set_lookup(ctx.table, nla[NFTA_SET_ELEM_LIST_SET]);
3605         if (IS_ERR(set))
3606                 return PTR_ERR(set);
3607         if (!list_empty(&set->bindings) && set->flags & NFT_SET_CONSTANT)
3608                 return -EBUSY;
3609
3610         nla_for_each_nested(attr, nla[NFTA_SET_ELEM_LIST_ELEMENTS], rem) {
3611                 err = nft_del_setelem(&ctx, set, attr);
3612                 if (err < 0)
3613                         break;
3614
3615                 set->ndeact++;
3616         }
3617         return err;
3618 }
3619
3620 void nft_set_gc_batch_release(struct rcu_head *rcu)
3621 {
3622         struct nft_set_gc_batch *gcb;
3623         unsigned int i;
3624
3625         gcb = container_of(rcu, struct nft_set_gc_batch, head.rcu);
3626         for (i = 0; i < gcb->head.cnt; i++)
3627                 nft_set_elem_destroy(gcb->head.set, gcb->elems[i]);
3628         kfree(gcb);
3629 }
3630 EXPORT_SYMBOL_GPL(nft_set_gc_batch_release);
3631
3632 struct nft_set_gc_batch *nft_set_gc_batch_alloc(const struct nft_set *set,
3633                                                 gfp_t gfp)
3634 {
3635         struct nft_set_gc_batch *gcb;
3636
3637         gcb = kzalloc(sizeof(*gcb), gfp);
3638         if (gcb == NULL)
3639                 return gcb;
3640         gcb->head.set = set;
3641         return gcb;
3642 }
3643 EXPORT_SYMBOL_GPL(nft_set_gc_batch_alloc);
3644
3645 static int nf_tables_fill_gen_info(struct sk_buff *skb, struct net *net,
3646                                    u32 portid, u32 seq)
3647 {
3648         struct nlmsghdr *nlh;
3649         struct nfgenmsg *nfmsg;
3650         int event = (NFNL_SUBSYS_NFTABLES << 8) | NFT_MSG_NEWGEN;
3651
3652         nlh = nlmsg_put(skb, portid, seq, event, sizeof(struct nfgenmsg), 0);
3653         if (nlh == NULL)
3654                 goto nla_put_failure;
3655
3656         nfmsg = nlmsg_data(nlh);
3657         nfmsg->nfgen_family     = AF_UNSPEC;
3658         nfmsg->version          = NFNETLINK_V0;
3659         nfmsg->res_id           = htons(net->nft.base_seq & 0xffff);
3660
3661         if (nla_put_be32(skb, NFTA_GEN_ID, htonl(net->nft.base_seq)))
3662                 goto nla_put_failure;
3663
3664         nlmsg_end(skb, nlh);
3665         return 0;
3666
3667 nla_put_failure:
3668         nlmsg_trim(skb, nlh);
3669         return -EMSGSIZE;
3670 }
3671
3672 static int nf_tables_gen_notify(struct net *net, struct sk_buff *skb, int event)
3673 {
3674         struct nlmsghdr *nlh = nlmsg_hdr(skb);
3675         struct sk_buff *skb2;
3676         int err;
3677
3678         if (nlmsg_report(nlh) &&
3679             !nfnetlink_has_listeners(net, NFNLGRP_NFTABLES))
3680                 return 0;
3681
3682         err = -ENOBUFS;
3683         skb2 = nlmsg_new(NLMSG_GOODSIZE, GFP_KERNEL);
3684         if (skb2 == NULL)
3685                 goto err;
3686
3687         err = nf_tables_fill_gen_info(skb2, net, NETLINK_CB(skb).portid,
3688                                       nlh->nlmsg_seq);
3689         if (err < 0) {
3690                 kfree_skb(skb2);
3691                 goto err;
3692         }
3693
3694         err = nfnetlink_send(skb2, net, NETLINK_CB(skb).portid,
3695                              NFNLGRP_NFTABLES, nlmsg_report(nlh), GFP_KERNEL);
3696 err:
3697         if (err < 0) {
3698                 nfnetlink_set_err(net, NETLINK_CB(skb).portid, NFNLGRP_NFTABLES,
3699                                   err);
3700         }
3701         return err;
3702 }
3703
3704 static int nf_tables_getgen(struct sock *nlsk, struct sk_buff *skb,
3705                             const struct nlmsghdr *nlh,
3706                             const struct nlattr * const nla[])
3707 {
3708         struct net *net = sock_net(skb->sk);
3709         struct sk_buff *skb2;
3710         int err;
3711
3712         skb2 = alloc_skb(NLMSG_GOODSIZE, GFP_KERNEL);
3713         if (skb2 == NULL)
3714                 return -ENOMEM;
3715
3716         err = nf_tables_fill_gen_info(skb2, net, NETLINK_CB(skb).portid,
3717                                       nlh->nlmsg_seq);
3718         if (err < 0)
3719                 goto err;
3720
3721         return nlmsg_unicast(nlsk, skb2, NETLINK_CB(skb).portid);
3722 err:
3723         kfree_skb(skb2);
3724         return err;
3725 }
3726
3727 static const struct nfnl_callback nf_tables_cb[NFT_MSG_MAX] = {
3728         [NFT_MSG_NEWTABLE] = {
3729                 .call_batch     = nf_tables_newtable,
3730                 .attr_count     = NFTA_TABLE_MAX,
3731                 .policy         = nft_table_policy,
3732         },
3733         [NFT_MSG_GETTABLE] = {
3734                 .call           = nf_tables_gettable,
3735                 .attr_count     = NFTA_TABLE_MAX,
3736                 .policy         = nft_table_policy,
3737         },
3738         [NFT_MSG_DELTABLE] = {
3739                 .call_batch     = nf_tables_deltable,
3740                 .attr_count     = NFTA_TABLE_MAX,
3741                 .policy         = nft_table_policy,
3742         },
3743         [NFT_MSG_NEWCHAIN] = {
3744                 .call_batch     = nf_tables_newchain,
3745                 .attr_count     = NFTA_CHAIN_MAX,
3746                 .policy         = nft_chain_policy,
3747         },
3748         [NFT_MSG_GETCHAIN] = {
3749                 .call           = nf_tables_getchain,
3750                 .attr_count     = NFTA_CHAIN_MAX,
3751                 .policy         = nft_chain_policy,
3752         },
3753         [NFT_MSG_DELCHAIN] = {
3754                 .call_batch     = nf_tables_delchain,
3755                 .attr_count     = NFTA_CHAIN_MAX,
3756                 .policy         = nft_chain_policy,
3757         },
3758         [NFT_MSG_NEWRULE] = {
3759                 .call_batch     = nf_tables_newrule,
3760                 .attr_count     = NFTA_RULE_MAX,
3761                 .policy         = nft_rule_policy,
3762         },
3763         [NFT_MSG_GETRULE] = {
3764                 .call           = nf_tables_getrule,
3765                 .attr_count     = NFTA_RULE_MAX,
3766                 .policy         = nft_rule_policy,
3767         },
3768         [NFT_MSG_DELRULE] = {
3769                 .call_batch     = nf_tables_delrule,
3770                 .attr_count     = NFTA_RULE_MAX,
3771                 .policy         = nft_rule_policy,
3772         },
3773         [NFT_MSG_NEWSET] = {
3774                 .call_batch     = nf_tables_newset,
3775                 .attr_count     = NFTA_SET_MAX,
3776                 .policy         = nft_set_policy,
3777         },
3778         [NFT_MSG_GETSET] = {
3779                 .call           = nf_tables_getset,
3780                 .attr_count     = NFTA_SET_MAX,
3781                 .policy         = nft_set_policy,
3782         },
3783         [NFT_MSG_DELSET] = {
3784                 .call_batch     = nf_tables_delset,
3785                 .attr_count     = NFTA_SET_MAX,
3786                 .policy         = nft_set_policy,
3787         },
3788         [NFT_MSG_NEWSETELEM] = {
3789                 .call_batch     = nf_tables_newsetelem,
3790                 .attr_count     = NFTA_SET_ELEM_LIST_MAX,
3791                 .policy         = nft_set_elem_list_policy,
3792         },
3793         [NFT_MSG_GETSETELEM] = {
3794                 .call           = nf_tables_getsetelem,
3795                 .attr_count     = NFTA_SET_ELEM_LIST_MAX,
3796                 .policy         = nft_set_elem_list_policy,
3797         },
3798         [NFT_MSG_DELSETELEM] = {
3799                 .call_batch     = nf_tables_delsetelem,
3800                 .attr_count     = NFTA_SET_ELEM_LIST_MAX,
3801                 .policy         = nft_set_elem_list_policy,
3802         },
3803         [NFT_MSG_GETGEN] = {
3804                 .call           = nf_tables_getgen,
3805         },
3806 };
3807
3808 static void nft_chain_commit_update(struct nft_trans *trans)
3809 {
3810         struct nft_base_chain *basechain;
3811
3812         if (nft_trans_chain_name(trans)[0])
3813                 strcpy(trans->ctx.chain->name, nft_trans_chain_name(trans));
3814
3815         if (!(trans->ctx.chain->flags & NFT_BASE_CHAIN))
3816                 return;
3817
3818         basechain = nft_base_chain(trans->ctx.chain);
3819         nft_chain_stats_replace(basechain, nft_trans_chain_stats(trans));
3820
3821         switch (nft_trans_chain_policy(trans)) {
3822         case NF_DROP:
3823         case NF_ACCEPT:
3824                 basechain->policy = nft_trans_chain_policy(trans);
3825                 break;
3826         }
3827 }
3828
3829 static void nf_tables_commit_release(struct nft_trans *trans)
3830 {
3831         switch (trans->msg_type) {
3832         case NFT_MSG_DELTABLE:
3833                 nf_tables_table_destroy(&trans->ctx);
3834                 break;
3835         case NFT_MSG_DELCHAIN:
3836                 nf_tables_chain_destroy(trans->ctx.chain);
3837                 break;
3838         case NFT_MSG_DELRULE:
3839                 nf_tables_rule_destroy(&trans->ctx, nft_trans_rule(trans));
3840                 break;
3841         case NFT_MSG_DELSET:
3842                 nft_set_destroy(nft_trans_set(trans));
3843                 break;
3844         case NFT_MSG_DELSETELEM:
3845                 nft_set_elem_destroy(nft_trans_elem_set(trans),
3846                                      nft_trans_elem(trans).priv);
3847                 break;
3848         }
3849         kfree(trans);
3850 }
3851
3852 static int nf_tables_commit(struct sk_buff *skb)
3853 {
3854         struct net *net = sock_net(skb->sk);
3855         struct nft_trans *trans, *next;
3856         struct nft_trans_elem *te;
3857
3858         /* Bump generation counter, invalidate any dump in progress */
3859         while (++net->nft.base_seq == 0);
3860
3861         /* A new generation has just started */
3862         net->nft.gencursor = nft_gencursor_next(net);
3863
3864         /* Make sure all packets have left the previous generation before
3865          * purging old rules.
3866          */
3867         synchronize_rcu();
3868
3869         list_for_each_entry_safe(trans, next, &net->nft.commit_list, list) {
3870                 switch (trans->msg_type) {
3871                 case NFT_MSG_NEWTABLE:
3872                         if (nft_trans_table_update(trans)) {
3873                                 if (!nft_trans_table_enable(trans)) {
3874                                         nf_tables_table_disable(trans->ctx.afi,
3875                                                                 trans->ctx.table);
3876                                         trans->ctx.table->flags |= NFT_TABLE_F_DORMANT;
3877                                 }
3878                         } else {
3879                                 trans->ctx.table->flags &= ~NFT_TABLE_INACTIVE;
3880                         }
3881                         nf_tables_table_notify(&trans->ctx, NFT_MSG_NEWTABLE);
3882                         nft_trans_destroy(trans);
3883                         break;
3884                 case NFT_MSG_DELTABLE:
3885                         nf_tables_table_notify(&trans->ctx, NFT_MSG_DELTABLE);
3886                         break;
3887                 case NFT_MSG_NEWCHAIN:
3888                         if (nft_trans_chain_update(trans))
3889                                 nft_chain_commit_update(trans);
3890                         else
3891                                 trans->ctx.chain->flags &= ~NFT_CHAIN_INACTIVE;
3892
3893                         nf_tables_chain_notify(&trans->ctx, NFT_MSG_NEWCHAIN);
3894                         nft_trans_destroy(trans);
3895                         break;
3896                 case NFT_MSG_DELCHAIN:
3897                         nf_tables_chain_notify(&trans->ctx, NFT_MSG_DELCHAIN);
3898                         nf_tables_unregister_hooks(trans->ctx.table,
3899                                                    trans->ctx.chain,
3900                                                    trans->ctx.afi->nops);
3901                         break;
3902                 case NFT_MSG_NEWRULE:
3903                         nft_rule_clear(trans->ctx.net, nft_trans_rule(trans));
3904                         nf_tables_rule_notify(&trans->ctx,
3905                                               nft_trans_rule(trans),
3906                                               NFT_MSG_NEWRULE);
3907                         nft_trans_destroy(trans);
3908                         break;
3909                 case NFT_MSG_DELRULE:
3910                         list_del_rcu(&nft_trans_rule(trans)->list);
3911                         nf_tables_rule_notify(&trans->ctx,
3912                                               nft_trans_rule(trans),
3913                                               NFT_MSG_DELRULE);
3914                         break;
3915                 case NFT_MSG_NEWSET:
3916                         nft_trans_set(trans)->flags &= ~NFT_SET_INACTIVE;
3917                         /* This avoids hitting -EBUSY when deleting the table
3918                          * from the transaction.
3919                          */
3920                         if (nft_trans_set(trans)->flags & NFT_SET_ANONYMOUS &&
3921                             !list_empty(&nft_trans_set(trans)->bindings))
3922                                 trans->ctx.table->use--;
3923
3924                         nf_tables_set_notify(&trans->ctx, nft_trans_set(trans),
3925                                              NFT_MSG_NEWSET, GFP_KERNEL);
3926                         nft_trans_destroy(trans);
3927                         break;
3928                 case NFT_MSG_DELSET:
3929                         nf_tables_set_notify(&trans->ctx, nft_trans_set(trans),
3930                                              NFT_MSG_DELSET, GFP_KERNEL);
3931                         break;
3932                 case NFT_MSG_NEWSETELEM:
3933                         te = (struct nft_trans_elem *)trans->data;
3934
3935                         te->set->ops->activate(te->set, &te->elem);
3936                         nf_tables_setelem_notify(&trans->ctx, te->set,
3937                                                  &te->elem,
3938                                                  NFT_MSG_NEWSETELEM, 0);
3939                         nft_trans_destroy(trans);
3940                         break;
3941                 case NFT_MSG_DELSETELEM:
3942                         te = (struct nft_trans_elem *)trans->data;
3943
3944                         nf_tables_setelem_notify(&trans->ctx, te->set,
3945                                                  &te->elem,
3946                                                  NFT_MSG_DELSETELEM, 0);
3947                         te->set->ops->remove(te->set, &te->elem);
3948                         atomic_dec(&te->set->nelems);
3949                         te->set->ndeact--;
3950                         break;
3951                 }
3952         }
3953
3954         synchronize_rcu();
3955
3956         list_for_each_entry_safe(trans, next, &net->nft.commit_list, list) {
3957                 list_del(&trans->list);
3958                 nf_tables_commit_release(trans);
3959         }
3960
3961         nf_tables_gen_notify(net, skb, NFT_MSG_NEWGEN);
3962
3963         return 0;
3964 }
3965
3966 static void nf_tables_abort_release(struct nft_trans *trans)
3967 {
3968         switch (trans->msg_type) {
3969         case NFT_MSG_NEWTABLE:
3970                 nf_tables_table_destroy(&trans->ctx);
3971                 break;
3972         case NFT_MSG_NEWCHAIN:
3973                 nf_tables_chain_destroy(trans->ctx.chain);
3974                 break;
3975         case NFT_MSG_NEWRULE:
3976                 nf_tables_rule_destroy(&trans->ctx, nft_trans_rule(trans));
3977                 break;
3978         case NFT_MSG_NEWSET:
3979                 nft_set_destroy(nft_trans_set(trans));
3980                 break;
3981         case NFT_MSG_NEWSETELEM:
3982                 nft_set_elem_destroy(nft_trans_elem_set(trans),
3983                                      nft_trans_elem(trans).priv);
3984                 break;
3985         }
3986         kfree(trans);
3987 }
3988
3989 static int nf_tables_abort(struct sk_buff *skb)
3990 {
3991         struct net *net = sock_net(skb->sk);
3992         struct nft_trans *trans, *next;
3993         struct nft_trans_elem *te;
3994
3995         list_for_each_entry_safe(trans, next, &net->nft.commit_list, list) {
3996                 switch (trans->msg_type) {
3997                 case NFT_MSG_NEWTABLE:
3998                         if (nft_trans_table_update(trans)) {
3999                                 if (nft_trans_table_enable(trans)) {
4000                                         nf_tables_table_disable(trans->ctx.afi,
4001                                                                 trans->ctx.table);
4002                                         trans->ctx.table->flags |= NFT_TABLE_F_DORMANT;
4003                                 }
4004                                 nft_trans_destroy(trans);
4005                         } else {
4006                                 list_del_rcu(&trans->ctx.table->list);
4007                         }
4008                         break;
4009                 case NFT_MSG_DELTABLE:
4010                         list_add_tail_rcu(&trans->ctx.table->list,
4011                                           &trans->ctx.afi->tables);
4012                         nft_trans_destroy(trans);
4013                         break;
4014                 case NFT_MSG_NEWCHAIN:
4015                         if (nft_trans_chain_update(trans)) {
4016                                 free_percpu(nft_trans_chain_stats(trans));
4017
4018                                 nft_trans_destroy(trans);
4019                         } else {
4020                                 trans->ctx.table->use--;
4021                                 list_del_rcu(&trans->ctx.chain->list);
4022                                 nf_tables_unregister_hooks(trans->ctx.table,
4023                                                            trans->ctx.chain,
4024                                                            trans->ctx.afi->nops);
4025                         }
4026                         break;
4027                 case NFT_MSG_DELCHAIN:
4028                         trans->ctx.table->use++;
4029                         list_add_tail_rcu(&trans->ctx.chain->list,
4030                                           &trans->ctx.table->chains);
4031                         nft_trans_destroy(trans);
4032                         break;
4033                 case NFT_MSG_NEWRULE:
4034                         trans->ctx.chain->use--;
4035                         list_del_rcu(&nft_trans_rule(trans)->list);
4036                         break;
4037                 case NFT_MSG_DELRULE:
4038                         trans->ctx.chain->use++;
4039                         nft_rule_clear(trans->ctx.net, nft_trans_rule(trans));
4040                         nft_trans_destroy(trans);
4041                         break;
4042                 case NFT_MSG_NEWSET:
4043                         trans->ctx.table->use--;
4044                         list_del_rcu(&nft_trans_set(trans)->list);
4045                         break;
4046                 case NFT_MSG_DELSET:
4047                         trans->ctx.table->use++;
4048                         list_add_tail_rcu(&nft_trans_set(trans)->list,
4049                                           &trans->ctx.table->sets);
4050                         nft_trans_destroy(trans);
4051                         break;
4052                 case NFT_MSG_NEWSETELEM:
4053                         te = (struct nft_trans_elem *)trans->data;
4054
4055                         te->set->ops->remove(te->set, &te->elem);
4056                         atomic_dec(&te->set->nelems);
4057                         break;
4058                 case NFT_MSG_DELSETELEM:
4059                         te = (struct nft_trans_elem *)trans->data;
4060
4061                         te->set->ops->activate(te->set, &te->elem);
4062                         te->set->ndeact--;
4063
4064                         nft_trans_destroy(trans);
4065                         break;
4066                 }
4067         }
4068
4069         synchronize_rcu();
4070
4071         list_for_each_entry_safe_reverse(trans, next,
4072                                          &net->nft.commit_list, list) {
4073                 list_del(&trans->list);
4074                 nf_tables_abort_release(trans);
4075         }
4076
4077         return 0;
4078 }
4079
4080 static const struct nfnetlink_subsystem nf_tables_subsys = {
4081         .name           = "nf_tables",
4082         .subsys_id      = NFNL_SUBSYS_NFTABLES,
4083         .cb_count       = NFT_MSG_MAX,
4084         .cb             = nf_tables_cb,
4085         .commit         = nf_tables_commit,
4086         .abort          = nf_tables_abort,
4087 };
4088
4089 int nft_chain_validate_dependency(const struct nft_chain *chain,
4090                                   enum nft_chain_type type)
4091 {
4092         const struct nft_base_chain *basechain;
4093
4094         if (chain->flags & NFT_BASE_CHAIN) {
4095                 basechain = nft_base_chain(chain);
4096                 if (basechain->type->type != type)
4097                         return -EOPNOTSUPP;
4098         }
4099         return 0;
4100 }
4101 EXPORT_SYMBOL_GPL(nft_chain_validate_dependency);
4102
4103 int nft_chain_validate_hooks(const struct nft_chain *chain,
4104                              unsigned int hook_flags)
4105 {
4106         struct nft_base_chain *basechain;
4107
4108         if (chain->flags & NFT_BASE_CHAIN) {
4109                 basechain = nft_base_chain(chain);
4110
4111                 if ((1 << basechain->ops[0].hooknum) & hook_flags)
4112                         return 0;
4113
4114                 return -EOPNOTSUPP;
4115         }
4116
4117         return 0;
4118 }
4119 EXPORT_SYMBOL_GPL(nft_chain_validate_hooks);
4120
4121 /*
4122  * Loop detection - walk through the ruleset beginning at the destination chain
4123  * of a new jump until either the source chain is reached (loop) or all
4124  * reachable chains have been traversed.
4125  *
4126  * The loop check is performed whenever a new jump verdict is added to an
4127  * expression or verdict map or a verdict map is bound to a new chain.
4128  */
4129
4130 static int nf_tables_check_loops(const struct nft_ctx *ctx,
4131                                  const struct nft_chain *chain);
4132
4133 static int nf_tables_loop_check_setelem(const struct nft_ctx *ctx,
4134                                         const struct nft_set *set,
4135                                         const struct nft_set_iter *iter,
4136                                         const struct nft_set_elem *elem)
4137 {
4138         const struct nft_set_ext *ext = nft_set_elem_ext(set, elem->priv);
4139         const struct nft_data *data;
4140
4141         if (nft_set_ext_exists(ext, NFT_SET_EXT_FLAGS) &&
4142             *nft_set_ext_flags(ext) & NFT_SET_ELEM_INTERVAL_END)
4143                 return 0;
4144
4145         data = nft_set_ext_data(ext);
4146         switch (data->verdict.code) {
4147         case NFT_JUMP:
4148         case NFT_GOTO:
4149                 return nf_tables_check_loops(ctx, data->verdict.chain);
4150         default:
4151                 return 0;
4152         }
4153 }
4154
4155 static int nf_tables_check_loops(const struct nft_ctx *ctx,
4156                                  const struct nft_chain *chain)
4157 {
4158         const struct nft_rule *rule;
4159         const struct nft_expr *expr, *last;
4160         const struct nft_set *set;
4161         struct nft_set_binding *binding;
4162         struct nft_set_iter iter;
4163
4164         if (ctx->chain == chain)
4165                 return -ELOOP;
4166
4167         list_for_each_entry(rule, &chain->rules, list) {
4168                 nft_rule_for_each_expr(expr, last, rule) {
4169                         const struct nft_data *data = NULL;
4170                         int err;
4171
4172                         if (!expr->ops->validate)
4173                                 continue;
4174
4175                         err = expr->ops->validate(ctx, expr, &data);
4176                         if (err < 0)
4177                                 return err;
4178
4179                         if (data == NULL)
4180                                 continue;
4181
4182                         switch (data->verdict.code) {
4183                         case NFT_JUMP:
4184                         case NFT_GOTO:
4185                                 err = nf_tables_check_loops(ctx,
4186                                                         data->verdict.chain);
4187                                 if (err < 0)
4188                                         return err;
4189                         default:
4190                                 break;
4191                         }
4192                 }
4193         }
4194
4195         list_for_each_entry(set, &ctx->table->sets, list) {
4196                 if (!(set->flags & NFT_SET_MAP) ||
4197                     set->dtype != NFT_DATA_VERDICT)
4198                         continue;
4199
4200                 list_for_each_entry(binding, &set->bindings, list) {
4201                         if (!(binding->flags & NFT_SET_MAP) ||
4202                             binding->chain != chain)
4203                                 continue;
4204
4205                         iter.skip       = 0;
4206                         iter.count      = 0;
4207                         iter.err        = 0;
4208                         iter.fn         = nf_tables_loop_check_setelem;
4209
4210                         set->ops->walk(ctx, set, &iter);
4211                         if (iter.err < 0)
4212                                 return iter.err;
4213                 }
4214         }
4215
4216         return 0;
4217 }
4218
4219 /**
4220  *      nft_parse_register - parse a register value from a netlink attribute
4221  *
4222  *      @attr: netlink attribute
4223  *
4224  *      Parse and translate a register value from a netlink attribute.
4225  *      Registers used to be 128 bit wide, these register numbers will be
4226  *      mapped to the corresponding 32 bit register numbers.
4227  */
4228 unsigned int nft_parse_register(const struct nlattr *attr)
4229 {
4230         unsigned int reg;
4231
4232         reg = ntohl(nla_get_be32(attr));
4233         switch (reg) {
4234         case NFT_REG_VERDICT...NFT_REG_4:
4235                 return reg * NFT_REG_SIZE / NFT_REG32_SIZE;
4236         default:
4237                 return reg + NFT_REG_SIZE / NFT_REG32_SIZE - NFT_REG32_00;
4238         }
4239 }
4240 EXPORT_SYMBOL_GPL(nft_parse_register);
4241
4242 /**
4243  *      nft_dump_register - dump a register value to a netlink attribute
4244  *
4245  *      @skb: socket buffer
4246  *      @attr: attribute number
4247  *      @reg: register number
4248  *
4249  *      Construct a netlink attribute containing the register number. For
4250  *      compatibility reasons, register numbers being a multiple of 4 are
4251  *      translated to the corresponding 128 bit register numbers.
4252  */
4253 int nft_dump_register(struct sk_buff *skb, unsigned int attr, unsigned int reg)
4254 {
4255         if (reg % (NFT_REG_SIZE / NFT_REG32_SIZE) == 0)
4256                 reg = reg / (NFT_REG_SIZE / NFT_REG32_SIZE);
4257         else
4258                 reg = reg - NFT_REG_SIZE / NFT_REG32_SIZE + NFT_REG32_00;
4259
4260         return nla_put_be32(skb, attr, htonl(reg));
4261 }
4262 EXPORT_SYMBOL_GPL(nft_dump_register);
4263
4264 /**
4265  *      nft_validate_register_load - validate a load from a register
4266  *
4267  *      @reg: the register number
4268  *      @len: the length of the data
4269  *
4270  *      Validate that the input register is one of the general purpose
4271  *      registers and that the length of the load is within the bounds.
4272  */
4273 int nft_validate_register_load(enum nft_registers reg, unsigned int len)
4274 {
4275         if (reg < NFT_REG_1 * NFT_REG_SIZE / NFT_REG32_SIZE)
4276                 return -EINVAL;
4277         if (len == 0)
4278                 return -EINVAL;
4279         if (reg * NFT_REG32_SIZE + len > FIELD_SIZEOF(struct nft_regs, data))
4280                 return -ERANGE;
4281
4282         return 0;
4283 }
4284 EXPORT_SYMBOL_GPL(nft_validate_register_load);
4285
4286 /**
4287  *      nft_validate_register_store - validate an expressions' register store
4288  *
4289  *      @ctx: context of the expression performing the load
4290  *      @reg: the destination register number
4291  *      @data: the data to load
4292  *      @type: the data type
4293  *      @len: the length of the data
4294  *
4295  *      Validate that a data load uses the appropriate data type for
4296  *      the destination register and the length is within the bounds.
4297  *      A value of NULL for the data means that its runtime gathered
4298  *      data.
4299  */
4300 int nft_validate_register_store(const struct nft_ctx *ctx,
4301                                 enum nft_registers reg,
4302                                 const struct nft_data *data,
4303                                 enum nft_data_types type, unsigned int len)
4304 {
4305         int err;
4306
4307         switch (reg) {
4308         case NFT_REG_VERDICT:
4309                 if (type != NFT_DATA_VERDICT)
4310                         return -EINVAL;
4311
4312                 if (data != NULL &&
4313                     (data->verdict.code == NFT_GOTO ||
4314                      data->verdict.code == NFT_JUMP)) {
4315                         err = nf_tables_check_loops(ctx, data->verdict.chain);
4316                         if (err < 0)
4317                                 return err;
4318
4319                         if (ctx->chain->level + 1 >
4320                             data->verdict.chain->level) {
4321                                 if (ctx->chain->level + 1 == NFT_JUMP_STACK_SIZE)
4322                                         return -EMLINK;
4323                                 data->verdict.chain->level = ctx->chain->level + 1;
4324                         }
4325                 }
4326
4327                 return 0;
4328         default:
4329                 if (reg < NFT_REG_1 * NFT_REG_SIZE / NFT_REG32_SIZE)
4330                         return -EINVAL;
4331                 if (len == 0)
4332                         return -EINVAL;
4333                 if (reg * NFT_REG32_SIZE + len >
4334                     FIELD_SIZEOF(struct nft_regs, data))
4335                         return -ERANGE;
4336
4337                 if (data != NULL && type != NFT_DATA_VALUE)
4338                         return -EINVAL;
4339                 return 0;
4340         }
4341 }
4342 EXPORT_SYMBOL_GPL(nft_validate_register_store);
4343
4344 static const struct nla_policy nft_verdict_policy[NFTA_VERDICT_MAX + 1] = {
4345         [NFTA_VERDICT_CODE]     = { .type = NLA_U32 },
4346         [NFTA_VERDICT_CHAIN]    = { .type = NLA_STRING,
4347                                     .len = NFT_CHAIN_MAXNAMELEN - 1 },
4348 };
4349
4350 static int nft_verdict_init(const struct nft_ctx *ctx, struct nft_data *data,
4351                             struct nft_data_desc *desc, const struct nlattr *nla)
4352 {
4353         struct nlattr *tb[NFTA_VERDICT_MAX + 1];
4354         struct nft_chain *chain;
4355         int err;
4356
4357         err = nla_parse_nested(tb, NFTA_VERDICT_MAX, nla, nft_verdict_policy);
4358         if (err < 0)
4359                 return err;
4360
4361         if (!tb[NFTA_VERDICT_CODE])
4362                 return -EINVAL;
4363         data->verdict.code = ntohl(nla_get_be32(tb[NFTA_VERDICT_CODE]));
4364
4365         switch (data->verdict.code) {
4366         default:
4367                 switch (data->verdict.code & NF_VERDICT_MASK) {
4368                 case NF_ACCEPT:
4369                 case NF_DROP:
4370                 case NF_QUEUE:
4371                         break;
4372                 default:
4373                         return -EINVAL;
4374                 }
4375                 /* fall through */
4376         case NFT_CONTINUE:
4377         case NFT_BREAK:
4378         case NFT_RETURN:
4379                 break;
4380         case NFT_JUMP:
4381         case NFT_GOTO:
4382                 if (!tb[NFTA_VERDICT_CHAIN])
4383                         return -EINVAL;
4384                 chain = nf_tables_chain_lookup(ctx->table,
4385                                                tb[NFTA_VERDICT_CHAIN]);
4386                 if (IS_ERR(chain))
4387                         return PTR_ERR(chain);
4388                 if (chain->flags & NFT_BASE_CHAIN)
4389                         return -EOPNOTSUPP;
4390
4391                 chain->use++;
4392                 data->verdict.chain = chain;
4393                 break;
4394         }
4395
4396         desc->len = sizeof(data->verdict);
4397         desc->type = NFT_DATA_VERDICT;
4398         return 0;
4399 }
4400
4401 static void nft_verdict_uninit(const struct nft_data *data)
4402 {
4403         switch (data->verdict.code) {
4404         case NFT_JUMP:
4405         case NFT_GOTO:
4406                 data->verdict.chain->use--;
4407                 break;
4408         }
4409 }
4410
4411 static int nft_verdict_dump(struct sk_buff *skb, const struct nft_data *data)
4412 {
4413         struct nlattr *nest;
4414
4415         nest = nla_nest_start(skb, NFTA_DATA_VERDICT);
4416         if (!nest)
4417                 goto nla_put_failure;
4418
4419         if (nla_put_be32(skb, NFTA_VERDICT_CODE, htonl(data->verdict.code)))
4420                 goto nla_put_failure;
4421
4422         switch (data->verdict.code) {
4423         case NFT_JUMP:
4424         case NFT_GOTO:
4425                 if (nla_put_string(skb, NFTA_VERDICT_CHAIN,
4426                                    data->verdict.chain->name))
4427                         goto nla_put_failure;
4428         }
4429         nla_nest_end(skb, nest);
4430         return 0;
4431
4432 nla_put_failure:
4433         return -1;
4434 }
4435
4436 static int nft_value_init(const struct nft_ctx *ctx,
4437                           struct nft_data *data, unsigned int size,
4438                           struct nft_data_desc *desc, const struct nlattr *nla)
4439 {
4440         unsigned int len;
4441
4442         len = nla_len(nla);
4443         if (len == 0)
4444                 return -EINVAL;
4445         if (len > size)
4446                 return -EOVERFLOW;
4447
4448         nla_memcpy(data->data, nla, len);
4449         desc->type = NFT_DATA_VALUE;
4450         desc->len  = len;
4451         return 0;
4452 }
4453
4454 static int nft_value_dump(struct sk_buff *skb, const struct nft_data *data,
4455                           unsigned int len)
4456 {
4457         return nla_put(skb, NFTA_DATA_VALUE, len, data->data);
4458 }
4459
4460 static const struct nla_policy nft_data_policy[NFTA_DATA_MAX + 1] = {
4461         [NFTA_DATA_VALUE]       = { .type = NLA_BINARY },
4462         [NFTA_DATA_VERDICT]     = { .type = NLA_NESTED },
4463 };
4464
4465 /**
4466  *      nft_data_init - parse nf_tables data netlink attributes
4467  *
4468  *      @ctx: context of the expression using the data
4469  *      @data: destination struct nft_data
4470  *      @size: maximum data length
4471  *      @desc: data description
4472  *      @nla: netlink attribute containing data
4473  *
4474  *      Parse the netlink data attributes and initialize a struct nft_data.
4475  *      The type and length of data are returned in the data description.
4476  *
4477  *      The caller can indicate that it only wants to accept data of type
4478  *      NFT_DATA_VALUE by passing NULL for the ctx argument.
4479  */
4480 int nft_data_init(const struct nft_ctx *ctx,
4481                   struct nft_data *data, unsigned int size,
4482                   struct nft_data_desc *desc, const struct nlattr *nla)
4483 {
4484         struct nlattr *tb[NFTA_DATA_MAX + 1];
4485         int err;
4486
4487         err = nla_parse_nested(tb, NFTA_DATA_MAX, nla, nft_data_policy);
4488         if (err < 0)
4489                 return err;
4490
4491         if (tb[NFTA_DATA_VALUE])
4492                 return nft_value_init(ctx, data, size, desc,
4493                                       tb[NFTA_DATA_VALUE]);
4494         if (tb[NFTA_DATA_VERDICT] && ctx != NULL)
4495                 return nft_verdict_init(ctx, data, desc, tb[NFTA_DATA_VERDICT]);
4496         return -EINVAL;
4497 }
4498 EXPORT_SYMBOL_GPL(nft_data_init);
4499
4500 /**
4501  *      nft_data_uninit - release a nft_data item
4502  *
4503  *      @data: struct nft_data to release
4504  *      @type: type of data
4505  *
4506  *      Release a nft_data item. NFT_DATA_VALUE types can be silently discarded,
4507  *      all others need to be released by calling this function.
4508  */
4509 void nft_data_uninit(const struct nft_data *data, enum nft_data_types type)
4510 {
4511         if (type < NFT_DATA_VERDICT)
4512                 return;
4513         switch (type) {
4514         case NFT_DATA_VERDICT:
4515                 return nft_verdict_uninit(data);
4516         default:
4517                 WARN_ON(1);
4518         }
4519 }
4520 EXPORT_SYMBOL_GPL(nft_data_uninit);
4521
4522 int nft_data_dump(struct sk_buff *skb, int attr, const struct nft_data *data,
4523                   enum nft_data_types type, unsigned int len)
4524 {
4525         struct nlattr *nest;
4526         int err;
4527
4528         nest = nla_nest_start(skb, attr);
4529         if (nest == NULL)
4530                 return -1;
4531
4532         switch (type) {
4533         case NFT_DATA_VALUE:
4534                 err = nft_value_dump(skb, data, len);
4535                 break;
4536         case NFT_DATA_VERDICT:
4537                 err = nft_verdict_dump(skb, data);
4538                 break;
4539         default:
4540                 err = -EINVAL;
4541                 WARN_ON(1);
4542         }
4543
4544         nla_nest_end(skb, nest);
4545         return err;
4546 }
4547 EXPORT_SYMBOL_GPL(nft_data_dump);
4548
4549 static int nf_tables_init_net(struct net *net)
4550 {
4551         INIT_LIST_HEAD(&net->nft.af_info);
4552         INIT_LIST_HEAD(&net->nft.commit_list);
4553         net->nft.base_seq = 1;
4554         return 0;
4555 }
4556
4557 static struct pernet_operations nf_tables_net_ops = {
4558         .init   = nf_tables_init_net,
4559 };
4560
4561 static int __init nf_tables_module_init(void)
4562 {
4563         int err;
4564
4565         info = kmalloc(sizeof(struct nft_expr_info) * NFT_RULE_MAXEXPRS,
4566                        GFP_KERNEL);
4567         if (info == NULL) {
4568                 err = -ENOMEM;
4569                 goto err1;
4570         }
4571
4572         err = nf_tables_core_module_init();
4573         if (err < 0)
4574                 goto err2;
4575
4576         err = nfnetlink_subsys_register(&nf_tables_subsys);
4577         if (err < 0)
4578                 goto err3;
4579
4580         pr_info("nf_tables: (c) 2007-2009 Patrick McHardy <kaber@trash.net>\n");
4581         return register_pernet_subsys(&nf_tables_net_ops);
4582 err3:
4583         nf_tables_core_module_exit();
4584 err2:
4585         kfree(info);
4586 err1:
4587         return err;
4588 }
4589
4590 static void __exit nf_tables_module_exit(void)
4591 {
4592         unregister_pernet_subsys(&nf_tables_net_ops);
4593         nfnetlink_subsys_unregister(&nf_tables_subsys);
4594         rcu_barrier();
4595         nf_tables_core_module_exit();
4596         kfree(info);
4597 }
4598
4599 module_init(nf_tables_module_init);
4600 module_exit(nf_tables_module_exit);
4601
4602 MODULE_LICENSE("GPL");
4603 MODULE_AUTHOR("Patrick McHardy <kaber@trash.net>");
4604 MODULE_ALIAS_NFNL_SUBSYS(NFNL_SUBSYS_NFTABLES);