ofproto: Add support for reverting flow mods and bundle commit.
[cascardo/ovs.git] / ofproto / ofproto.c
1 /*
2  * Copyright (c) 2009-2015 Nicira, Inc.
3  * Copyright (c) 2010 Jean Tourrilhes - HP-Labs.
4  *
5  * Licensed under the Apache License, Version 2.0 (the "License");
6  * you may not use this file except in compliance with the License.
7  * You may obtain a copy of the License at:
8  *
9  *     http://www.apache.org/licenses/LICENSE-2.0
10  *
11  * Unless required by applicable law or agreed to in writing, software
12  * distributed under the License is distributed on an "AS IS" BASIS,
13  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
14  * See the License for the specific language governing permissions and
15  * limitations under the License.
16  */
17
18 #include <config.h>
19 #include "ofproto.h"
20 #include <errno.h>
21 #include <inttypes.h>
22 #include <stdbool.h>
23 #include <stdlib.h>
24 #include <unistd.h>
25 #include "bitmap.h"
26 #include "byte-order.h"
27 #include "classifier.h"
28 #include "connectivity.h"
29 #include "connmgr.h"
30 #include "coverage.h"
31 #include "dynamic-string.h"
32 #include "hash.h"
33 #include "hmap.h"
34 #include "meta-flow.h"
35 #include "netdev.h"
36 #include "nx-match.h"
37 #include "ofp-actions.h"
38 #include "ofp-errors.h"
39 #include "ofp-msgs.h"
40 #include "ofp-print.h"
41 #include "ofp-util.h"
42 #include "ofpbuf.h"
43 #include "ofproto-provider.h"
44 #include "openflow/nicira-ext.h"
45 #include "openflow/openflow.h"
46 #include "ovs-rcu.h"
47 #include "dp-packet.h"
48 #include "packets.h"
49 #include "pinsched.h"
50 #include "pktbuf.h"
51 #include "poll-loop.h"
52 #include "random.h"
53 #include "seq.h"
54 #include "shash.h"
55 #include "simap.h"
56 #include "smap.h"
57 #include "sset.h"
58 #include "timeval.h"
59 #include "unaligned.h"
60 #include "unixctl.h"
61 #include "openvswitch/vlog.h"
62 #include "bundles.h"
63
64 VLOG_DEFINE_THIS_MODULE(ofproto);
65
66 COVERAGE_DEFINE(ofproto_flush);
67 COVERAGE_DEFINE(ofproto_packet_out);
68 COVERAGE_DEFINE(ofproto_queue_req);
69 COVERAGE_DEFINE(ofproto_recv_openflow);
70 COVERAGE_DEFINE(ofproto_reinit_ports);
71 COVERAGE_DEFINE(ofproto_update_port);
72
73 /* Default fields to use for prefix tries in each flow table, unless something
74  * else is configured. */
75 const enum mf_field_id default_prefix_fields[2] =
76     { MFF_IPV4_DST, MFF_IPV4_SRC };
77
78 /* oftable. */
79 static void oftable_init(struct oftable *);
80 static void oftable_destroy(struct oftable *);
81
82 static void oftable_set_name(struct oftable *, const char *name);
83
84 static enum ofperr evict_rules_from_table(struct oftable *,
85                                           unsigned int extra_space)
86     OVS_REQUIRES(ofproto_mutex);
87 static void oftable_disable_eviction(struct oftable *);
88 static void oftable_enable_eviction(struct oftable *,
89                                     const struct mf_subfield *fields,
90                                     size_t n_fields);
91
92 static void oftable_remove_rule(struct rule *rule) OVS_REQUIRES(ofproto_mutex);
93
94 /* A set of rules within a single OpenFlow table (oftable) that have the same
95  * values for the oftable's eviction_fields.  A rule to be evicted, when one is
96  * needed, is taken from the eviction group that contains the greatest number
97  * of rules.
98  *
99  * An oftable owns any number of eviction groups, each of which contains any
100  * number of rules.
101  *
102  * Membership in an eviction group is imprecise, based on the hash of the
103  * oftable's eviction_fields (in the eviction_group's id_node.hash member).
104  * That is, if two rules have different eviction_fields, but those
105  * eviction_fields hash to the same value, then they will belong to the same
106  * eviction_group anyway.
107  *
108  * (When eviction is not enabled on an oftable, we don't track any eviction
109  * groups, to save time and space.) */
110 struct eviction_group {
111     struct hmap_node id_node;   /* In oftable's "eviction_groups_by_id". */
112     struct heap_node size_node; /* In oftable's "eviction_groups_by_size". */
113     struct heap rules;          /* Contains "struct rule"s. */
114 };
115
116 static bool choose_rule_to_evict(struct oftable *table, struct rule **rulep)
117     OVS_REQUIRES(ofproto_mutex);
118 static uint32_t rule_eviction_priority(struct ofproto *ofproto, struct rule *)
119     OVS_REQUIRES(ofproto_mutex);;
120 static void eviction_group_add_rule(struct rule *)
121     OVS_REQUIRES(ofproto_mutex);
122 static void eviction_group_remove_rule(struct rule *)
123     OVS_REQUIRES(ofproto_mutex);
124
125 /* Criteria that flow_mod and other operations use for selecting rules on
126  * which to operate. */
127 struct rule_criteria {
128     /* An OpenFlow table or 255 for all tables. */
129     uint8_t table_id;
130
131     /* OpenFlow matching criteria.  Interpreted different in "loose" way by
132      * collect_rules_loose() and "strict" way by collect_rules_strict(), as
133      * defined in the OpenFlow spec. */
134     struct cls_rule cr;
135
136     /* Matching criteria for the OpenFlow cookie.  Consider a bit B in a rule's
137      * cookie and the corresponding bits C in 'cookie' and M in 'cookie_mask'.
138      * The rule will not be selected if M is 1 and B != C.  */
139     ovs_be64 cookie;
140     ovs_be64 cookie_mask;
141
142     /* Selection based on actions within a rule:
143      *
144      * If out_port != OFPP_ANY, selects only rules that output to out_port.
145      * If out_group != OFPG_ALL, select only rules that output to out_group. */
146     ofp_port_t out_port;
147     uint32_t out_group;
148
149     /* If true, collects only rules that are modifiable. */
150     bool include_hidden;
151     bool include_readonly;
152 };
153
154 static void rule_criteria_init(struct rule_criteria *, uint8_t table_id,
155                                const struct match *match, int priority,
156                                ovs_be64 cookie, ovs_be64 cookie_mask,
157                                ofp_port_t out_port, uint32_t out_group);
158 static void rule_criteria_require_rw(struct rule_criteria *,
159                                      bool can_write_readonly);
160 static void rule_criteria_destroy(struct rule_criteria *);
161
162 static enum ofperr collect_rules_loose(struct ofproto *,
163                                        const struct rule_criteria *,
164                                        struct rule_collection *);
165
166 /* A packet that needs to be passed to rule_execute().
167  *
168  * (We can't do this immediately from ofopgroup_complete() because that holds
169  * ofproto_mutex, which rule_execute() needs released.) */
170 struct rule_execute {
171     struct ovs_list list_node;  /* In struct ofproto's "rule_executes" list. */
172     struct rule *rule;          /* Owns a reference to the rule. */
173     ofp_port_t in_port;
174     struct dp_packet *packet;      /* Owns the packet. */
175 };
176
177 static void run_rule_executes(struct ofproto *) OVS_EXCLUDED(ofproto_mutex);
178 static void destroy_rule_executes(struct ofproto *);
179
180 struct learned_cookie {
181     union {
182         /* In struct ofproto's 'learned_cookies' hmap. */
183         struct hmap_node hmap_node OVS_GUARDED_BY(ofproto_mutex);
184
185         /* In 'dead_cookies' list when removed from hmap. */
186         struct ovs_list list_node;
187     } u;
188
189     /* Key. */
190     ovs_be64 cookie OVS_GUARDED_BY(ofproto_mutex);
191     uint8_t table_id OVS_GUARDED_BY(ofproto_mutex);
192
193     /* Number of references from "learn" actions.
194      *
195      * When this drops to 0, all of the flows in 'table_id' with the specified
196      * 'cookie' are deleted. */
197     int n OVS_GUARDED_BY(ofproto_mutex);
198 };
199
200 static const struct ofpact_learn *next_learn_with_delete(
201     const struct rule_actions *, const struct ofpact_learn *start);
202
203 static void learned_cookies_inc(struct ofproto *, const struct rule_actions *)
204     OVS_REQUIRES(ofproto_mutex);
205 static void learned_cookies_dec(struct ofproto *, const struct rule_actions *,
206                                 struct ovs_list *dead_cookies)
207     OVS_REQUIRES(ofproto_mutex);
208 static void learned_cookies_flush(struct ofproto *, struct ovs_list *dead_cookies)
209     OVS_REQUIRES(ofproto_mutex);
210
211 /* ofport. */
212 static void ofport_destroy__(struct ofport *) OVS_EXCLUDED(ofproto_mutex);
213 static void ofport_destroy(struct ofport *);
214
215 static void update_port(struct ofproto *, const char *devname);
216 static int init_ports(struct ofproto *);
217 static void reinit_ports(struct ofproto *);
218
219 static long long int ofport_get_usage(const struct ofproto *,
220                                       ofp_port_t ofp_port);
221 static void ofport_set_usage(struct ofproto *, ofp_port_t ofp_port,
222                              long long int last_used);
223 static void ofport_remove_usage(struct ofproto *, ofp_port_t ofp_port);
224
225 /* Ofport usage.
226  *
227  * Keeps track of the currently used and recently used ofport values and is
228  * used to prevent immediate recycling of ofport values. */
229 struct ofport_usage {
230     struct hmap_node hmap_node; /* In struct ofproto's "ofport_usage" hmap. */
231     ofp_port_t ofp_port;        /* OpenFlow port number. */
232     long long int last_used;    /* Last time the 'ofp_port' was used. LLONG_MAX
233                                    represents in-use ofports. */
234 };
235
236 /* rule. */
237 static void ofproto_rule_send_removed(struct rule *, uint8_t reason);
238 static bool rule_is_readonly(const struct rule *);
239 static void ofproto_rule_insert__(struct ofproto *, struct rule *)
240     OVS_REQUIRES(ofproto_mutex);
241 static void ofproto_rule_remove__(struct ofproto *, struct rule *)
242     OVS_REQUIRES(ofproto_mutex);
243
244 /* The source of a flow_mod request, in the code that processes flow_mods.
245  *
246  * A flow table modification request can be generated externally, via OpenFlow,
247  * or internally through a function call.  This structure indicates the source
248  * of an OpenFlow-generated flow_mod.  For an internal flow_mod, it isn't
249  * meaningful and thus supplied as NULL. */
250 struct flow_mod_requester {
251     struct ofconn *ofconn;      /* Connection on which flow_mod arrived. */
252     const struct ofp_header *request;
253 };
254
255 /* OpenFlow. */
256 static enum ofperr modify_flow_check__(struct ofproto *,
257                                        struct ofputil_flow_mod *,
258                                        const struct rule *)
259     OVS_REQUIRES(ofproto_mutex);
260 static void modify_flow__(struct ofproto *, struct ofputil_flow_mod *,
261                           const struct flow_mod_requester *, struct rule *,
262                           struct ovs_list *dead_cookies)
263     OVS_REQUIRES(ofproto_mutex);
264 static void delete_flows__(const struct rule_collection *,
265                            enum ofp_flow_removed_reason,
266                            const struct flow_mod_requester *)
267     OVS_REQUIRES(ofproto_mutex);
268
269 static void send_buffered_packet(const struct flow_mod_requester *,
270                                  uint32_t buffer_id, struct rule *)
271     OVS_REQUIRES(ofproto_mutex);
272
273 static bool ofproto_group_exists__(const struct ofproto *ofproto,
274                                    uint32_t group_id)
275     OVS_REQ_RDLOCK(ofproto->groups_rwlock);
276 static bool ofproto_group_exists(const struct ofproto *ofproto,
277                                  uint32_t group_id)
278     OVS_EXCLUDED(ofproto->groups_rwlock);
279 static enum ofperr add_group(struct ofproto *, struct ofputil_group_mod *);
280 static void handle_openflow(struct ofconn *, const struct ofpbuf *);
281 static enum ofperr do_bundle_flow_mod_begin(struct ofproto *,
282                                             struct ofputil_flow_mod *,
283                                             struct ofp_bundle_entry *)
284     OVS_REQUIRES(ofproto_mutex);
285 static void do_bundle_flow_mod_finish(struct ofproto *,
286                                       struct ofputil_flow_mod *,
287                                       const struct flow_mod_requester *,
288                                       struct ofp_bundle_entry *)
289     OVS_REQUIRES(ofproto_mutex);
290 static enum ofperr handle_flow_mod__(struct ofproto *,
291                                      struct ofputil_flow_mod *,
292                                      const struct flow_mod_requester *)
293     OVS_EXCLUDED(ofproto_mutex);
294 static void calc_duration(long long int start, long long int now,
295                           uint32_t *sec, uint32_t *nsec);
296
297 /* ofproto. */
298 static uint64_t pick_datapath_id(const struct ofproto *);
299 static uint64_t pick_fallback_dpid(void);
300 static void ofproto_destroy__(struct ofproto *);
301 static void update_mtu(struct ofproto *, struct ofport *);
302 static void meter_delete(struct ofproto *, uint32_t first, uint32_t last);
303 static void meter_insert_rule(struct rule *);
304
305 /* unixctl. */
306 static void ofproto_unixctl_init(void);
307
308 /* All registered ofproto classes, in probe order. */
309 static const struct ofproto_class **ofproto_classes;
310 static size_t n_ofproto_classes;
311 static size_t allocated_ofproto_classes;
312
313 /* Global lock that protects all flow table operations. */
314 struct ovs_mutex ofproto_mutex = OVS_MUTEX_INITIALIZER;
315
316 unsigned ofproto_flow_limit = OFPROTO_FLOW_LIMIT_DEFAULT;
317 unsigned ofproto_max_idle = OFPROTO_MAX_IDLE_DEFAULT;
318
319 size_t n_handlers, n_revalidators;
320 size_t n_dpdk_rxqs;
321 char *pmd_cpu_mask;
322
323 /* Map from datapath name to struct ofproto, for use by unixctl commands. */
324 static struct hmap all_ofprotos = HMAP_INITIALIZER(&all_ofprotos);
325
326 /* Initial mappings of port to OpenFlow number mappings. */
327 static struct shash init_ofp_ports = SHASH_INITIALIZER(&init_ofp_ports);
328
329 static struct vlog_rate_limit rl = VLOG_RATE_LIMIT_INIT(1, 5);
330
331 /* The default value of true waits for flow restore. */
332 static bool flow_restore_wait = true;
333
334 /* Must be called to initialize the ofproto library.
335  *
336  * The caller may pass in 'iface_hints', which contains an shash of
337  * "iface_hint" elements indexed by the interface's name.  The provider
338  * may use these hints to describe the startup configuration in order to
339  * reinitialize its state.  The caller owns the provided data, so a
340  * provider will make copies of anything required.  An ofproto provider
341  * will remove any existing state that is not described by the hint, and
342  * may choose to remove it all. */
343 void
344 ofproto_init(const struct shash *iface_hints)
345 {
346     struct shash_node *node;
347     size_t i;
348
349     ofproto_class_register(&ofproto_dpif_class);
350
351     /* Make a local copy, since we don't own 'iface_hints' elements. */
352     SHASH_FOR_EACH(node, iface_hints) {
353         const struct iface_hint *orig_hint = node->data;
354         struct iface_hint *new_hint = xmalloc(sizeof *new_hint);
355         const char *br_type = ofproto_normalize_type(orig_hint->br_type);
356
357         new_hint->br_name = xstrdup(orig_hint->br_name);
358         new_hint->br_type = xstrdup(br_type);
359         new_hint->ofp_port = orig_hint->ofp_port;
360
361         shash_add(&init_ofp_ports, node->name, new_hint);
362     }
363
364     for (i = 0; i < n_ofproto_classes; i++) {
365         ofproto_classes[i]->init(&init_ofp_ports);
366     }
367 }
368
369 /* 'type' should be a normalized datapath type, as returned by
370  * ofproto_normalize_type().  Returns the corresponding ofproto_class
371  * structure, or a null pointer if there is none registered for 'type'. */
372 static const struct ofproto_class *
373 ofproto_class_find__(const char *type)
374 {
375     size_t i;
376
377     for (i = 0; i < n_ofproto_classes; i++) {
378         const struct ofproto_class *class = ofproto_classes[i];
379         struct sset types;
380         bool found;
381
382         sset_init(&types);
383         class->enumerate_types(&types);
384         found = sset_contains(&types, type);
385         sset_destroy(&types);
386
387         if (found) {
388             return class;
389         }
390     }
391     VLOG_WARN("unknown datapath type %s", type);
392     return NULL;
393 }
394
395 /* Registers a new ofproto class.  After successful registration, new ofprotos
396  * of that type can be created using ofproto_create(). */
397 int
398 ofproto_class_register(const struct ofproto_class *new_class)
399 {
400     size_t i;
401
402     for (i = 0; i < n_ofproto_classes; i++) {
403         if (ofproto_classes[i] == new_class) {
404             return EEXIST;
405         }
406     }
407
408     if (n_ofproto_classes >= allocated_ofproto_classes) {
409         ofproto_classes = x2nrealloc(ofproto_classes,
410                                      &allocated_ofproto_classes,
411                                      sizeof *ofproto_classes);
412     }
413     ofproto_classes[n_ofproto_classes++] = new_class;
414     return 0;
415 }
416
417 /* Unregisters a datapath provider.  'type' must have been previously
418  * registered and not currently be in use by any ofprotos.  After
419  * unregistration new datapaths of that type cannot be opened using
420  * ofproto_create(). */
421 int
422 ofproto_class_unregister(const struct ofproto_class *class)
423 {
424     size_t i;
425
426     for (i = 0; i < n_ofproto_classes; i++) {
427         if (ofproto_classes[i] == class) {
428             for (i++; i < n_ofproto_classes; i++) {
429                 ofproto_classes[i - 1] = ofproto_classes[i];
430             }
431             n_ofproto_classes--;
432             return 0;
433         }
434     }
435     VLOG_WARN("attempted to unregister an ofproto class that is not "
436               "registered");
437     return EAFNOSUPPORT;
438 }
439
440 /* Clears 'types' and enumerates all registered ofproto types into it.  The
441  * caller must first initialize the sset. */
442 void
443 ofproto_enumerate_types(struct sset *types)
444 {
445     size_t i;
446
447     sset_clear(types);
448     for (i = 0; i < n_ofproto_classes; i++) {
449         ofproto_classes[i]->enumerate_types(types);
450     }
451 }
452
453 /* Returns the fully spelled out name for the given ofproto 'type'.
454  *
455  * Normalized type string can be compared with strcmp().  Unnormalized type
456  * string might be the same even if they have different spellings. */
457 const char *
458 ofproto_normalize_type(const char *type)
459 {
460     return type && type[0] ? type : "system";
461 }
462
463 /* Clears 'names' and enumerates the names of all known created ofprotos with
464  * the given 'type'.  The caller must first initialize the sset.  Returns 0 if
465  * successful, otherwise a positive errno value.
466  *
467  * Some kinds of datapaths might not be practically enumerable.  This is not
468  * considered an error. */
469 int
470 ofproto_enumerate_names(const char *type, struct sset *names)
471 {
472     const struct ofproto_class *class = ofproto_class_find__(type);
473     return class ? class->enumerate_names(type, names) : EAFNOSUPPORT;
474 }
475
476 int
477 ofproto_create(const char *datapath_name, const char *datapath_type,
478                struct ofproto **ofprotop)
479 {
480     const struct ofproto_class *class;
481     struct ofproto *ofproto;
482     int error;
483     int i;
484
485     *ofprotop = NULL;
486
487     ofproto_unixctl_init();
488
489     datapath_type = ofproto_normalize_type(datapath_type);
490     class = ofproto_class_find__(datapath_type);
491     if (!class) {
492         VLOG_WARN("could not create datapath %s of unknown type %s",
493                   datapath_name, datapath_type);
494         return EAFNOSUPPORT;
495     }
496
497     ofproto = class->alloc();
498     if (!ofproto) {
499         VLOG_ERR("failed to allocate datapath %s of type %s",
500                  datapath_name, datapath_type);
501         return ENOMEM;
502     }
503
504     /* Initialize. */
505     ovs_mutex_lock(&ofproto_mutex);
506     memset(ofproto, 0, sizeof *ofproto);
507     ofproto->ofproto_class = class;
508     ofproto->name = xstrdup(datapath_name);
509     ofproto->type = xstrdup(datapath_type);
510     hmap_insert(&all_ofprotos, &ofproto->hmap_node,
511                 hash_string(ofproto->name, 0));
512     ofproto->datapath_id = 0;
513     ofproto->forward_bpdu = false;
514     ofproto->fallback_dpid = pick_fallback_dpid();
515     ofproto->mfr_desc = NULL;
516     ofproto->hw_desc = NULL;
517     ofproto->sw_desc = NULL;
518     ofproto->serial_desc = NULL;
519     ofproto->dp_desc = NULL;
520     ofproto->frag_handling = OFPC_FRAG_NORMAL;
521     hmap_init(&ofproto->ports);
522     hmap_init(&ofproto->ofport_usage);
523     shash_init(&ofproto->port_by_name);
524     simap_init(&ofproto->ofp_requests);
525     ofproto->max_ports = ofp_to_u16(OFPP_MAX);
526     ofproto->eviction_group_timer = LLONG_MIN;
527     ofproto->tables = NULL;
528     ofproto->n_tables = 0;
529     hindex_init(&ofproto->cookies);
530     hmap_init(&ofproto->learned_cookies);
531     list_init(&ofproto->expirable);
532     ofproto->connmgr = connmgr_create(ofproto, datapath_name, datapath_name);
533     guarded_list_init(&ofproto->rule_executes);
534     ofproto->vlan_bitmap = NULL;
535     ofproto->vlans_changed = false;
536     ofproto->min_mtu = INT_MAX;
537     ovs_rwlock_init(&ofproto->groups_rwlock);
538     hmap_init(&ofproto->groups);
539     ovs_mutex_unlock(&ofproto_mutex);
540     ofproto->ogf.types = 0xf;
541     ofproto->ogf.capabilities = OFPGFC_CHAINING | OFPGFC_SELECT_LIVENESS |
542                                 OFPGFC_SELECT_WEIGHT;
543     for (i = 0; i < 4; i++) {
544         ofproto->ogf.max_groups[i] = OFPG_MAX;
545         ofproto->ogf.ofpacts[i] = (UINT64_C(1) << N_OFPACTS) - 1;
546     }
547
548     error = ofproto->ofproto_class->construct(ofproto);
549     if (error) {
550         VLOG_ERR("failed to open datapath %s: %s",
551                  datapath_name, ovs_strerror(error));
552         connmgr_destroy(ofproto->connmgr);
553         ofproto_destroy__(ofproto);
554         return error;
555     }
556
557     /* Check that hidden tables, if any, are at the end. */
558     ovs_assert(ofproto->n_tables);
559     for (i = 0; i + 1 < ofproto->n_tables; i++) {
560         enum oftable_flags flags = ofproto->tables[i].flags;
561         enum oftable_flags next_flags = ofproto->tables[i + 1].flags;
562
563         ovs_assert(!(flags & OFTABLE_HIDDEN) || next_flags & OFTABLE_HIDDEN);
564     }
565
566     ofproto->datapath_id = pick_datapath_id(ofproto);
567     init_ports(ofproto);
568
569     /* Initialize meters table. */
570     if (ofproto->ofproto_class->meter_get_features) {
571         ofproto->ofproto_class->meter_get_features(ofproto,
572                                                    &ofproto->meter_features);
573     } else {
574         memset(&ofproto->meter_features, 0, sizeof ofproto->meter_features);
575     }
576     ofproto->meters = xzalloc((ofproto->meter_features.max_meters + 1)
577                               * sizeof(struct meter *));
578
579     *ofprotop = ofproto;
580     return 0;
581 }
582
583 /* Must be called (only) by an ofproto implementation in its constructor
584  * function.  See the large comment on 'construct' in struct ofproto_class for
585  * details. */
586 void
587 ofproto_init_tables(struct ofproto *ofproto, int n_tables)
588 {
589     struct oftable *table;
590
591     ovs_assert(!ofproto->n_tables);
592     ovs_assert(n_tables >= 1 && n_tables <= 255);
593
594     ofproto->n_tables = n_tables;
595     ofproto->tables = xmalloc(n_tables * sizeof *ofproto->tables);
596     OFPROTO_FOR_EACH_TABLE (table, ofproto) {
597         oftable_init(table);
598     }
599 }
600
601 /* To be optionally called (only) by an ofproto implementation in its
602  * constructor function.  See the large comment on 'construct' in struct
603  * ofproto_class for details.
604  *
605  * Sets the maximum number of ports to 'max_ports'.  The ofproto generic layer
606  * will then ensure that actions passed into the ofproto implementation will
607  * not refer to OpenFlow ports numbered 'max_ports' or higher.  If this
608  * function is not called, there will be no such restriction.
609  *
610  * Reserved ports numbered OFPP_MAX and higher are special and not subject to
611  * the 'max_ports' restriction. */
612 void
613 ofproto_init_max_ports(struct ofproto *ofproto, uint16_t max_ports)
614 {
615     ovs_assert(max_ports <= ofp_to_u16(OFPP_MAX));
616     ofproto->max_ports = max_ports;
617 }
618
619 uint64_t
620 ofproto_get_datapath_id(const struct ofproto *ofproto)
621 {
622     return ofproto->datapath_id;
623 }
624
625 void
626 ofproto_set_datapath_id(struct ofproto *p, uint64_t datapath_id)
627 {
628     uint64_t old_dpid = p->datapath_id;
629     p->datapath_id = datapath_id ? datapath_id : pick_datapath_id(p);
630     if (p->datapath_id != old_dpid) {
631         /* Force all active connections to reconnect, since there is no way to
632          * notify a controller that the datapath ID has changed. */
633         ofproto_reconnect_controllers(p);
634     }
635 }
636
637 void
638 ofproto_set_controllers(struct ofproto *p,
639                         const struct ofproto_controller *controllers,
640                         size_t n_controllers, uint32_t allowed_versions)
641 {
642     connmgr_set_controllers(p->connmgr, controllers, n_controllers,
643                             allowed_versions);
644 }
645
646 void
647 ofproto_set_fail_mode(struct ofproto *p, enum ofproto_fail_mode fail_mode)
648 {
649     connmgr_set_fail_mode(p->connmgr, fail_mode);
650 }
651
652 /* Drops the connections between 'ofproto' and all of its controllers, forcing
653  * them to reconnect. */
654 void
655 ofproto_reconnect_controllers(struct ofproto *ofproto)
656 {
657     connmgr_reconnect(ofproto->connmgr);
658 }
659
660 /* Sets the 'n' TCP port addresses in 'extras' as ones to which 'ofproto''s
661  * in-band control should guarantee access, in the same way that in-band
662  * control guarantees access to OpenFlow controllers. */
663 void
664 ofproto_set_extra_in_band_remotes(struct ofproto *ofproto,
665                                   const struct sockaddr_in *extras, size_t n)
666 {
667     connmgr_set_extra_in_band_remotes(ofproto->connmgr, extras, n);
668 }
669
670 /* Sets the OpenFlow queue used by flows set up by in-band control on
671  * 'ofproto' to 'queue_id'.  If 'queue_id' is negative, then in-band control
672  * flows will use the default queue. */
673 void
674 ofproto_set_in_band_queue(struct ofproto *ofproto, int queue_id)
675 {
676     connmgr_set_in_band_queue(ofproto->connmgr, queue_id);
677 }
678
679 /* Sets the number of flows at which eviction from the kernel flow table
680  * will occur. */
681 void
682 ofproto_set_flow_limit(unsigned limit)
683 {
684     ofproto_flow_limit = limit;
685 }
686
687 /* Sets the maximum idle time for flows in the datapath before they are
688  * expired. */
689 void
690 ofproto_set_max_idle(unsigned max_idle)
691 {
692     ofproto_max_idle = max_idle;
693 }
694
695 /* If forward_bpdu is true, the NORMAL action will forward frames with
696  * reserved (e.g. STP) destination Ethernet addresses. if forward_bpdu is false,
697  * the NORMAL action will drop these frames. */
698 void
699 ofproto_set_forward_bpdu(struct ofproto *ofproto, bool forward_bpdu)
700 {
701     bool old_val = ofproto->forward_bpdu;
702     ofproto->forward_bpdu = forward_bpdu;
703     if (old_val != ofproto->forward_bpdu) {
704         if (ofproto->ofproto_class->forward_bpdu_changed) {
705             ofproto->ofproto_class->forward_bpdu_changed(ofproto);
706         }
707     }
708 }
709
710 /* Sets the MAC aging timeout for the OFPP_NORMAL action on 'ofproto' to
711  * 'idle_time', in seconds, and the maximum number of MAC table entries to
712  * 'max_entries'. */
713 void
714 ofproto_set_mac_table_config(struct ofproto *ofproto, unsigned idle_time,
715                              size_t max_entries)
716 {
717     if (ofproto->ofproto_class->set_mac_table_config) {
718         ofproto->ofproto_class->set_mac_table_config(ofproto, idle_time,
719                                                      max_entries);
720     }
721 }
722
723 /* Multicast snooping configuration. */
724
725 /* Configures multicast snooping on 'ofproto' using the settings
726  * defined in 's'.  If 's' is NULL, disables multicast snooping.
727  *
728  * Returns 0 if successful, otherwise a positive errno value. */
729 int
730 ofproto_set_mcast_snooping(struct ofproto *ofproto,
731                            const struct ofproto_mcast_snooping_settings *s)
732 {
733     return (ofproto->ofproto_class->set_mcast_snooping
734             ? ofproto->ofproto_class->set_mcast_snooping(ofproto, s)
735             : EOPNOTSUPP);
736 }
737
738 /* Configures multicast snooping flood settings on 'ofp_port' of 'ofproto'.
739  *
740  * Returns 0 if successful, otherwise a positive errno value.*/
741 int
742 ofproto_port_set_mcast_snooping(struct ofproto *ofproto, void *aux,
743                            const struct ofproto_mcast_snooping_port_settings *s)
744 {
745     return (ofproto->ofproto_class->set_mcast_snooping_port
746             ? ofproto->ofproto_class->set_mcast_snooping_port(ofproto, aux, s)
747             : EOPNOTSUPP);
748 }
749
750 void
751 ofproto_set_n_dpdk_rxqs(int n_rxqs)
752 {
753     n_dpdk_rxqs = MAX(n_rxqs, 0);
754 }
755
756 void
757 ofproto_set_cpu_mask(const char *cmask)
758 {
759     free(pmd_cpu_mask);
760
761     pmd_cpu_mask = cmask ? xstrdup(cmask) : NULL;
762 }
763
764 void
765 ofproto_set_threads(int n_handlers_, int n_revalidators_)
766 {
767     int threads = MAX(count_cpu_cores(), 2);
768
769     n_revalidators = MAX(n_revalidators_, 0);
770     n_handlers = MAX(n_handlers_, 0);
771
772     if (!n_revalidators) {
773         n_revalidators = n_handlers
774             ? MAX(threads - (int) n_handlers, 1)
775             : threads / 4 + 1;
776     }
777
778     if (!n_handlers) {
779         n_handlers = MAX(threads - (int) n_revalidators, 1);
780     }
781 }
782
783 void
784 ofproto_set_dp_desc(struct ofproto *p, const char *dp_desc)
785 {
786     free(p->dp_desc);
787     p->dp_desc = dp_desc ? xstrdup(dp_desc) : NULL;
788 }
789
790 int
791 ofproto_set_snoops(struct ofproto *ofproto, const struct sset *snoops)
792 {
793     return connmgr_set_snoops(ofproto->connmgr, snoops);
794 }
795
796 int
797 ofproto_set_netflow(struct ofproto *ofproto,
798                     const struct netflow_options *nf_options)
799 {
800     if (nf_options && sset_is_empty(&nf_options->collectors)) {
801         nf_options = NULL;
802     }
803
804     if (ofproto->ofproto_class->set_netflow) {
805         return ofproto->ofproto_class->set_netflow(ofproto, nf_options);
806     } else {
807         return nf_options ? EOPNOTSUPP : 0;
808     }
809 }
810
811 int
812 ofproto_set_sflow(struct ofproto *ofproto,
813                   const struct ofproto_sflow_options *oso)
814 {
815     if (oso && sset_is_empty(&oso->targets)) {
816         oso = NULL;
817     }
818
819     if (ofproto->ofproto_class->set_sflow) {
820         return ofproto->ofproto_class->set_sflow(ofproto, oso);
821     } else {
822         return oso ? EOPNOTSUPP : 0;
823     }
824 }
825
826 int
827 ofproto_set_ipfix(struct ofproto *ofproto,
828                   const struct ofproto_ipfix_bridge_exporter_options *bo,
829                   const struct ofproto_ipfix_flow_exporter_options *fo,
830                   size_t n_fo)
831 {
832     if (ofproto->ofproto_class->set_ipfix) {
833         return ofproto->ofproto_class->set_ipfix(ofproto, bo, fo, n_fo);
834     } else {
835         return (bo || fo) ? EOPNOTSUPP : 0;
836     }
837 }
838
839 void
840 ofproto_set_flow_restore_wait(bool flow_restore_wait_db)
841 {
842     flow_restore_wait = flow_restore_wait_db;
843 }
844
845 bool
846 ofproto_get_flow_restore_wait(void)
847 {
848     return flow_restore_wait;
849 }
850
851 \f
852 /* Spanning Tree Protocol (STP) configuration. */
853
854 /* Configures STP on 'ofproto' using the settings defined in 's'.  If
855  * 's' is NULL, disables STP.
856  *
857  * Returns 0 if successful, otherwise a positive errno value. */
858 int
859 ofproto_set_stp(struct ofproto *ofproto,
860                 const struct ofproto_stp_settings *s)
861 {
862     return (ofproto->ofproto_class->set_stp
863             ? ofproto->ofproto_class->set_stp(ofproto, s)
864             : EOPNOTSUPP);
865 }
866
867 /* Retrieves STP status of 'ofproto' and stores it in 's'.  If the
868  * 'enabled' member of 's' is false, then the other members are not
869  * meaningful.
870  *
871  * Returns 0 if successful, otherwise a positive errno value. */
872 int
873 ofproto_get_stp_status(struct ofproto *ofproto,
874                        struct ofproto_stp_status *s)
875 {
876     return (ofproto->ofproto_class->get_stp_status
877             ? ofproto->ofproto_class->get_stp_status(ofproto, s)
878             : EOPNOTSUPP);
879 }
880
881 /* Configures STP on 'ofp_port' of 'ofproto' using the settings defined
882  * in 's'.  The caller is responsible for assigning STP port numbers
883  * (using the 'port_num' member in the range of 1 through 255, inclusive)
884  * and ensuring there are no duplicates.  If the 's' is NULL, then STP
885  * is disabled on the port.
886  *
887  * Returns 0 if successful, otherwise a positive errno value.*/
888 int
889 ofproto_port_set_stp(struct ofproto *ofproto, ofp_port_t ofp_port,
890                      const struct ofproto_port_stp_settings *s)
891 {
892     struct ofport *ofport = ofproto_get_port(ofproto, ofp_port);
893     if (!ofport) {
894         VLOG_WARN("%s: cannot configure STP on nonexistent port %"PRIu16,
895                   ofproto->name, ofp_port);
896         return ENODEV;
897     }
898
899     return (ofproto->ofproto_class->set_stp_port
900             ? ofproto->ofproto_class->set_stp_port(ofport, s)
901             : EOPNOTSUPP);
902 }
903
904 /* Retrieves STP port status of 'ofp_port' on 'ofproto' and stores it in
905  * 's'.  If the 'enabled' member in 's' is false, then the other members
906  * are not meaningful.
907  *
908  * Returns 0 if successful, otherwise a positive errno value.*/
909 int
910 ofproto_port_get_stp_status(struct ofproto *ofproto, ofp_port_t ofp_port,
911                             struct ofproto_port_stp_status *s)
912 {
913     struct ofport *ofport = ofproto_get_port(ofproto, ofp_port);
914     if (!ofport) {
915         VLOG_WARN_RL(&rl, "%s: cannot get STP status on nonexistent "
916                      "port %"PRIu16, ofproto->name, ofp_port);
917         return ENODEV;
918     }
919
920     return (ofproto->ofproto_class->get_stp_port_status
921             ? ofproto->ofproto_class->get_stp_port_status(ofport, s)
922             : EOPNOTSUPP);
923 }
924
925 /* Retrieves STP port statistics of 'ofp_port' on 'ofproto' and stores it in
926  * 's'.  If the 'enabled' member in 's' is false, then the other members
927  * are not meaningful.
928  *
929  * Returns 0 if successful, otherwise a positive errno value.*/
930 int
931 ofproto_port_get_stp_stats(struct ofproto *ofproto, ofp_port_t ofp_port,
932                            struct ofproto_port_stp_stats *s)
933 {
934     struct ofport *ofport = ofproto_get_port(ofproto, ofp_port);
935     if (!ofport) {
936         VLOG_WARN_RL(&rl, "%s: cannot get STP stats on nonexistent "
937                      "port %"PRIu16, ofproto->name, ofp_port);
938         return ENODEV;
939     }
940
941     return (ofproto->ofproto_class->get_stp_port_stats
942             ? ofproto->ofproto_class->get_stp_port_stats(ofport, s)
943             : EOPNOTSUPP);
944 }
945
946 /* Rapid Spanning Tree Protocol (RSTP) configuration. */
947
948 /* Configures RSTP on 'ofproto' using the settings defined in 's'.  If
949  * 's' is NULL, disables RSTP.
950  *
951  * Returns 0 if successful, otherwise a positive errno value. */
952 int
953 ofproto_set_rstp(struct ofproto *ofproto,
954                  const struct ofproto_rstp_settings *s)
955 {
956     if (!ofproto->ofproto_class->set_rstp) {
957         return EOPNOTSUPP;
958     }
959     ofproto->ofproto_class->set_rstp(ofproto, s);
960     return 0;
961 }
962
963 /* Retrieves RSTP status of 'ofproto' and stores it in 's'.  If the
964  * 'enabled' member of 's' is false, then the other members are not
965  * meaningful.
966  *
967  * Returns 0 if successful, otherwise a positive errno value. */
968 int
969 ofproto_get_rstp_status(struct ofproto *ofproto,
970                         struct ofproto_rstp_status *s)
971 {
972     if (!ofproto->ofproto_class->get_rstp_status) {
973         return EOPNOTSUPP;
974     }
975     ofproto->ofproto_class->get_rstp_status(ofproto, s);
976     return 0;
977 }
978
979 /* Configures RSTP on 'ofp_port' of 'ofproto' using the settings defined
980  * in 's'.  The caller is responsible for assigning RSTP port numbers
981  * (using the 'port_num' member in the range of 1 through 255, inclusive)
982  * and ensuring there are no duplicates.  If the 's' is NULL, then RSTP
983  * is disabled on the port.
984  *
985  * Returns 0 if successful, otherwise a positive errno value.*/
986 int
987 ofproto_port_set_rstp(struct ofproto *ofproto, ofp_port_t ofp_port,
988                       const struct ofproto_port_rstp_settings *s)
989 {
990     struct ofport *ofport = ofproto_get_port(ofproto, ofp_port);
991     if (!ofport) {
992         VLOG_WARN("%s: cannot configure RSTP on nonexistent port %"PRIu16,
993                 ofproto->name, ofp_port);
994         return ENODEV;
995     }
996
997     if (!ofproto->ofproto_class->set_rstp_port) {
998         return  EOPNOTSUPP;
999     }
1000     ofproto->ofproto_class->set_rstp_port(ofport, s);
1001     return 0;
1002 }
1003
1004 /* Retrieves RSTP port status of 'ofp_port' on 'ofproto' and stores it in
1005  * 's'.  If the 'enabled' member in 's' is false, then the other members
1006  * are not meaningful.
1007  *
1008  * Returns 0 if successful, otherwise a positive errno value.*/
1009 int
1010 ofproto_port_get_rstp_status(struct ofproto *ofproto, ofp_port_t ofp_port,
1011                              struct ofproto_port_rstp_status *s)
1012 {
1013     struct ofport *ofport = ofproto_get_port(ofproto, ofp_port);
1014     if (!ofport) {
1015         VLOG_WARN_RL(&rl, "%s: cannot get RSTP status on nonexistent "
1016                 "port %"PRIu16, ofproto->name, ofp_port);
1017         return ENODEV;
1018     }
1019
1020     if (!ofproto->ofproto_class->get_rstp_port_status) {
1021         return  EOPNOTSUPP;
1022     }
1023     ofproto->ofproto_class->get_rstp_port_status(ofport, s);
1024     return 0;
1025 }
1026 \f
1027 /* Queue DSCP configuration. */
1028
1029 /* Registers meta-data associated with the 'n_qdscp' Qualities of Service
1030  * 'queues' attached to 'ofport'.  This data is not intended to be sufficient
1031  * to implement QoS.  Instead, it is used to implement features which require
1032  * knowledge of what queues exist on a port, and some basic information about
1033  * them.
1034  *
1035  * Returns 0 if successful, otherwise a positive errno value. */
1036 int
1037 ofproto_port_set_queues(struct ofproto *ofproto, ofp_port_t ofp_port,
1038                         const struct ofproto_port_queue *queues,
1039                         size_t n_queues)
1040 {
1041     struct ofport *ofport = ofproto_get_port(ofproto, ofp_port);
1042
1043     if (!ofport) {
1044         VLOG_WARN("%s: cannot set queues on nonexistent port %"PRIu16,
1045                   ofproto->name, ofp_port);
1046         return ENODEV;
1047     }
1048
1049     return (ofproto->ofproto_class->set_queues
1050             ? ofproto->ofproto_class->set_queues(ofport, queues, n_queues)
1051             : EOPNOTSUPP);
1052 }
1053 \f
1054 /* LLDP configuration. */
1055 void
1056 ofproto_port_set_lldp(struct ofproto *ofproto,
1057                       ofp_port_t ofp_port,
1058                       const struct smap *cfg)
1059 {
1060     struct ofport *ofport;
1061     int error;
1062
1063     ofport = ofproto_get_port(ofproto, ofp_port);
1064     if (!ofport) {
1065         VLOG_WARN("%s: cannot configure LLDP on nonexistent port %"PRIu16,
1066                   ofproto->name, ofp_port);
1067         return;
1068     }
1069     error = (ofproto->ofproto_class->set_lldp
1070              ? ofproto->ofproto_class->set_lldp(ofport, cfg)
1071              : EOPNOTSUPP);
1072     if (error) {
1073         VLOG_WARN("%s: lldp configuration on port %"PRIu16" (%s) failed (%s)",
1074                   ofproto->name, ofp_port, netdev_get_name(ofport->netdev),
1075                   ovs_strerror(error));
1076     }
1077 }
1078
1079 int
1080 ofproto_set_aa(struct ofproto *ofproto, void *aux OVS_UNUSED,
1081                const struct aa_settings *s)
1082 {
1083     if (!ofproto->ofproto_class->set_aa) {
1084         return EOPNOTSUPP;
1085     }
1086     ofproto->ofproto_class->set_aa(ofproto, s);
1087     return 0;
1088 }
1089
1090 int
1091 ofproto_aa_mapping_register(struct ofproto *ofproto, void *aux,
1092                             const struct aa_mapping_settings *s)
1093 {
1094     if (!ofproto->ofproto_class->aa_mapping_set) {
1095         return EOPNOTSUPP;
1096     }
1097     ofproto->ofproto_class->aa_mapping_set(ofproto, aux, s);
1098     return 0;
1099 }
1100
1101 int
1102 ofproto_aa_mapping_unregister(struct ofproto *ofproto, void *aux)
1103 {
1104     if (!ofproto->ofproto_class->aa_mapping_unset) {
1105         return EOPNOTSUPP;
1106     }
1107     ofproto->ofproto_class->aa_mapping_unset(ofproto, aux);
1108     return 0;
1109 }
1110
1111 int
1112 ofproto_aa_vlan_get_queued(struct ofproto *ofproto,
1113                            struct ovs_list *list)
1114 {
1115     if (!ofproto->ofproto_class->aa_vlan_get_queued) {
1116         return EOPNOTSUPP;
1117     }
1118     ofproto->ofproto_class->aa_vlan_get_queued(ofproto, list);
1119     return 0;
1120 }
1121
1122 unsigned int
1123 ofproto_aa_vlan_get_queue_size(struct ofproto *ofproto)
1124 {
1125     if (!ofproto->ofproto_class->aa_vlan_get_queue_size) {
1126         return EOPNOTSUPP;
1127     }
1128     return ofproto->ofproto_class->aa_vlan_get_queue_size(ofproto);
1129 }
1130
1131 /* Connectivity Fault Management configuration. */
1132
1133 /* Clears the CFM configuration from 'ofp_port' on 'ofproto'. */
1134 void
1135 ofproto_port_clear_cfm(struct ofproto *ofproto, ofp_port_t ofp_port)
1136 {
1137     struct ofport *ofport = ofproto_get_port(ofproto, ofp_port);
1138     if (ofport && ofproto->ofproto_class->set_cfm) {
1139         ofproto->ofproto_class->set_cfm(ofport, NULL);
1140     }
1141 }
1142
1143 /* Configures connectivity fault management on 'ofp_port' in 'ofproto'.  Takes
1144  * basic configuration from the configuration members in 'cfm', and the remote
1145  * maintenance point ID from  remote_mpid.  Ignores the statistics members of
1146  * 'cfm'.
1147  *
1148  * This function has no effect if 'ofproto' does not have a port 'ofp_port'. */
1149 void
1150 ofproto_port_set_cfm(struct ofproto *ofproto, ofp_port_t ofp_port,
1151                      const struct cfm_settings *s)
1152 {
1153     struct ofport *ofport;
1154     int error;
1155
1156     ofport = ofproto_get_port(ofproto, ofp_port);
1157     if (!ofport) {
1158         VLOG_WARN("%s: cannot configure CFM on nonexistent port %"PRIu16,
1159                   ofproto->name, ofp_port);
1160         return;
1161     }
1162
1163     /* XXX: For configuration simplicity, we only support one remote_mpid
1164      * outside of the CFM module.  It's not clear if this is the correct long
1165      * term solution or not. */
1166     error = (ofproto->ofproto_class->set_cfm
1167              ? ofproto->ofproto_class->set_cfm(ofport, s)
1168              : EOPNOTSUPP);
1169     if (error) {
1170         VLOG_WARN("%s: CFM configuration on port %"PRIu16" (%s) failed (%s)",
1171                   ofproto->name, ofp_port, netdev_get_name(ofport->netdev),
1172                   ovs_strerror(error));
1173     }
1174 }
1175
1176 /* Configures BFD on 'ofp_port' in 'ofproto'.  This function has no effect if
1177  * 'ofproto' does not have a port 'ofp_port'. */
1178 void
1179 ofproto_port_set_bfd(struct ofproto *ofproto, ofp_port_t ofp_port,
1180                      const struct smap *cfg)
1181 {
1182     struct ofport *ofport;
1183     int error;
1184
1185     ofport = ofproto_get_port(ofproto, ofp_port);
1186     if (!ofport) {
1187         VLOG_WARN("%s: cannot configure bfd on nonexistent port %"PRIu16,
1188                   ofproto->name, ofp_port);
1189         return;
1190     }
1191
1192     error = (ofproto->ofproto_class->set_bfd
1193              ? ofproto->ofproto_class->set_bfd(ofport, cfg)
1194              : EOPNOTSUPP);
1195     if (error) {
1196         VLOG_WARN("%s: bfd configuration on port %"PRIu16" (%s) failed (%s)",
1197                   ofproto->name, ofp_port, netdev_get_name(ofport->netdev),
1198                   ovs_strerror(error));
1199     }
1200 }
1201
1202 /* Checks the status change of BFD on 'ofport'.
1203  *
1204  * Returns true if 'ofproto_class' does not support 'bfd_status_changed'. */
1205 bool
1206 ofproto_port_bfd_status_changed(struct ofproto *ofproto, ofp_port_t ofp_port)
1207 {
1208     struct ofport *ofport = ofproto_get_port(ofproto, ofp_port);
1209     return (ofport && ofproto->ofproto_class->bfd_status_changed
1210             ? ofproto->ofproto_class->bfd_status_changed(ofport)
1211             : true);
1212 }
1213
1214 /* Populates 'status' with the status of BFD on 'ofport'.  Returns 0 on
1215  * success.  Returns a positive errno otherwise.  Has no effect if 'ofp_port'
1216  * is not an OpenFlow port in 'ofproto'.
1217  *
1218  * The caller must provide and own '*status'. */
1219 int
1220 ofproto_port_get_bfd_status(struct ofproto *ofproto, ofp_port_t ofp_port,
1221                             struct smap *status)
1222 {
1223     struct ofport *ofport = ofproto_get_port(ofproto, ofp_port);
1224     return (ofport && ofproto->ofproto_class->get_bfd_status
1225             ? ofproto->ofproto_class->get_bfd_status(ofport, status)
1226             : EOPNOTSUPP);
1227 }
1228
1229 /* Checks the status of LACP negotiation for 'ofp_port' within ofproto.
1230  * Returns 1 if LACP partner information for 'ofp_port' is up-to-date,
1231  * 0 if LACP partner information is not current (generally indicating a
1232  * connectivity problem), or -1 if LACP is not enabled on 'ofp_port'. */
1233 int
1234 ofproto_port_is_lacp_current(struct ofproto *ofproto, ofp_port_t ofp_port)
1235 {
1236     struct ofport *ofport = ofproto_get_port(ofproto, ofp_port);
1237     return (ofport && ofproto->ofproto_class->port_is_lacp_current
1238             ? ofproto->ofproto_class->port_is_lacp_current(ofport)
1239             : -1);
1240 }
1241
1242 int
1243 ofproto_port_get_lacp_stats(const struct ofport *port, struct lacp_slave_stats *stats)
1244 {
1245     struct ofproto *ofproto = port->ofproto;
1246     int error;
1247
1248     if (ofproto->ofproto_class->port_get_lacp_stats) {
1249         error = ofproto->ofproto_class->port_get_lacp_stats(port, stats);
1250     } else {
1251         error = EOPNOTSUPP;
1252     }
1253
1254     return error;
1255 }
1256 \f
1257 /* Bundles. */
1258
1259 /* Registers a "bundle" associated with client data pointer 'aux' in 'ofproto'.
1260  * A bundle is the same concept as a Port in OVSDB, that is, it consists of one
1261  * or more "slave" devices (Interfaces, in OVSDB) along with a VLAN
1262  * configuration plus, if there is more than one slave, a bonding
1263  * configuration.
1264  *
1265  * If 'aux' is already registered then this function updates its configuration
1266  * to 's'.  Otherwise, this function registers a new bundle.
1267  *
1268  * Bundles only affect the NXAST_AUTOPATH action and output to the OFPP_NORMAL
1269  * port. */
1270 int
1271 ofproto_bundle_register(struct ofproto *ofproto, void *aux,
1272                         const struct ofproto_bundle_settings *s)
1273 {
1274     return (ofproto->ofproto_class->bundle_set
1275             ? ofproto->ofproto_class->bundle_set(ofproto, aux, s)
1276             : EOPNOTSUPP);
1277 }
1278
1279 /* Unregisters the bundle registered on 'ofproto' with auxiliary data 'aux'.
1280  * If no such bundle has been registered, this has no effect. */
1281 int
1282 ofproto_bundle_unregister(struct ofproto *ofproto, void *aux)
1283 {
1284     return ofproto_bundle_register(ofproto, aux, NULL);
1285 }
1286
1287 \f
1288 /* Registers a mirror associated with client data pointer 'aux' in 'ofproto'.
1289  * If 'aux' is already registered then this function updates its configuration
1290  * to 's'.  Otherwise, this function registers a new mirror. */
1291 int
1292 ofproto_mirror_register(struct ofproto *ofproto, void *aux,
1293                         const struct ofproto_mirror_settings *s)
1294 {
1295     return (ofproto->ofproto_class->mirror_set
1296             ? ofproto->ofproto_class->mirror_set(ofproto, aux, s)
1297             : EOPNOTSUPP);
1298 }
1299
1300 /* Unregisters the mirror registered on 'ofproto' with auxiliary data 'aux'.
1301  * If no mirror has been registered, this has no effect. */
1302 int
1303 ofproto_mirror_unregister(struct ofproto *ofproto, void *aux)
1304 {
1305     return ofproto_mirror_register(ofproto, aux, NULL);
1306 }
1307
1308 /* Retrieves statistics from mirror associated with client data pointer
1309  * 'aux' in 'ofproto'.  Stores packet and byte counts in 'packets' and
1310  * 'bytes', respectively.  If a particular counters is not supported,
1311  * the appropriate argument is set to UINT64_MAX.
1312  */
1313 int
1314 ofproto_mirror_get_stats(struct ofproto *ofproto, void *aux,
1315                          uint64_t *packets, uint64_t *bytes)
1316 {
1317     if (!ofproto->ofproto_class->mirror_get_stats) {
1318         *packets = *bytes = UINT64_MAX;
1319         return EOPNOTSUPP;
1320     }
1321
1322     return ofproto->ofproto_class->mirror_get_stats(ofproto, aux,
1323                                                     packets, bytes);
1324 }
1325
1326 /* Configures the VLANs whose bits are set to 1 in 'flood_vlans' as VLANs on
1327  * which all packets are flooded, instead of using MAC learning.  If
1328  * 'flood_vlans' is NULL, then MAC learning applies to all VLANs.
1329  *
1330  * Flood VLANs affect only the treatment of packets output to the OFPP_NORMAL
1331  * port. */
1332 int
1333 ofproto_set_flood_vlans(struct ofproto *ofproto, unsigned long *flood_vlans)
1334 {
1335     return (ofproto->ofproto_class->set_flood_vlans
1336             ? ofproto->ofproto_class->set_flood_vlans(ofproto, flood_vlans)
1337             : EOPNOTSUPP);
1338 }
1339
1340 /* Returns true if 'aux' is a registered bundle that is currently in use as the
1341  * output for a mirror. */
1342 bool
1343 ofproto_is_mirror_output_bundle(const struct ofproto *ofproto, void *aux)
1344 {
1345     return (ofproto->ofproto_class->is_mirror_output_bundle
1346             ? ofproto->ofproto_class->is_mirror_output_bundle(ofproto, aux)
1347             : false);
1348 }
1349 \f
1350 /* Configuration of OpenFlow tables. */
1351
1352 /* Returns the number of OpenFlow tables in 'ofproto'. */
1353 int
1354 ofproto_get_n_tables(const struct ofproto *ofproto)
1355 {
1356     return ofproto->n_tables;
1357 }
1358
1359 /* Returns the number of Controller visible OpenFlow tables
1360  * in 'ofproto'. This number will exclude Hidden tables.
1361  * This funtion's return value should be less or equal to that of
1362  * ofproto_get_n_tables() . */
1363 uint8_t
1364 ofproto_get_n_visible_tables(const struct ofproto *ofproto)
1365 {
1366     uint8_t n = ofproto->n_tables;
1367
1368     /* Count only non-hidden tables in the number of tables.  (Hidden tables,
1369      * if present, are always at the end.) */
1370     while(n && (ofproto->tables[n - 1].flags & OFTABLE_HIDDEN)) {
1371         n--;
1372     }
1373
1374     return n;
1375 }
1376
1377 /* Configures the OpenFlow table in 'ofproto' with id 'table_id' with the
1378  * settings from 's'.  'table_id' must be in the range 0 through the number of
1379  * OpenFlow tables in 'ofproto' minus 1, inclusive.
1380  *
1381  * For read-only tables, only the name may be configured. */
1382 void
1383 ofproto_configure_table(struct ofproto *ofproto, int table_id,
1384                         const struct ofproto_table_settings *s)
1385 {
1386     struct oftable *table;
1387
1388     ovs_assert(table_id >= 0 && table_id < ofproto->n_tables);
1389     table = &ofproto->tables[table_id];
1390
1391     oftable_set_name(table, s->name);
1392
1393     if (table->flags & OFTABLE_READONLY) {
1394         return;
1395     }
1396
1397     if (s->groups) {
1398         oftable_enable_eviction(table, s->groups, s->n_groups);
1399     } else {
1400         oftable_disable_eviction(table);
1401     }
1402
1403     table->max_flows = s->max_flows;
1404
1405     if (classifier_set_prefix_fields(&table->cls,
1406                                      s->prefix_fields, s->n_prefix_fields)) {
1407         /* XXX: Trigger revalidation. */
1408     }
1409
1410     ovs_mutex_lock(&ofproto_mutex);
1411     evict_rules_from_table(table, 0);
1412     ovs_mutex_unlock(&ofproto_mutex);
1413 }
1414 \f
1415 bool
1416 ofproto_has_snoops(const struct ofproto *ofproto)
1417 {
1418     return connmgr_has_snoops(ofproto->connmgr);
1419 }
1420
1421 void
1422 ofproto_get_snoops(const struct ofproto *ofproto, struct sset *snoops)
1423 {
1424     connmgr_get_snoops(ofproto->connmgr, snoops);
1425 }
1426
1427 /* Deletes 'rule' from 'ofproto'.
1428  *
1429  * Within an ofproto implementation, this function allows an ofproto
1430  * implementation to destroy any rules that remain when its ->destruct()
1431  * function is called.  This function is not suitable for use elsewhere in an
1432  * ofproto implementation.
1433  *
1434  * This function implements steps 4.4 and 4.5 in the section titled "Rule Life
1435  * Cycle" in ofproto-provider.h. */
1436 void
1437 ofproto_rule_delete(struct ofproto *ofproto, struct rule *rule)
1438     OVS_EXCLUDED(ofproto_mutex)
1439 {
1440     /* This skips the ofmonitor and flow-removed notifications because the
1441      * switch is being deleted and any OpenFlow channels have been or soon will
1442      * be killed. */
1443     ovs_mutex_lock(&ofproto_mutex);
1444     oftable_remove_rule(rule);
1445     ofproto->ofproto_class->rule_delete(rule);
1446     ovs_mutex_unlock(&ofproto_mutex);
1447 }
1448
1449 static void
1450 ofproto_flush__(struct ofproto *ofproto)
1451     OVS_EXCLUDED(ofproto_mutex)
1452 {
1453     struct oftable *table;
1454
1455     /* This will flush all datapath flows. */
1456     if (ofproto->ofproto_class->flush) {
1457         ofproto->ofproto_class->flush(ofproto);
1458     }
1459
1460     /* XXX: There is a small race window here, where new datapath flows can be
1461      * created by upcall handlers based on the existing flow table.  We can not
1462      * call ofproto class flush while holding 'ofproto_mutex' to prevent this,
1463      * as then we could deadlock on syncing with the handler threads waiting on
1464      * the same mutex. */
1465
1466     ovs_mutex_lock(&ofproto_mutex);
1467     OFPROTO_FOR_EACH_TABLE (table, ofproto) {
1468         struct rule_collection rules;
1469         struct rule *rule;
1470
1471         if (table->flags & OFTABLE_HIDDEN) {
1472             continue;
1473         }
1474
1475         rule_collection_init(&rules);
1476
1477         CLS_FOR_EACH (rule, cr, &table->cls) {
1478             rule_collection_add(&rules, rule);
1479         }
1480         delete_flows__(&rules, OFPRR_DELETE, NULL);
1481         rule_collection_destroy(&rules);
1482     }
1483     /* XXX: Concurrent handler threads may insert new learned flows based on
1484      * learn actions of the now deleted flows right after we release
1485      * 'ofproto_mutex'. */
1486     ovs_mutex_unlock(&ofproto_mutex);
1487 }
1488
1489 static void delete_group(struct ofproto *ofproto, uint32_t group_id);
1490
1491 static void
1492 ofproto_destroy__(struct ofproto *ofproto)
1493     OVS_EXCLUDED(ofproto_mutex)
1494 {
1495     struct oftable *table;
1496
1497     destroy_rule_executes(ofproto);
1498     delete_group(ofproto, OFPG_ALL);
1499
1500     guarded_list_destroy(&ofproto->rule_executes);
1501     ovs_rwlock_destroy(&ofproto->groups_rwlock);
1502     hmap_destroy(&ofproto->groups);
1503
1504     hmap_remove(&all_ofprotos, &ofproto->hmap_node);
1505     free(ofproto->name);
1506     free(ofproto->type);
1507     free(ofproto->mfr_desc);
1508     free(ofproto->hw_desc);
1509     free(ofproto->sw_desc);
1510     free(ofproto->serial_desc);
1511     free(ofproto->dp_desc);
1512     hmap_destroy(&ofproto->ports);
1513     hmap_destroy(&ofproto->ofport_usage);
1514     shash_destroy(&ofproto->port_by_name);
1515     simap_destroy(&ofproto->ofp_requests);
1516
1517     OFPROTO_FOR_EACH_TABLE (table, ofproto) {
1518         oftable_destroy(table);
1519     }
1520     free(ofproto->tables);
1521
1522     ovs_assert(hindex_is_empty(&ofproto->cookies));
1523     hindex_destroy(&ofproto->cookies);
1524
1525     ovs_assert(hmap_is_empty(&ofproto->learned_cookies));
1526     hmap_destroy(&ofproto->learned_cookies);
1527
1528     free(ofproto->vlan_bitmap);
1529
1530     ofproto->ofproto_class->dealloc(ofproto);
1531 }
1532
1533 void
1534 ofproto_destroy(struct ofproto *p)
1535     OVS_EXCLUDED(ofproto_mutex)
1536 {
1537     struct ofport *ofport, *next_ofport;
1538     struct ofport_usage *usage, *next_usage;
1539
1540     if (!p) {
1541         return;
1542     }
1543
1544     if (p->meters) {
1545         meter_delete(p, 1, p->meter_features.max_meters);
1546         p->meter_features.max_meters = 0;
1547         free(p->meters);
1548         p->meters = NULL;
1549     }
1550
1551     ofproto_flush__(p);
1552     HMAP_FOR_EACH_SAFE (ofport, next_ofport, hmap_node, &p->ports) {
1553         ofport_destroy(ofport);
1554     }
1555
1556     HMAP_FOR_EACH_SAFE (usage, next_usage, hmap_node, &p->ofport_usage) {
1557         hmap_remove(&p->ofport_usage, &usage->hmap_node);
1558         free(usage);
1559     }
1560
1561     p->ofproto_class->destruct(p);
1562
1563     /* We should not postpone this because it involves deleting a listening
1564      * socket which we may want to reopen soon. 'connmgr' should not be used
1565      * by other threads */
1566     connmgr_destroy(p->connmgr);
1567
1568     /* Destroying rules is deferred, must have 'ofproto' around for them. */
1569     ovsrcu_postpone(ofproto_destroy__, p);
1570 }
1571
1572 /* Destroys the datapath with the respective 'name' and 'type'.  With the Linux
1573  * kernel datapath, for example, this destroys the datapath in the kernel, and
1574  * with the netdev-based datapath, it tears down the data structures that
1575  * represent the datapath.
1576  *
1577  * The datapath should not be currently open as an ofproto. */
1578 int
1579 ofproto_delete(const char *name, const char *type)
1580 {
1581     const struct ofproto_class *class = ofproto_class_find__(type);
1582     return (!class ? EAFNOSUPPORT
1583             : !class->del ? EACCES
1584             : class->del(type, name));
1585 }
1586
1587 static void
1588 process_port_change(struct ofproto *ofproto, int error, char *devname)
1589 {
1590     if (error == ENOBUFS) {
1591         reinit_ports(ofproto);
1592     } else if (!error) {
1593         update_port(ofproto, devname);
1594         free(devname);
1595     }
1596 }
1597
1598 int
1599 ofproto_type_run(const char *datapath_type)
1600 {
1601     const struct ofproto_class *class;
1602     int error;
1603
1604     datapath_type = ofproto_normalize_type(datapath_type);
1605     class = ofproto_class_find__(datapath_type);
1606
1607     error = class->type_run ? class->type_run(datapath_type) : 0;
1608     if (error && error != EAGAIN) {
1609         VLOG_ERR_RL(&rl, "%s: type_run failed (%s)",
1610                     datapath_type, ovs_strerror(error));
1611     }
1612     return error;
1613 }
1614
1615 void
1616 ofproto_type_wait(const char *datapath_type)
1617 {
1618     const struct ofproto_class *class;
1619
1620     datapath_type = ofproto_normalize_type(datapath_type);
1621     class = ofproto_class_find__(datapath_type);
1622
1623     if (class->type_wait) {
1624         class->type_wait(datapath_type);
1625     }
1626 }
1627
1628 int
1629 ofproto_run(struct ofproto *p)
1630 {
1631     int error;
1632     uint64_t new_seq;
1633
1634     error = p->ofproto_class->run(p);
1635     if (error && error != EAGAIN) {
1636         VLOG_ERR_RL(&rl, "%s: run failed (%s)", p->name, ovs_strerror(error));
1637     }
1638
1639     run_rule_executes(p);
1640
1641     /* Restore the eviction group heap invariant occasionally. */
1642     if (p->eviction_group_timer < time_msec()) {
1643         size_t i;
1644
1645         p->eviction_group_timer = time_msec() + 1000;
1646
1647         for (i = 0; i < p->n_tables; i++) {
1648             struct oftable *table = &p->tables[i];
1649             struct eviction_group *evg;
1650             struct rule *rule;
1651
1652             if (!table->eviction_fields) {
1653                 continue;
1654             }
1655
1656             if (classifier_count(&table->cls) > 100000) {
1657                 static struct vlog_rate_limit count_rl =
1658                     VLOG_RATE_LIMIT_INIT(1, 1);
1659                 VLOG_WARN_RL(&count_rl, "Table %"PRIuSIZE" has an excessive"
1660                              " number of rules: %d", i,
1661                              classifier_count(&table->cls));
1662             }
1663
1664             ovs_mutex_lock(&ofproto_mutex);
1665             CLS_FOR_EACH (rule, cr, &table->cls) {
1666                 if (rule->idle_timeout || rule->hard_timeout) {
1667                     if (!rule->eviction_group) {
1668                         eviction_group_add_rule(rule);
1669                     } else {
1670                         heap_raw_change(&rule->evg_node,
1671                                         rule_eviction_priority(p, rule));
1672                     }
1673                 }
1674             }
1675
1676             HEAP_FOR_EACH (evg, size_node, &table->eviction_groups_by_size) {
1677                 heap_rebuild(&evg->rules);
1678             }
1679             ovs_mutex_unlock(&ofproto_mutex);
1680         }
1681     }
1682
1683     if (p->ofproto_class->port_poll) {
1684         char *devname;
1685
1686         while ((error = p->ofproto_class->port_poll(p, &devname)) != EAGAIN) {
1687             process_port_change(p, error, devname);
1688         }
1689     }
1690
1691     new_seq = seq_read(connectivity_seq_get());
1692     if (new_seq != p->change_seq) {
1693         struct sset devnames;
1694         const char *devname;
1695         struct ofport *ofport;
1696
1697         /* Update OpenFlow port status for any port whose netdev has changed.
1698          *
1699          * Refreshing a given 'ofport' can cause an arbitrary ofport to be
1700          * destroyed, so it's not safe to update ports directly from the
1701          * HMAP_FOR_EACH loop, or even to use HMAP_FOR_EACH_SAFE.  Instead, we
1702          * need this two-phase approach. */
1703         sset_init(&devnames);
1704         HMAP_FOR_EACH (ofport, hmap_node, &p->ports) {
1705             uint64_t port_change_seq;
1706
1707             port_change_seq = netdev_get_change_seq(ofport->netdev);
1708             if (ofport->change_seq != port_change_seq) {
1709                 ofport->change_seq = port_change_seq;
1710                 sset_add(&devnames, netdev_get_name(ofport->netdev));
1711             }
1712         }
1713         SSET_FOR_EACH (devname, &devnames) {
1714             update_port(p, devname);
1715         }
1716         sset_destroy(&devnames);
1717
1718         p->change_seq = new_seq;
1719     }
1720
1721     connmgr_run(p->connmgr, handle_openflow);
1722
1723     return error;
1724 }
1725
1726 void
1727 ofproto_wait(struct ofproto *p)
1728 {
1729     p->ofproto_class->wait(p);
1730     if (p->ofproto_class->port_poll_wait) {
1731         p->ofproto_class->port_poll_wait(p);
1732     }
1733     seq_wait(connectivity_seq_get(), p->change_seq);
1734     connmgr_wait(p->connmgr);
1735 }
1736
1737 bool
1738 ofproto_is_alive(const struct ofproto *p)
1739 {
1740     return connmgr_has_controllers(p->connmgr);
1741 }
1742
1743 /* Adds some memory usage statistics for 'ofproto' into 'usage', for use with
1744  * memory_report(). */
1745 void
1746 ofproto_get_memory_usage(const struct ofproto *ofproto, struct simap *usage)
1747 {
1748     const struct oftable *table;
1749     unsigned int n_rules;
1750
1751     simap_increase(usage, "ports", hmap_count(&ofproto->ports));
1752
1753     n_rules = 0;
1754     OFPROTO_FOR_EACH_TABLE (table, ofproto) {
1755         n_rules += classifier_count(&table->cls);
1756     }
1757     simap_increase(usage, "rules", n_rules);
1758
1759     if (ofproto->ofproto_class->get_memory_usage) {
1760         ofproto->ofproto_class->get_memory_usage(ofproto, usage);
1761     }
1762
1763     connmgr_get_memory_usage(ofproto->connmgr, usage);
1764 }
1765
1766 void
1767 ofproto_type_get_memory_usage(const char *datapath_type, struct simap *usage)
1768 {
1769     const struct ofproto_class *class;
1770
1771     datapath_type = ofproto_normalize_type(datapath_type);
1772     class = ofproto_class_find__(datapath_type);
1773
1774     if (class && class->type_get_memory_usage) {
1775         class->type_get_memory_usage(datapath_type, usage);
1776     }
1777 }
1778
1779 void
1780 ofproto_get_ofproto_controller_info(const struct ofproto *ofproto,
1781                                     struct shash *info)
1782 {
1783     connmgr_get_controller_info(ofproto->connmgr, info);
1784 }
1785
1786 void
1787 ofproto_free_ofproto_controller_info(struct shash *info)
1788 {
1789     connmgr_free_controller_info(info);
1790 }
1791
1792 /* Makes a deep copy of 'old' into 'port'. */
1793 void
1794 ofproto_port_clone(struct ofproto_port *port, const struct ofproto_port *old)
1795 {
1796     port->name = xstrdup(old->name);
1797     port->type = xstrdup(old->type);
1798     port->ofp_port = old->ofp_port;
1799 }
1800
1801 /* Frees memory allocated to members of 'ofproto_port'.
1802  *
1803  * Do not call this function on an ofproto_port obtained from
1804  * ofproto_port_dump_next(): that function retains ownership of the data in the
1805  * ofproto_port. */
1806 void
1807 ofproto_port_destroy(struct ofproto_port *ofproto_port)
1808 {
1809     free(ofproto_port->name);
1810     free(ofproto_port->type);
1811 }
1812
1813 /* Initializes 'dump' to begin dumping the ports in an ofproto.
1814  *
1815  * This function provides no status indication.  An error status for the entire
1816  * dump operation is provided when it is completed by calling
1817  * ofproto_port_dump_done().
1818  */
1819 void
1820 ofproto_port_dump_start(struct ofproto_port_dump *dump,
1821                         const struct ofproto *ofproto)
1822 {
1823     dump->ofproto = ofproto;
1824     dump->error = ofproto->ofproto_class->port_dump_start(ofproto,
1825                                                           &dump->state);
1826 }
1827
1828 /* Attempts to retrieve another port from 'dump', which must have been created
1829  * with ofproto_port_dump_start().  On success, stores a new ofproto_port into
1830  * 'port' and returns true.  On failure, returns false.
1831  *
1832  * Failure might indicate an actual error or merely that the last port has been
1833  * dumped.  An error status for the entire dump operation is provided when it
1834  * is completed by calling ofproto_port_dump_done().
1835  *
1836  * The ofproto owns the data stored in 'port'.  It will remain valid until at
1837  * least the next time 'dump' is passed to ofproto_port_dump_next() or
1838  * ofproto_port_dump_done(). */
1839 bool
1840 ofproto_port_dump_next(struct ofproto_port_dump *dump,
1841                        struct ofproto_port *port)
1842 {
1843     const struct ofproto *ofproto = dump->ofproto;
1844
1845     if (dump->error) {
1846         return false;
1847     }
1848
1849     dump->error = ofproto->ofproto_class->port_dump_next(ofproto, dump->state,
1850                                                          port);
1851     if (dump->error) {
1852         ofproto->ofproto_class->port_dump_done(ofproto, dump->state);
1853         return false;
1854     }
1855     return true;
1856 }
1857
1858 /* Completes port table dump operation 'dump', which must have been created
1859  * with ofproto_port_dump_start().  Returns 0 if the dump operation was
1860  * error-free, otherwise a positive errno value describing the problem. */
1861 int
1862 ofproto_port_dump_done(struct ofproto_port_dump *dump)
1863 {
1864     const struct ofproto *ofproto = dump->ofproto;
1865     if (!dump->error) {
1866         dump->error = ofproto->ofproto_class->port_dump_done(ofproto,
1867                                                              dump->state);
1868     }
1869     return dump->error == EOF ? 0 : dump->error;
1870 }
1871
1872 /* Returns the type to pass to netdev_open() when a datapath of type
1873  * 'datapath_type' has a port of type 'port_type', for a few special
1874  * cases when a netdev type differs from a port type.  For example, when
1875  * using the userspace datapath, a port of type "internal" needs to be
1876  * opened as "tap".
1877  *
1878  * Returns either 'type' itself or a string literal, which must not be
1879  * freed. */
1880 const char *
1881 ofproto_port_open_type(const char *datapath_type, const char *port_type)
1882 {
1883     const struct ofproto_class *class;
1884
1885     datapath_type = ofproto_normalize_type(datapath_type);
1886     class = ofproto_class_find__(datapath_type);
1887     if (!class) {
1888         return port_type;
1889     }
1890
1891     return (class->port_open_type
1892             ? class->port_open_type(datapath_type, port_type)
1893             : port_type);
1894 }
1895
1896 /* Attempts to add 'netdev' as a port on 'ofproto'.  If 'ofp_portp' is
1897  * non-null and '*ofp_portp' is not OFPP_NONE, attempts to use that as
1898  * the port's OpenFlow port number.
1899  *
1900  * If successful, returns 0 and sets '*ofp_portp' to the new port's
1901  * OpenFlow port number (if 'ofp_portp' is non-null).  On failure,
1902  * returns a positive errno value and sets '*ofp_portp' to OFPP_NONE (if
1903  * 'ofp_portp' is non-null). */
1904 int
1905 ofproto_port_add(struct ofproto *ofproto, struct netdev *netdev,
1906                  ofp_port_t *ofp_portp)
1907 {
1908     ofp_port_t ofp_port = ofp_portp ? *ofp_portp : OFPP_NONE;
1909     int error;
1910
1911     error = ofproto->ofproto_class->port_add(ofproto, netdev);
1912     if (!error) {
1913         const char *netdev_name = netdev_get_name(netdev);
1914
1915         simap_put(&ofproto->ofp_requests, netdev_name,
1916                   ofp_to_u16(ofp_port));
1917         update_port(ofproto, netdev_name);
1918     }
1919     if (ofp_portp) {
1920         *ofp_portp = OFPP_NONE;
1921         if (!error) {
1922             struct ofproto_port ofproto_port;
1923
1924             error = ofproto_port_query_by_name(ofproto,
1925                                                netdev_get_name(netdev),
1926                                                &ofproto_port);
1927             if (!error) {
1928                 *ofp_portp = ofproto_port.ofp_port;
1929                 ofproto_port_destroy(&ofproto_port);
1930             }
1931         }
1932     }
1933     return error;
1934 }
1935
1936 /* Looks up a port named 'devname' in 'ofproto'.  On success, returns 0 and
1937  * initializes '*port' appropriately; on failure, returns a positive errno
1938  * value.
1939  *
1940  * The caller owns the data in 'ofproto_port' and must free it with
1941  * ofproto_port_destroy() when it is no longer needed. */
1942 int
1943 ofproto_port_query_by_name(const struct ofproto *ofproto, const char *devname,
1944                            struct ofproto_port *port)
1945 {
1946     int error;
1947
1948     error = ofproto->ofproto_class->port_query_by_name(ofproto, devname, port);
1949     if (error) {
1950         memset(port, 0, sizeof *port);
1951     }
1952     return error;
1953 }
1954
1955 /* Deletes port number 'ofp_port' from the datapath for 'ofproto'.
1956  * Returns 0 if successful, otherwise a positive errno. */
1957 int
1958 ofproto_port_del(struct ofproto *ofproto, ofp_port_t ofp_port)
1959 {
1960     struct ofport *ofport = ofproto_get_port(ofproto, ofp_port);
1961     const char *name = ofport ? netdev_get_name(ofport->netdev) : "<unknown>";
1962     struct simap_node *ofp_request_node;
1963     int error;
1964
1965     ofp_request_node = simap_find(&ofproto->ofp_requests, name);
1966     if (ofp_request_node) {
1967         simap_delete(&ofproto->ofp_requests, ofp_request_node);
1968     }
1969
1970     error = ofproto->ofproto_class->port_del(ofproto, ofp_port);
1971     if (!error && ofport) {
1972         /* 'name' is the netdev's name and update_port() is going to close the
1973          * netdev.  Just in case update_port() refers to 'name' after it
1974          * destroys 'ofport', make a copy of it around the update_port()
1975          * call. */
1976         char *devname = xstrdup(name);
1977         update_port(ofproto, devname);
1978         free(devname);
1979     }
1980     return error;
1981 }
1982
1983 static void
1984 flow_mod_init(struct ofputil_flow_mod *fm,
1985               const struct match *match, int priority,
1986               const struct ofpact *ofpacts, size_t ofpacts_len,
1987               enum ofp_flow_mod_command command)
1988 {
1989     memset(fm, 0, sizeof *fm);
1990     fm->match = *match;
1991     fm->priority = priority;
1992     fm->cookie = 0;
1993     fm->new_cookie = 0;
1994     fm->modify_cookie = false;
1995     fm->table_id = 0;
1996     fm->command = command;
1997     fm->idle_timeout = 0;
1998     fm->hard_timeout = 0;
1999     fm->importance = 0;
2000     fm->buffer_id = UINT32_MAX;
2001     fm->out_port = OFPP_ANY;
2002     fm->out_group = OFPG_ANY;
2003     fm->flags = 0;
2004     fm->ofpacts = CONST_CAST(struct ofpact *, ofpacts);
2005     fm->ofpacts_len = ofpacts_len;
2006     fm->delete_reason = OFPRR_DELETE;
2007 }
2008
2009 static int
2010 simple_flow_mod(struct ofproto *ofproto,
2011                 const struct match *match, int priority,
2012                 const struct ofpact *ofpacts, size_t ofpacts_len,
2013                 enum ofp_flow_mod_command command)
2014 {
2015     struct ofputil_flow_mod fm;
2016
2017     flow_mod_init(&fm, match, priority, ofpacts, ofpacts_len, command);
2018
2019     return handle_flow_mod__(ofproto, &fm, NULL);
2020 }
2021
2022 /* Adds a flow to OpenFlow flow table 0 in 'p' that matches 'cls_rule' and
2023  * performs the 'n_actions' actions in 'actions'.  The new flow will not
2024  * timeout.
2025  *
2026  * If cls_rule->priority is in the range of priorities supported by OpenFlow
2027  * (0...65535, inclusive) then the flow will be visible to OpenFlow
2028  * controllers; otherwise, it will be hidden.
2029  *
2030  * The caller retains ownership of 'cls_rule' and 'ofpacts'.
2031  *
2032  * This is a helper function for in-band control and fail-open. */
2033 void
2034 ofproto_add_flow(struct ofproto *ofproto, const struct match *match,
2035                  int priority,
2036                  const struct ofpact *ofpacts, size_t ofpacts_len)
2037     OVS_EXCLUDED(ofproto_mutex)
2038 {
2039     const struct rule *rule;
2040     bool must_add;
2041
2042     /* First do a cheap check whether the rule we're looking for already exists
2043      * with the actions that we want.  If it does, then we're done. */
2044     rule = rule_from_cls_rule(classifier_find_match_exactly(
2045                                   &ofproto->tables[0].cls, match, priority));
2046     if (rule) {
2047         const struct rule_actions *actions = rule_get_actions(rule);
2048         must_add = !ofpacts_equal(actions->ofpacts, actions->ofpacts_len,
2049                                   ofpacts, ofpacts_len);
2050     } else {
2051         must_add = true;
2052     }
2053
2054     /* If there's no such rule or the rule doesn't have the actions we want,
2055      * fall back to a executing a full flow mod.  We can't optimize this at
2056      * all because we didn't take enough locks above to ensure that the flow
2057      * table didn't already change beneath us.  */
2058     if (must_add) {
2059         simple_flow_mod(ofproto, match, priority, ofpacts, ofpacts_len,
2060                         OFPFC_MODIFY_STRICT);
2061     }
2062 }
2063
2064 /* Executes the flow modification specified in 'fm'.  Returns 0 on success, or
2065  * an OFPERR_* OpenFlow error code on failure.
2066  *
2067  * This is a helper function for in-band control and fail-open and the "learn"
2068  * action. */
2069 enum ofperr
2070 ofproto_flow_mod(struct ofproto *ofproto, struct ofputil_flow_mod *fm)
2071     OVS_EXCLUDED(ofproto_mutex)
2072 {
2073     /* Optimize for the most common case of a repeated learn action.
2074      * If an identical flow already exists we only need to update its
2075      * 'modified' time. */
2076     if (fm->command == OFPFC_MODIFY_STRICT && fm->table_id != OFPTT_ALL
2077         && !(fm->flags & OFPUTIL_FF_RESET_COUNTS)) {
2078         struct oftable *table = &ofproto->tables[fm->table_id];
2079         struct rule *rule;
2080         bool done = false;
2081
2082         rule = rule_from_cls_rule(classifier_find_match_exactly(&table->cls,
2083                                                                 &fm->match,
2084                                                                 fm->priority));
2085         if (rule) {
2086             /* Reading many of the rule fields and writing on 'modified'
2087              * requires the rule->mutex.  Also, rule->actions may change
2088              * if rule->mutex is not held. */
2089             const struct rule_actions *actions;
2090
2091             ovs_mutex_lock(&rule->mutex);
2092             actions = rule_get_actions(rule);
2093             if (rule->idle_timeout == fm->idle_timeout
2094                 && rule->hard_timeout == fm->hard_timeout
2095                 && rule->importance == fm->importance
2096                 && rule->flags == (fm->flags & OFPUTIL_FF_STATE)
2097                 && (!fm->modify_cookie || (fm->new_cookie == rule->flow_cookie))
2098                 && ofpacts_equal(fm->ofpacts, fm->ofpacts_len,
2099                                  actions->ofpacts, actions->ofpacts_len)) {
2100                 /* Rule already exists and need not change, only update the
2101                    modified timestamp. */
2102                 rule->modified = time_msec();
2103                 done = true;
2104             }
2105             ovs_mutex_unlock(&rule->mutex);
2106         }
2107
2108         if (done) {
2109             return 0;
2110         }
2111     }
2112
2113     return handle_flow_mod__(ofproto, fm, NULL);
2114 }
2115
2116 /* Searches for a rule with matching criteria exactly equal to 'target' in
2117  * ofproto's table 0 and, if it finds one, deletes it.
2118  *
2119  * This is a helper function for in-band control and fail-open. */
2120 void
2121 ofproto_delete_flow(struct ofproto *ofproto,
2122                     const struct match *target, int priority)
2123     OVS_EXCLUDED(ofproto_mutex)
2124 {
2125     struct classifier *cls = &ofproto->tables[0].cls;
2126     struct rule *rule;
2127
2128     /* First do a cheap check whether the rule we're looking for has already
2129      * been deleted.  If so, then we're done. */
2130     rule = rule_from_cls_rule(classifier_find_match_exactly(cls, target,
2131                                                             priority));
2132     if (!rule) {
2133         return;
2134     }
2135
2136     /* Execute a flow mod.  We can't optimize this at all because we didn't
2137      * take enough locks above to ensure that the flow table didn't already
2138      * change beneath us. */
2139     simple_flow_mod(ofproto, target, priority, NULL, 0, OFPFC_DELETE_STRICT);
2140 }
2141
2142 /* Delete all of the flows from all of ofproto's flow tables, then reintroduce
2143  * the flows required by in-band control and fail-open.  */
2144 void
2145 ofproto_flush_flows(struct ofproto *ofproto)
2146 {
2147     COVERAGE_INC(ofproto_flush);
2148     ofproto_flush__(ofproto);
2149     connmgr_flushed(ofproto->connmgr);
2150 }
2151 \f
2152 static void
2153 reinit_ports(struct ofproto *p)
2154 {
2155     struct ofproto_port_dump dump;
2156     struct sset devnames;
2157     struct ofport *ofport;
2158     struct ofproto_port ofproto_port;
2159     const char *devname;
2160
2161     COVERAGE_INC(ofproto_reinit_ports);
2162
2163     sset_init(&devnames);
2164     HMAP_FOR_EACH (ofport, hmap_node, &p->ports) {
2165         sset_add(&devnames, netdev_get_name(ofport->netdev));
2166     }
2167     OFPROTO_PORT_FOR_EACH (&ofproto_port, &dump, p) {
2168         sset_add(&devnames, ofproto_port.name);
2169     }
2170
2171     SSET_FOR_EACH (devname, &devnames) {
2172         update_port(p, devname);
2173     }
2174     sset_destroy(&devnames);
2175 }
2176
2177 static ofp_port_t
2178 alloc_ofp_port(struct ofproto *ofproto, const char *netdev_name)
2179 {
2180     uint16_t port_idx;
2181
2182     port_idx = simap_get(&ofproto->ofp_requests, netdev_name);
2183     port_idx = port_idx ? port_idx : UINT16_MAX;
2184
2185     if (port_idx >= ofproto->max_ports
2186         || ofport_get_usage(ofproto, u16_to_ofp(port_idx)) == LLONG_MAX) {
2187         uint16_t lru_ofport = 0, end_port_no = ofproto->alloc_port_no;
2188         long long int last_used_at, lru = LLONG_MAX;
2189
2190         /* Search for a free OpenFlow port number.  We try not to
2191          * immediately reuse them to prevent problems due to old
2192          * flows.
2193          *
2194          * We limit the automatically assigned port numbers to the lower half
2195          * of the port range, to reserve the upper half for assignment by
2196          * controllers. */
2197         for (;;) {
2198             if (++ofproto->alloc_port_no >= MIN(ofproto->max_ports, 32768)) {
2199                 ofproto->alloc_port_no = 1;
2200             }
2201             last_used_at = ofport_get_usage(ofproto,
2202                                          u16_to_ofp(ofproto->alloc_port_no));
2203             if (!last_used_at) {
2204                 port_idx = ofproto->alloc_port_no;
2205                 break;
2206             } else if ( last_used_at < time_msec() - 60*60*1000) {
2207                 /* If the port with ofport 'ofproto->alloc_port_no' was deleted
2208                  * more than an hour ago, consider it usable. */
2209                 ofport_remove_usage(ofproto,
2210                     u16_to_ofp(ofproto->alloc_port_no));
2211                 port_idx = ofproto->alloc_port_no;
2212                 break;
2213             } else if (last_used_at < lru) {
2214                 lru = last_used_at;
2215                 lru_ofport = ofproto->alloc_port_no;
2216             }
2217
2218             if (ofproto->alloc_port_no == end_port_no) {
2219                 if (lru_ofport) {
2220                     port_idx = lru_ofport;
2221                     break;
2222                 }
2223                 return OFPP_NONE;
2224             }
2225         }
2226     }
2227     ofport_set_usage(ofproto, u16_to_ofp(port_idx), LLONG_MAX);
2228     return u16_to_ofp(port_idx);
2229 }
2230
2231 static void
2232 dealloc_ofp_port(struct ofproto *ofproto, ofp_port_t ofp_port)
2233 {
2234     if (ofp_to_u16(ofp_port) < ofproto->max_ports) {
2235         ofport_set_usage(ofproto, ofp_port, time_msec());
2236     }
2237 }
2238
2239 /* Opens and returns a netdev for 'ofproto_port' in 'ofproto', or a null
2240  * pointer if the netdev cannot be opened.  On success, also fills in
2241  * '*pp'.  */
2242 static struct netdev *
2243 ofport_open(struct ofproto *ofproto,
2244             struct ofproto_port *ofproto_port,
2245             struct ofputil_phy_port *pp)
2246 {
2247     enum netdev_flags flags;
2248     struct netdev *netdev;
2249     int error;
2250
2251     error = netdev_open(ofproto_port->name, ofproto_port->type, &netdev);
2252     if (error) {
2253         VLOG_WARN_RL(&rl, "%s: ignoring port %s (%"PRIu16") because netdev %s "
2254                      "cannot be opened (%s)",
2255                      ofproto->name,
2256                      ofproto_port->name, ofproto_port->ofp_port,
2257                      ofproto_port->name, ovs_strerror(error));
2258         return NULL;
2259     }
2260
2261     if (ofproto_port->ofp_port == OFPP_NONE) {
2262         if (!strcmp(ofproto->name, ofproto_port->name)) {
2263             ofproto_port->ofp_port = OFPP_LOCAL;
2264         } else {
2265             ofproto_port->ofp_port = alloc_ofp_port(ofproto,
2266                                                     ofproto_port->name);
2267         }
2268     }
2269     pp->port_no = ofproto_port->ofp_port;
2270     netdev_get_etheraddr(netdev, pp->hw_addr);
2271     ovs_strlcpy(pp->name, ofproto_port->name, sizeof pp->name);
2272     netdev_get_flags(netdev, &flags);
2273     pp->config = flags & NETDEV_UP ? 0 : OFPUTIL_PC_PORT_DOWN;
2274     pp->state = netdev_get_carrier(netdev) ? 0 : OFPUTIL_PS_LINK_DOWN;
2275     netdev_get_features(netdev, &pp->curr, &pp->advertised,
2276                         &pp->supported, &pp->peer);
2277     pp->curr_speed = netdev_features_to_bps(pp->curr, 0) / 1000;
2278     pp->max_speed = netdev_features_to_bps(pp->supported, 0) / 1000;
2279
2280     return netdev;
2281 }
2282
2283 /* Returns true if most fields of 'a' and 'b' are equal.  Differences in name,
2284  * port number, and 'config' bits other than OFPUTIL_PC_PORT_DOWN are
2285  * disregarded. */
2286 static bool
2287 ofport_equal(const struct ofputil_phy_port *a,
2288              const struct ofputil_phy_port *b)
2289 {
2290     return (eth_addr_equals(a->hw_addr, b->hw_addr)
2291             && a->state == b->state
2292             && !((a->config ^ b->config) & OFPUTIL_PC_PORT_DOWN)
2293             && a->curr == b->curr
2294             && a->advertised == b->advertised
2295             && a->supported == b->supported
2296             && a->peer == b->peer
2297             && a->curr_speed == b->curr_speed
2298             && a->max_speed == b->max_speed);
2299 }
2300
2301 /* Adds an ofport to 'p' initialized based on the given 'netdev' and 'opp'.
2302  * The caller must ensure that 'p' does not have a conflicting ofport (that is,
2303  * one with the same name or port number). */
2304 static void
2305 ofport_install(struct ofproto *p,
2306                struct netdev *netdev, const struct ofputil_phy_port *pp)
2307 {
2308     const char *netdev_name = netdev_get_name(netdev);
2309     struct ofport *ofport;
2310     int error;
2311
2312     /* Create ofport. */
2313     ofport = p->ofproto_class->port_alloc();
2314     if (!ofport) {
2315         error = ENOMEM;
2316         goto error;
2317     }
2318     ofport->ofproto = p;
2319     ofport->netdev = netdev;
2320     ofport->change_seq = netdev_get_change_seq(netdev);
2321     ofport->pp = *pp;
2322     ofport->ofp_port = pp->port_no;
2323     ofport->created = time_msec();
2324
2325     /* Add port to 'p'. */
2326     hmap_insert(&p->ports, &ofport->hmap_node,
2327                 hash_ofp_port(ofport->ofp_port));
2328     shash_add(&p->port_by_name, netdev_name, ofport);
2329
2330     update_mtu(p, ofport);
2331
2332     /* Let the ofproto_class initialize its private data. */
2333     error = p->ofproto_class->port_construct(ofport);
2334     if (error) {
2335         goto error;
2336     }
2337     connmgr_send_port_status(p->connmgr, NULL, pp, OFPPR_ADD);
2338     return;
2339
2340 error:
2341     VLOG_WARN_RL(&rl, "%s: could not add port %s (%s)",
2342                  p->name, netdev_name, ovs_strerror(error));
2343     if (ofport) {
2344         ofport_destroy__(ofport);
2345     } else {
2346         netdev_close(netdev);
2347     }
2348 }
2349
2350 /* Removes 'ofport' from 'p' and destroys it. */
2351 static void
2352 ofport_remove(struct ofport *ofport)
2353 {
2354     connmgr_send_port_status(ofport->ofproto->connmgr, NULL, &ofport->pp,
2355                              OFPPR_DELETE);
2356     ofport_destroy(ofport);
2357 }
2358
2359 /* If 'ofproto' contains an ofport named 'name', removes it from 'ofproto' and
2360  * destroys it. */
2361 static void
2362 ofport_remove_with_name(struct ofproto *ofproto, const char *name)
2363 {
2364     struct ofport *port = shash_find_data(&ofproto->port_by_name, name);
2365     if (port) {
2366         ofport_remove(port);
2367     }
2368 }
2369
2370 /* Updates 'port' with new 'pp' description.
2371  *
2372  * Does not handle a name or port number change.  The caller must implement
2373  * such a change as a delete followed by an add.  */
2374 static void
2375 ofport_modified(struct ofport *port, struct ofputil_phy_port *pp)
2376 {
2377     memcpy(port->pp.hw_addr, pp->hw_addr, ETH_ADDR_LEN);
2378     port->pp.config = ((port->pp.config & ~OFPUTIL_PC_PORT_DOWN)
2379                         | (pp->config & OFPUTIL_PC_PORT_DOWN));
2380     port->pp.state = ((port->pp.state & ~OFPUTIL_PS_LINK_DOWN)
2381                       | (pp->state & OFPUTIL_PS_LINK_DOWN));
2382     port->pp.curr = pp->curr;
2383     port->pp.advertised = pp->advertised;
2384     port->pp.supported = pp->supported;
2385     port->pp.peer = pp->peer;
2386     port->pp.curr_speed = pp->curr_speed;
2387     port->pp.max_speed = pp->max_speed;
2388
2389     connmgr_send_port_status(port->ofproto->connmgr, NULL,
2390                              &port->pp, OFPPR_MODIFY);
2391 }
2392
2393 /* Update OpenFlow 'state' in 'port' and notify controller. */
2394 void
2395 ofproto_port_set_state(struct ofport *port, enum ofputil_port_state state)
2396 {
2397     if (port->pp.state != state) {
2398         port->pp.state = state;
2399         connmgr_send_port_status(port->ofproto->connmgr, NULL,
2400                                  &port->pp, OFPPR_MODIFY);
2401     }
2402 }
2403
2404 void
2405 ofproto_port_unregister(struct ofproto *ofproto, ofp_port_t ofp_port)
2406 {
2407     struct ofport *port = ofproto_get_port(ofproto, ofp_port);
2408     if (port) {
2409         if (port->ofproto->ofproto_class->set_realdev) {
2410             port->ofproto->ofproto_class->set_realdev(port, 0, 0);
2411         }
2412         if (port->ofproto->ofproto_class->set_stp_port) {
2413             port->ofproto->ofproto_class->set_stp_port(port, NULL);
2414         }
2415         if (port->ofproto->ofproto_class->set_rstp_port) {
2416             port->ofproto->ofproto_class->set_rstp_port(port, NULL);
2417         }
2418         if (port->ofproto->ofproto_class->set_cfm) {
2419             port->ofproto->ofproto_class->set_cfm(port, NULL);
2420         }
2421         if (port->ofproto->ofproto_class->bundle_remove) {
2422             port->ofproto->ofproto_class->bundle_remove(port);
2423         }
2424     }
2425 }
2426
2427 static void
2428 ofport_destroy__(struct ofport *port)
2429 {
2430     struct ofproto *ofproto = port->ofproto;
2431     const char *name = netdev_get_name(port->netdev);
2432
2433     hmap_remove(&ofproto->ports, &port->hmap_node);
2434     shash_delete(&ofproto->port_by_name,
2435                  shash_find(&ofproto->port_by_name, name));
2436
2437     netdev_close(port->netdev);
2438     ofproto->ofproto_class->port_dealloc(port);
2439 }
2440
2441 static void
2442 ofport_destroy(struct ofport *port)
2443 {
2444     if (port) {
2445         dealloc_ofp_port(port->ofproto, port->ofp_port);
2446         port->ofproto->ofproto_class->port_destruct(port);
2447         ofport_destroy__(port);
2448      }
2449 }
2450
2451 struct ofport *
2452 ofproto_get_port(const struct ofproto *ofproto, ofp_port_t ofp_port)
2453 {
2454     struct ofport *port;
2455
2456     HMAP_FOR_EACH_IN_BUCKET (port, hmap_node, hash_ofp_port(ofp_port),
2457                              &ofproto->ports) {
2458         if (port->ofp_port == ofp_port) {
2459             return port;
2460         }
2461     }
2462     return NULL;
2463 }
2464
2465 static long long int
2466 ofport_get_usage(const struct ofproto *ofproto, ofp_port_t ofp_port)
2467 {
2468     struct ofport_usage *usage;
2469
2470     HMAP_FOR_EACH_IN_BUCKET (usage, hmap_node, hash_ofp_port(ofp_port),
2471                              &ofproto->ofport_usage) {
2472         if (usage->ofp_port == ofp_port) {
2473             return usage->last_used;
2474         }
2475     }
2476     return 0;
2477 }
2478
2479 static void
2480 ofport_set_usage(struct ofproto *ofproto, ofp_port_t ofp_port,
2481                  long long int last_used)
2482 {
2483     struct ofport_usage *usage;
2484     HMAP_FOR_EACH_IN_BUCKET (usage, hmap_node, hash_ofp_port(ofp_port),
2485                              &ofproto->ofport_usage) {
2486         if (usage->ofp_port == ofp_port) {
2487             usage->last_used = last_used;
2488             return;
2489         }
2490     }
2491     ovs_assert(last_used == LLONG_MAX);
2492
2493     usage = xmalloc(sizeof *usage);
2494     usage->ofp_port = ofp_port;
2495     usage->last_used = last_used;
2496     hmap_insert(&ofproto->ofport_usage, &usage->hmap_node,
2497                 hash_ofp_port(ofp_port));
2498 }
2499
2500 static void
2501 ofport_remove_usage(struct ofproto *ofproto, ofp_port_t ofp_port)
2502 {
2503     struct ofport_usage *usage;
2504     HMAP_FOR_EACH_IN_BUCKET (usage, hmap_node, hash_ofp_port(ofp_port),
2505                              &ofproto->ofport_usage) {
2506         if (usage->ofp_port == ofp_port) {
2507             hmap_remove(&ofproto->ofport_usage, &usage->hmap_node);
2508             free(usage);
2509             break;
2510         }
2511     }
2512 }
2513
2514 int
2515 ofproto_port_get_stats(const struct ofport *port, struct netdev_stats *stats)
2516 {
2517     struct ofproto *ofproto = port->ofproto;
2518     int error;
2519
2520     if (ofproto->ofproto_class->port_get_stats) {
2521         error = ofproto->ofproto_class->port_get_stats(port, stats);
2522     } else {
2523         error = EOPNOTSUPP;
2524     }
2525
2526     return error;
2527 }
2528
2529 static void
2530 update_port(struct ofproto *ofproto, const char *name)
2531 {
2532     struct ofproto_port ofproto_port;
2533     struct ofputil_phy_port pp;
2534     struct netdev *netdev;
2535     struct ofport *port;
2536
2537     COVERAGE_INC(ofproto_update_port);
2538
2539     /* Fetch 'name''s location and properties from the datapath. */
2540     netdev = (!ofproto_port_query_by_name(ofproto, name, &ofproto_port)
2541               ? ofport_open(ofproto, &ofproto_port, &pp)
2542               : NULL);
2543
2544     if (netdev) {
2545         port = ofproto_get_port(ofproto, ofproto_port.ofp_port);
2546         if (port && !strcmp(netdev_get_name(port->netdev), name)) {
2547             struct netdev *old_netdev = port->netdev;
2548
2549             /* 'name' hasn't changed location.  Any properties changed? */
2550             if (!ofport_equal(&port->pp, &pp)) {
2551                 ofport_modified(port, &pp);
2552             }
2553
2554             update_mtu(ofproto, port);
2555
2556             /* Install the newly opened netdev in case it has changed.
2557              * Don't close the old netdev yet in case port_modified has to
2558              * remove a retained reference to it.*/
2559             port->netdev = netdev;
2560             port->change_seq = netdev_get_change_seq(netdev);
2561
2562             if (port->ofproto->ofproto_class->port_modified) {
2563                 port->ofproto->ofproto_class->port_modified(port);
2564             }
2565
2566             netdev_close(old_netdev);
2567         } else {
2568             /* If 'port' is nonnull then its name differs from 'name' and thus
2569              * we should delete it.  If we think there's a port named 'name'
2570              * then its port number must be wrong now so delete it too. */
2571             if (port) {
2572                 ofport_remove(port);
2573             }
2574             ofport_remove_with_name(ofproto, name);
2575             ofport_install(ofproto, netdev, &pp);
2576         }
2577     } else {
2578         /* Any port named 'name' is gone now. */
2579         ofport_remove_with_name(ofproto, name);
2580     }
2581     ofproto_port_destroy(&ofproto_port);
2582 }
2583
2584 static int
2585 init_ports(struct ofproto *p)
2586 {
2587     struct ofproto_port_dump dump;
2588     struct ofproto_port ofproto_port;
2589     struct shash_node *node, *next;
2590
2591     OFPROTO_PORT_FOR_EACH (&ofproto_port, &dump, p) {
2592         const char *name = ofproto_port.name;
2593
2594         if (shash_find(&p->port_by_name, name)) {
2595             VLOG_WARN_RL(&rl, "%s: ignoring duplicate device %s in datapath",
2596                          p->name, name);
2597         } else {
2598             struct ofputil_phy_port pp;
2599             struct netdev *netdev;
2600
2601             /* Check if an OpenFlow port number had been requested. */
2602             node = shash_find(&init_ofp_ports, name);
2603             if (node) {
2604                 const struct iface_hint *iface_hint = node->data;
2605                 simap_put(&p->ofp_requests, name,
2606                           ofp_to_u16(iface_hint->ofp_port));
2607             }
2608
2609             netdev = ofport_open(p, &ofproto_port, &pp);
2610             if (netdev) {
2611                 ofport_install(p, netdev, &pp);
2612                 if (ofp_to_u16(ofproto_port.ofp_port) < p->max_ports) {
2613                     p->alloc_port_no = MAX(p->alloc_port_no,
2614                                            ofp_to_u16(ofproto_port.ofp_port));
2615                 }
2616             }
2617         }
2618     }
2619
2620     SHASH_FOR_EACH_SAFE(node, next, &init_ofp_ports) {
2621         struct iface_hint *iface_hint = node->data;
2622
2623         if (!strcmp(iface_hint->br_name, p->name)) {
2624             free(iface_hint->br_name);
2625             free(iface_hint->br_type);
2626             free(iface_hint);
2627             shash_delete(&init_ofp_ports, node);
2628         }
2629     }
2630
2631     return 0;
2632 }
2633
2634 /* Find the minimum MTU of all non-datapath devices attached to 'p'.
2635  * Returns ETH_PAYLOAD_MAX or the minimum of the ports. */
2636 static int
2637 find_min_mtu(struct ofproto *p)
2638 {
2639     struct ofport *ofport;
2640     int mtu = 0;
2641
2642     HMAP_FOR_EACH (ofport, hmap_node, &p->ports) {
2643         struct netdev *netdev = ofport->netdev;
2644         int dev_mtu;
2645
2646         /* Skip any internal ports, since that's what we're trying to
2647          * set. */
2648         if (!strcmp(netdev_get_type(netdev), "internal")) {
2649             continue;
2650         }
2651
2652         if (netdev_get_mtu(netdev, &dev_mtu)) {
2653             continue;
2654         }
2655         if (!mtu || dev_mtu < mtu) {
2656             mtu = dev_mtu;
2657         }
2658     }
2659
2660     return mtu ? mtu: ETH_PAYLOAD_MAX;
2661 }
2662
2663 /* Update MTU of all datapath devices on 'p' to the minimum of the
2664  * non-datapath ports in event of 'port' added or changed. */
2665 static void
2666 update_mtu(struct ofproto *p, struct ofport *port)
2667 {
2668     struct ofport *ofport;
2669     struct netdev *netdev = port->netdev;
2670     int dev_mtu, old_min;
2671
2672     if (netdev_get_mtu(netdev, &dev_mtu)) {
2673         port->mtu = 0;
2674         return;
2675     }
2676     if (!strcmp(netdev_get_type(port->netdev), "internal")) {
2677         if (dev_mtu > p->min_mtu) {
2678            if (!netdev_set_mtu(port->netdev, p->min_mtu)) {
2679                dev_mtu = p->min_mtu;
2680            }
2681         }
2682         port->mtu = dev_mtu;
2683         return;
2684     }
2685
2686     /* For non-internal port find new min mtu. */
2687     old_min = p->min_mtu;
2688     port->mtu = dev_mtu;
2689     p->min_mtu = find_min_mtu(p);
2690     if (p->min_mtu == old_min) {
2691         return;
2692     }
2693
2694     HMAP_FOR_EACH (ofport, hmap_node, &p->ports) {
2695         struct netdev *netdev = ofport->netdev;
2696
2697         if (!strcmp(netdev_get_type(netdev), "internal")) {
2698             if (!netdev_set_mtu(netdev, p->min_mtu)) {
2699                 ofport->mtu = p->min_mtu;
2700             }
2701         }
2702     }
2703 }
2704 \f
2705 static void
2706 ofproto_rule_destroy__(struct rule *rule)
2707     OVS_NO_THREAD_SAFETY_ANALYSIS
2708 {
2709     cls_rule_destroy(CONST_CAST(struct cls_rule *, &rule->cr));
2710     rule_actions_destroy(rule_get_actions(rule));
2711     ovs_mutex_destroy(&rule->mutex);
2712     rule->ofproto->ofproto_class->rule_dealloc(rule);
2713 }
2714
2715 /* Create a new rule based on attributes in 'fm', match in 'cr', and
2716  * 'table_id'.  Note that the rule is NOT inserted into a any data structures
2717  * yet.  Takes ownership of 'cr'. */
2718 static enum ofperr
2719 ofproto_rule_create(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
2720                     struct cls_rule *cr, uint8_t table_id,
2721                     struct rule **rulep)
2722     OVS_REQUIRES(ofproto_mutex)
2723 {
2724     struct rule *rule;
2725     enum ofperr error;
2726
2727     /* Allocate new rule. */
2728     rule = ofproto->ofproto_class->rule_alloc();
2729     if (!rule) {
2730         cls_rule_destroy(cr);
2731         VLOG_WARN_RL(&rl, "%s: failed to allocate a rule.", ofproto->name);
2732         return OFPERR_OFPFMFC_UNKNOWN;
2733     }
2734
2735     /* Initialize base state. */
2736     *CONST_CAST(struct ofproto **, &rule->ofproto) = ofproto;
2737     cls_rule_move(CONST_CAST(struct cls_rule *, &rule->cr), cr);
2738     ovs_refcount_init(&rule->ref_count);
2739     rule->flow_cookie = fm->new_cookie;
2740     rule->created = rule->modified = time_msec();
2741
2742     ovs_mutex_init(&rule->mutex);
2743     ovs_mutex_lock(&rule->mutex);
2744     rule->idle_timeout = fm->idle_timeout;
2745     rule->hard_timeout = fm->hard_timeout;
2746     rule->importance = fm->importance;
2747     ovs_mutex_unlock(&rule->mutex);
2748
2749     *CONST_CAST(uint8_t *, &rule->table_id) = table_id;
2750     rule->flags = fm->flags & OFPUTIL_FF_STATE;
2751     ovsrcu_set_hidden(&rule->actions,
2752                       rule_actions_create(fm->ofpacts, fm->ofpacts_len));
2753     list_init(&rule->meter_list_node);
2754     rule->eviction_group = NULL;
2755     list_init(&rule->expirable);
2756     rule->monitor_flags = 0;
2757     rule->add_seqno = 0;
2758     rule->modify_seqno = 0;
2759
2760     /* Construct rule, initializing derived state. */
2761     error = ofproto->ofproto_class->rule_construct(rule);
2762     if (error) {
2763         ofproto_rule_destroy__(rule);
2764         return error;
2765     }
2766
2767     *rulep = rule;
2768     return 0;
2769 }
2770
2771 static void
2772 rule_destroy_cb(struct rule *rule)
2773 {
2774     rule->ofproto->ofproto_class->rule_destruct(rule);
2775     ofproto_rule_destroy__(rule);
2776 }
2777
2778 void
2779 ofproto_rule_ref(struct rule *rule)
2780 {
2781     if (rule) {
2782         ovs_refcount_ref(&rule->ref_count);
2783     }
2784 }
2785
2786 bool
2787 ofproto_rule_try_ref(struct rule *rule)
2788 {
2789     if (rule) {
2790         return ovs_refcount_try_ref_rcu(&rule->ref_count);
2791     }
2792     return false;
2793 }
2794
2795 /* Decrements 'rule''s ref_count and schedules 'rule' to be destroyed if the
2796  * ref_count reaches 0.
2797  *
2798  * Use of RCU allows short term use (between RCU quiescent periods) without
2799  * keeping a reference.  A reference must be taken if the rule needs to
2800  * stay around accross the RCU quiescent periods. */
2801 void
2802 ofproto_rule_unref(struct rule *rule)
2803 {
2804     if (rule && ovs_refcount_unref_relaxed(&rule->ref_count) == 1) {
2805         ovsrcu_postpone(rule_destroy_cb, rule);
2806     }
2807 }
2808
2809 void
2810 ofproto_group_ref(struct ofgroup *group)
2811 {
2812     if (group) {
2813         ovs_refcount_ref(&group->ref_count);
2814     }
2815 }
2816
2817 void
2818 ofproto_group_unref(struct ofgroup *group)
2819 {
2820     if (group && ovs_refcount_unref(&group->ref_count) == 1) {
2821         group->ofproto->ofproto_class->group_destruct(group);
2822         ofputil_bucket_list_destroy(&group->buckets);
2823         group->ofproto->ofproto_class->group_dealloc(group);
2824     }
2825 }
2826
2827 static uint32_t get_provider_meter_id(const struct ofproto *,
2828                                       uint32_t of_meter_id);
2829
2830 /* Creates and returns a new 'struct rule_actions', whose actions are a copy
2831  * of from the 'ofpacts_len' bytes of 'ofpacts'. */
2832 const struct rule_actions *
2833 rule_actions_create(const struct ofpact *ofpacts, size_t ofpacts_len)
2834 {
2835     struct rule_actions *actions;
2836
2837     actions = xmalloc(sizeof *actions + ofpacts_len);
2838     actions->ofpacts_len = ofpacts_len;
2839     actions->has_meter = ofpacts_get_meter(ofpacts, ofpacts_len) != 0;
2840     memcpy(actions->ofpacts, ofpacts, ofpacts_len);
2841
2842     actions->has_learn_with_delete = (next_learn_with_delete(actions, NULL)
2843                                       != NULL);
2844
2845     return actions;
2846 }
2847
2848 /* Free the actions after the RCU quiescent period is reached. */
2849 void
2850 rule_actions_destroy(const struct rule_actions *actions)
2851 {
2852     if (actions) {
2853         ovsrcu_postpone(free, CONST_CAST(struct rule_actions *, actions));
2854     }
2855 }
2856
2857 /* Returns true if 'rule' has an OpenFlow OFPAT_OUTPUT or OFPAT_ENQUEUE action
2858  * that outputs to 'port' (output to OFPP_FLOOD and OFPP_ALL doesn't count). */
2859 bool
2860 ofproto_rule_has_out_port(const struct rule *rule, ofp_port_t port)
2861     OVS_REQUIRES(ofproto_mutex)
2862 {
2863     if (port == OFPP_ANY) {
2864         return true;
2865     } else {
2866         const struct rule_actions *actions = rule_get_actions(rule);
2867         return ofpacts_output_to_port(actions->ofpacts,
2868                                       actions->ofpacts_len, port);
2869     }
2870 }
2871
2872 /* Returns true if 'rule' has group and equals group_id. */
2873 static bool
2874 ofproto_rule_has_out_group(const struct rule *rule, uint32_t group_id)
2875     OVS_REQUIRES(ofproto_mutex)
2876 {
2877     if (group_id == OFPG_ANY) {
2878         return true;
2879     } else {
2880         const struct rule_actions *actions = rule_get_actions(rule);
2881         return ofpacts_output_to_group(actions->ofpacts,
2882                                        actions->ofpacts_len, group_id);
2883     }
2884 }
2885
2886 static void
2887 rule_execute_destroy(struct rule_execute *e)
2888 {
2889     ofproto_rule_unref(e->rule);
2890     list_remove(&e->list_node);
2891     free(e);
2892 }
2893
2894 /* Executes all "rule_execute" operations queued up in ofproto->rule_executes,
2895  * by passing them to the ofproto provider. */
2896 static void
2897 run_rule_executes(struct ofproto *ofproto)
2898     OVS_EXCLUDED(ofproto_mutex)
2899 {
2900     struct rule_execute *e, *next;
2901     struct ovs_list executes;
2902
2903     guarded_list_pop_all(&ofproto->rule_executes, &executes);
2904     LIST_FOR_EACH_SAFE (e, next, list_node, &executes) {
2905         struct flow flow;
2906
2907         flow_extract(e->packet, &flow);
2908         flow.in_port.ofp_port = e->in_port;
2909         ofproto->ofproto_class->rule_execute(e->rule, &flow, e->packet);
2910
2911         rule_execute_destroy(e);
2912     }
2913 }
2914
2915 /* Destroys and discards all "rule_execute" operations queued up in
2916  * ofproto->rule_executes. */
2917 static void
2918 destroy_rule_executes(struct ofproto *ofproto)
2919 {
2920     struct rule_execute *e, *next;
2921     struct ovs_list executes;
2922
2923     guarded_list_pop_all(&ofproto->rule_executes, &executes);
2924     LIST_FOR_EACH_SAFE (e, next, list_node, &executes) {
2925         dp_packet_delete(e->packet);
2926         rule_execute_destroy(e);
2927     }
2928 }
2929
2930 static bool
2931 rule_is_readonly(const struct rule *rule)
2932 {
2933     const struct oftable *table = &rule->ofproto->tables[rule->table_id];
2934     return (table->flags & OFTABLE_READONLY) != 0;
2935 }
2936 \f
2937 static uint32_t
2938 hash_learned_cookie(ovs_be64 cookie_, uint8_t table_id)
2939 {
2940     uint64_t cookie = (OVS_FORCE uint64_t) cookie_;
2941     return hash_3words(cookie, cookie >> 32, table_id);
2942 }
2943
2944 static void
2945 learned_cookies_update_one__(struct ofproto *ofproto,
2946                              const struct ofpact_learn *learn,
2947                              int delta, struct ovs_list *dead_cookies)
2948     OVS_REQUIRES(ofproto_mutex)
2949 {
2950     uint32_t hash = hash_learned_cookie(learn->cookie, learn->table_id);
2951     struct learned_cookie *c;
2952
2953     HMAP_FOR_EACH_WITH_HASH (c, u.hmap_node, hash, &ofproto->learned_cookies) {
2954         if (c->cookie == learn->cookie && c->table_id == learn->table_id) {
2955             c->n += delta;
2956             ovs_assert(c->n >= 0);
2957
2958             if (!c->n) {
2959                 hmap_remove(&ofproto->learned_cookies, &c->u.hmap_node);
2960                 list_push_back(dead_cookies, &c->u.list_node);
2961             }
2962
2963             return;
2964         }
2965     }
2966
2967     ovs_assert(delta > 0);
2968     c = xmalloc(sizeof *c);
2969     hmap_insert(&ofproto->learned_cookies, &c->u.hmap_node, hash);
2970     c->cookie = learn->cookie;
2971     c->table_id = learn->table_id;
2972     c->n = delta;
2973 }
2974
2975 static const struct ofpact_learn *
2976 next_learn_with_delete(const struct rule_actions *actions,
2977                        const struct ofpact_learn *start)
2978 {
2979     const struct ofpact *pos;
2980
2981     for (pos = start ? ofpact_next(&start->ofpact) : actions->ofpacts;
2982          pos < ofpact_end(actions->ofpacts, actions->ofpacts_len);
2983          pos = ofpact_next(pos)) {
2984         if (pos->type == OFPACT_LEARN) {
2985             const struct ofpact_learn *learn = ofpact_get_LEARN(pos);
2986             if (learn->flags & NX_LEARN_F_DELETE_LEARNED) {
2987                 return learn;
2988             }
2989         }
2990     }
2991
2992     return NULL;
2993 }
2994
2995 static void
2996 learned_cookies_update__(struct ofproto *ofproto,
2997                          const struct rule_actions *actions,
2998                          int delta, struct ovs_list *dead_cookies)
2999     OVS_REQUIRES(ofproto_mutex)
3000 {
3001     if (actions->has_learn_with_delete) {
3002         const struct ofpact_learn *learn;
3003
3004         for (learn = next_learn_with_delete(actions, NULL); learn;
3005              learn = next_learn_with_delete(actions, learn)) {
3006             learned_cookies_update_one__(ofproto, learn, delta, dead_cookies);
3007         }
3008     }
3009 }
3010
3011 static void
3012 learned_cookies_inc(struct ofproto *ofproto,
3013                     const struct rule_actions *actions)
3014     OVS_REQUIRES(ofproto_mutex)
3015 {
3016     learned_cookies_update__(ofproto, actions, +1, NULL);
3017 }
3018
3019 static void
3020 learned_cookies_dec(struct ofproto *ofproto,
3021                     const struct rule_actions *actions,
3022                     struct ovs_list *dead_cookies)
3023     OVS_REQUIRES(ofproto_mutex)
3024 {
3025     learned_cookies_update__(ofproto, actions, -1, dead_cookies);
3026 }
3027
3028 static void
3029 learned_cookies_flush(struct ofproto *ofproto, struct ovs_list *dead_cookies)
3030     OVS_REQUIRES(ofproto_mutex)
3031 {
3032     struct learned_cookie *c;
3033
3034     LIST_FOR_EACH_POP (c, u.list_node, dead_cookies) {
3035         struct rule_criteria criteria;
3036         struct rule_collection rules;
3037         struct match match;
3038
3039         match_init_catchall(&match);
3040         rule_criteria_init(&criteria, c->table_id, &match, 0,
3041                            c->cookie, OVS_BE64_MAX, OFPP_ANY, OFPG_ANY);
3042         rule_criteria_require_rw(&criteria, false);
3043         collect_rules_loose(ofproto, &criteria, &rules);
3044         delete_flows__(&rules, OFPRR_DELETE, NULL);
3045         rule_criteria_destroy(&criteria);
3046         rule_collection_destroy(&rules);
3047
3048         free(c);
3049     }
3050 }
3051 \f
3052 static enum ofperr
3053 handle_echo_request(struct ofconn *ofconn, const struct ofp_header *oh)
3054 {
3055     ofconn_send_reply(ofconn, make_echo_reply(oh));
3056     return 0;
3057 }
3058
3059 static void
3060 query_tables(struct ofproto *ofproto,
3061              struct ofputil_table_features **featuresp,
3062              struct ofputil_table_stats **statsp)
3063 {
3064     struct mf_bitmap rw_fields = oxm_writable_fields();
3065     struct mf_bitmap match = oxm_matchable_fields();
3066     struct mf_bitmap mask = oxm_maskable_fields();
3067
3068     struct ofputil_table_features *features;
3069     struct ofputil_table_stats *stats;
3070     int i;
3071
3072     features = *featuresp = xcalloc(ofproto->n_tables, sizeof *features);
3073     for (i = 0; i < ofproto->n_tables; i++) {
3074         struct ofputil_table_features *f = &features[i];
3075
3076         f->table_id = i;
3077         sprintf(f->name, "table%d", i);
3078         f->metadata_match = OVS_BE64_MAX;
3079         f->metadata_write = OVS_BE64_MAX;
3080         atomic_read_relaxed(&ofproto->tables[i].miss_config, &f->miss_config);
3081         f->max_entries = 1000000;
3082
3083         bool more_tables = false;
3084         for (int j = i + 1; j < ofproto->n_tables; j++) {
3085             if (!(ofproto->tables[j].flags & OFTABLE_HIDDEN)) {
3086                 bitmap_set1(f->nonmiss.next, j);
3087                 more_tables = true;
3088             }
3089         }
3090         f->nonmiss.instructions = (1u << N_OVS_INSTRUCTIONS) - 1;
3091         if (!more_tables) {
3092             f->nonmiss.instructions &= ~(1u << OVSINST_OFPIT11_GOTO_TABLE);
3093         }
3094         f->nonmiss.write.ofpacts = (UINT64_C(1) << N_OFPACTS) - 1;
3095         f->nonmiss.write.set_fields = rw_fields;
3096         f->nonmiss.apply = f->nonmiss.write;
3097         f->miss = f->nonmiss;
3098
3099         f->match = match;
3100         f->mask = mask;
3101         f->wildcard = match;
3102     }
3103
3104     if (statsp) {
3105         stats = *statsp = xcalloc(ofproto->n_tables, sizeof *stats);
3106         for (i = 0; i < ofproto->n_tables; i++) {
3107             struct ofputil_table_stats *s = &stats[i];
3108             struct classifier *cls = &ofproto->tables[i].cls;
3109
3110             s->table_id = i;
3111             s->active_count = classifier_count(cls);
3112             if (i == 0) {
3113                 s->active_count -= connmgr_count_hidden_rules(
3114                     ofproto->connmgr);
3115             }
3116         }
3117     } else {
3118         stats = NULL;
3119     }
3120
3121     ofproto->ofproto_class->query_tables(ofproto, features, stats);
3122
3123     for (i = 0; i < ofproto->n_tables; i++) {
3124         const struct oftable *table = &ofproto->tables[i];
3125         struct ofputil_table_features *f = &features[i];
3126
3127         if (table->name) {
3128             ovs_strzcpy(f->name, table->name, sizeof f->name);
3129         }
3130
3131         if (table->max_flows < f->max_entries) {
3132             f->max_entries = table->max_flows;
3133         }
3134     }
3135 }
3136
3137 static void
3138 query_switch_features(struct ofproto *ofproto,
3139                       bool *arp_match_ip, uint64_t *ofpacts)
3140 {
3141     struct ofputil_table_features *features, *f;
3142
3143     *arp_match_ip = false;
3144     *ofpacts = 0;
3145
3146     query_tables(ofproto, &features, NULL);
3147     for (f = features; f < &features[ofproto->n_tables]; f++) {
3148         *ofpacts |= f->nonmiss.apply.ofpacts | f->miss.apply.ofpacts;
3149         if (bitmap_is_set(f->match.bm, MFF_ARP_SPA) ||
3150             bitmap_is_set(f->match.bm, MFF_ARP_TPA)) {
3151             *arp_match_ip = true;
3152         }
3153     }
3154     free(features);
3155
3156     /* Sanity check. */
3157     ovs_assert(*ofpacts & (UINT64_C(1) << OFPACT_OUTPUT));
3158 }
3159
3160 static enum ofperr
3161 handle_features_request(struct ofconn *ofconn, const struct ofp_header *oh)
3162 {
3163     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
3164     struct ofputil_switch_features features;
3165     struct ofport *port;
3166     bool arp_match_ip;
3167     struct ofpbuf *b;
3168
3169     query_switch_features(ofproto, &arp_match_ip, &features.ofpacts);
3170
3171     features.datapath_id = ofproto->datapath_id;
3172     features.n_buffers = pktbuf_capacity();
3173     features.n_tables = ofproto_get_n_visible_tables(ofproto);
3174     features.capabilities = (OFPUTIL_C_FLOW_STATS | OFPUTIL_C_TABLE_STATS |
3175                              OFPUTIL_C_PORT_STATS | OFPUTIL_C_QUEUE_STATS |
3176                              OFPUTIL_C_GROUP_STATS);
3177     if (arp_match_ip) {
3178         features.capabilities |= OFPUTIL_C_ARP_MATCH_IP;
3179     }
3180     /* FIXME: Fill in proper features.auxiliary_id for auxiliary connections */
3181     features.auxiliary_id = 0;
3182     b = ofputil_encode_switch_features(&features, ofconn_get_protocol(ofconn),
3183                                        oh->xid);
3184     HMAP_FOR_EACH (port, hmap_node, &ofproto->ports) {
3185         ofputil_put_switch_features_port(&port->pp, b);
3186     }
3187
3188     ofconn_send_reply(ofconn, b);
3189     return 0;
3190 }
3191
3192 static enum ofperr
3193 handle_get_config_request(struct ofconn *ofconn, const struct ofp_header *oh)
3194 {
3195     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
3196     struct ofp_switch_config *osc;
3197     enum ofp_config_flags flags;
3198     struct ofpbuf *buf;
3199
3200     /* Send reply. */
3201     buf = ofpraw_alloc_reply(OFPRAW_OFPT_GET_CONFIG_REPLY, oh, 0);
3202     osc = ofpbuf_put_uninit(buf, sizeof *osc);
3203     flags = ofproto->frag_handling;
3204     /* OFPC_INVALID_TTL_TO_CONTROLLER is deprecated in OF 1.3 */
3205     if (oh->version < OFP13_VERSION
3206         && ofconn_get_invalid_ttl_to_controller(ofconn)) {
3207         flags |= OFPC_INVALID_TTL_TO_CONTROLLER;
3208     }
3209     osc->flags = htons(flags);
3210     osc->miss_send_len = htons(ofconn_get_miss_send_len(ofconn));
3211     ofconn_send_reply(ofconn, buf);
3212
3213     return 0;
3214 }
3215
3216 static enum ofperr
3217 handle_set_config(struct ofconn *ofconn, const struct ofp_header *oh)
3218 {
3219     const struct ofp_switch_config *osc = ofpmsg_body(oh);
3220     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
3221     uint16_t flags = ntohs(osc->flags);
3222
3223     if (ofconn_get_type(ofconn) != OFCONN_PRIMARY
3224         || ofconn_get_role(ofconn) != OFPCR12_ROLE_SLAVE) {
3225         enum ofp_config_flags cur = ofproto->frag_handling;
3226         enum ofp_config_flags next = flags & OFPC_FRAG_MASK;
3227
3228         ovs_assert((cur & OFPC_FRAG_MASK) == cur);
3229         if (cur != next) {
3230             if (ofproto->ofproto_class->set_frag_handling(ofproto, next)) {
3231                 ofproto->frag_handling = next;
3232             } else {
3233                 VLOG_WARN_RL(&rl, "%s: unsupported fragment handling mode %s",
3234                              ofproto->name,
3235                              ofputil_frag_handling_to_string(next));
3236             }
3237         }
3238     }
3239     /* OFPC_INVALID_TTL_TO_CONTROLLER is deprecated in OF 1.3 */
3240     ofconn_set_invalid_ttl_to_controller(ofconn,
3241              (oh->version < OFP13_VERSION
3242               && flags & OFPC_INVALID_TTL_TO_CONTROLLER));
3243
3244     ofconn_set_miss_send_len(ofconn, ntohs(osc->miss_send_len));
3245
3246     return 0;
3247 }
3248
3249 /* Checks whether 'ofconn' is a slave controller.  If so, returns an OpenFlow
3250  * error message code for the caller to propagate upward.  Otherwise, returns
3251  * 0.
3252  *
3253  * The log message mentions 'msg_type'. */
3254 static enum ofperr
3255 reject_slave_controller(struct ofconn *ofconn)
3256 {
3257     if (ofconn_get_type(ofconn) == OFCONN_PRIMARY
3258         && ofconn_get_role(ofconn) == OFPCR12_ROLE_SLAVE) {
3259         return OFPERR_OFPBRC_IS_SLAVE;
3260     } else {
3261         return 0;
3262     }
3263 }
3264
3265 /* Checks that the 'ofpacts_len' bytes of action in 'ofpacts' are appropriate
3266  * for 'ofproto':
3267  *
3268  *    - If they use a meter, then 'ofproto' has that meter configured.
3269  *
3270  *    - If they use any groups, then 'ofproto' has that group configured.
3271  *
3272  * Returns 0 if successful, otherwise an OpenFlow error. */
3273 static enum ofperr
3274 ofproto_check_ofpacts(struct ofproto *ofproto,
3275                       const struct ofpact ofpacts[], size_t ofpacts_len)
3276 {
3277     const struct ofpact *a;
3278     uint32_t mid;
3279
3280     mid = ofpacts_get_meter(ofpacts, ofpacts_len);
3281     if (mid && get_provider_meter_id(ofproto, mid) == UINT32_MAX) {
3282         return OFPERR_OFPMMFC_INVALID_METER;
3283     }
3284
3285     OFPACT_FOR_EACH (a, ofpacts, ofpacts_len) {
3286         if (a->type == OFPACT_GROUP
3287             && !ofproto_group_exists(ofproto, ofpact_get_GROUP(a)->group_id)) {
3288             return OFPERR_OFPBAC_BAD_OUT_GROUP;
3289         }
3290     }
3291
3292     return 0;
3293 }
3294
3295 static enum ofperr
3296 handle_packet_out(struct ofconn *ofconn, const struct ofp_header *oh)
3297 {
3298     struct ofproto *p = ofconn_get_ofproto(ofconn);
3299     struct ofputil_packet_out po;
3300     struct dp_packet *payload;
3301     uint64_t ofpacts_stub[1024 / 8];
3302     struct ofpbuf ofpacts;
3303     struct flow flow;
3304     enum ofperr error;
3305
3306     COVERAGE_INC(ofproto_packet_out);
3307
3308     error = reject_slave_controller(ofconn);
3309     if (error) {
3310         goto exit;
3311     }
3312
3313     /* Decode message. */
3314     ofpbuf_use_stub(&ofpacts, ofpacts_stub, sizeof ofpacts_stub);
3315     error = ofputil_decode_packet_out(&po, oh, &ofpacts);
3316     if (error) {
3317         goto exit_free_ofpacts;
3318     }
3319     if (ofp_to_u16(po.in_port) >= p->max_ports
3320         && ofp_to_u16(po.in_port) < ofp_to_u16(OFPP_MAX)) {
3321         error = OFPERR_OFPBRC_BAD_PORT;
3322         goto exit_free_ofpacts;
3323     }
3324
3325     /* Get payload. */
3326     if (po.buffer_id != UINT32_MAX) {
3327         error = ofconn_pktbuf_retrieve(ofconn, po.buffer_id, &payload, NULL);
3328         if (error || !payload) {
3329             goto exit_free_ofpacts;
3330         }
3331     } else {
3332         /* Ensure that the L3 header is 32-bit aligned. */
3333         payload = dp_packet_clone_data_with_headroom(po.packet, po.packet_len, 2);
3334     }
3335
3336     /* Verify actions against packet, then send packet if successful. */
3337     flow_extract(payload, &flow);
3338     flow.in_port.ofp_port = po.in_port;
3339     error = ofproto_check_ofpacts(p, po.ofpacts, po.ofpacts_len);
3340     if (!error) {
3341         error = p->ofproto_class->packet_out(p, payload, &flow,
3342                                              po.ofpacts, po.ofpacts_len);
3343     }
3344     dp_packet_delete(payload);
3345
3346 exit_free_ofpacts:
3347     ofpbuf_uninit(&ofpacts);
3348 exit:
3349     return error;
3350 }
3351
3352 static void
3353 update_port_config(struct ofconn *ofconn, struct ofport *port,
3354                    enum ofputil_port_config config,
3355                    enum ofputil_port_config mask)
3356 {
3357     enum ofputil_port_config toggle = (config ^ port->pp.config) & mask;
3358
3359     if (toggle & OFPUTIL_PC_PORT_DOWN
3360         && (config & OFPUTIL_PC_PORT_DOWN
3361             ? netdev_turn_flags_off(port->netdev, NETDEV_UP, NULL)
3362             : netdev_turn_flags_on(port->netdev, NETDEV_UP, NULL))) {
3363         /* We tried to bring the port up or down, but it failed, so don't
3364          * update the "down" bit. */
3365         toggle &= ~OFPUTIL_PC_PORT_DOWN;
3366     }
3367
3368     if (toggle) {
3369         enum ofputil_port_config old_config = port->pp.config;
3370         port->pp.config ^= toggle;
3371         port->ofproto->ofproto_class->port_reconfigured(port, old_config);
3372         connmgr_send_port_status(port->ofproto->connmgr, ofconn, &port->pp,
3373                                  OFPPR_MODIFY);
3374     }
3375 }
3376
3377 static enum ofperr
3378 handle_port_mod(struct ofconn *ofconn, const struct ofp_header *oh)
3379 {
3380     struct ofproto *p = ofconn_get_ofproto(ofconn);
3381     struct ofputil_port_mod pm;
3382     struct ofport *port;
3383     enum ofperr error;
3384
3385     error = reject_slave_controller(ofconn);
3386     if (error) {
3387         return error;
3388     }
3389
3390     error = ofputil_decode_port_mod(oh, &pm, false);
3391     if (error) {
3392         return error;
3393     }
3394
3395     port = ofproto_get_port(p, pm.port_no);
3396     if (!port) {
3397         return OFPERR_OFPPMFC_BAD_PORT;
3398     } else if (!eth_addr_equals(port->pp.hw_addr, pm.hw_addr)) {
3399         return OFPERR_OFPPMFC_BAD_HW_ADDR;
3400     } else {
3401         update_port_config(ofconn, port, pm.config, pm.mask);
3402         if (pm.advertise) {
3403             netdev_set_advertisements(port->netdev, pm.advertise);
3404         }
3405     }
3406     return 0;
3407 }
3408
3409 static enum ofperr
3410 handle_desc_stats_request(struct ofconn *ofconn,
3411                           const struct ofp_header *request)
3412 {
3413     static const char *default_mfr_desc = "Nicira, Inc.";
3414     static const char *default_hw_desc = "Open vSwitch";
3415     static const char *default_sw_desc = VERSION;
3416     static const char *default_serial_desc = "None";
3417     static const char *default_dp_desc = "None";
3418
3419     struct ofproto *p = ofconn_get_ofproto(ofconn);
3420     struct ofp_desc_stats *ods;
3421     struct ofpbuf *msg;
3422
3423     msg = ofpraw_alloc_stats_reply(request, 0);
3424     ods = ofpbuf_put_zeros(msg, sizeof *ods);
3425     ovs_strlcpy(ods->mfr_desc, p->mfr_desc ? p->mfr_desc : default_mfr_desc,
3426                 sizeof ods->mfr_desc);
3427     ovs_strlcpy(ods->hw_desc, p->hw_desc ? p->hw_desc : default_hw_desc,
3428                 sizeof ods->hw_desc);
3429     ovs_strlcpy(ods->sw_desc, p->sw_desc ? p->sw_desc : default_sw_desc,
3430                 sizeof ods->sw_desc);
3431     ovs_strlcpy(ods->serial_num,
3432                 p->serial_desc ? p->serial_desc : default_serial_desc,
3433                 sizeof ods->serial_num);
3434     ovs_strlcpy(ods->dp_desc, p->dp_desc ? p->dp_desc : default_dp_desc,
3435                 sizeof ods->dp_desc);
3436     ofconn_send_reply(ofconn, msg);
3437
3438     return 0;
3439 }
3440
3441 static enum ofperr
3442 handle_table_stats_request(struct ofconn *ofconn,
3443                            const struct ofp_header *request)
3444 {
3445     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
3446     struct ofputil_table_features *features;
3447     struct ofputil_table_stats *stats;
3448     struct ofpbuf *reply;
3449     size_t i;
3450
3451     query_tables(ofproto, &features, &stats);
3452
3453     reply = ofputil_encode_table_stats_reply(request);
3454     for (i = 0; i < ofproto->n_tables; i++) {
3455         if (!(ofproto->tables[i].flags & OFTABLE_HIDDEN)) {
3456             ofputil_append_table_stats_reply(reply, &stats[i], &features[i]);
3457         }
3458     }
3459     ofconn_send_reply(ofconn, reply);
3460
3461     free(features);
3462     free(stats);
3463
3464     return 0;
3465 }
3466
3467 static enum ofperr
3468 handle_table_features_request(struct ofconn *ofconn,
3469                               const struct ofp_header *request)
3470 {
3471     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
3472     struct ofputil_table_features *features;
3473     struct ovs_list replies;
3474     struct ofpbuf msg;
3475     size_t i;
3476
3477     ofpbuf_use_const(&msg, request, ntohs(request->length));
3478     ofpraw_pull_assert(&msg);
3479     if (msg.size || ofpmp_more(request)) {
3480         return OFPERR_OFPTFFC_EPERM;
3481     }
3482
3483     query_tables(ofproto, &features, NULL);
3484
3485     ofpmp_init(&replies, request);
3486     for (i = 0; i < ofproto->n_tables; i++) {
3487         if (!(ofproto->tables[i].flags & OFTABLE_HIDDEN)) {
3488             ofputil_append_table_features_reply(&features[i], &replies);
3489         }
3490     }
3491     ofconn_send_replies(ofconn, &replies);
3492
3493     free(features);
3494
3495     return 0;
3496 }
3497
3498 static void
3499 append_port_stat(struct ofport *port, struct ovs_list *replies)
3500 {
3501     struct ofputil_port_stats ops = { .port_no = port->pp.port_no };
3502
3503     calc_duration(port->created, time_msec(),
3504                   &ops.duration_sec, &ops.duration_nsec);
3505
3506     /* Intentionally ignore return value, since errors will set
3507      * 'stats' to all-1s, which is correct for OpenFlow, and
3508      * netdev_get_stats() will log errors. */
3509     ofproto_port_get_stats(port, &ops.stats);
3510
3511     ofputil_append_port_stat(replies, &ops);
3512 }
3513
3514 static void
3515 handle_port_request(struct ofconn *ofconn,
3516                     const struct ofp_header *request, ofp_port_t port_no,
3517                     void (*cb)(struct ofport *, struct ovs_list *replies))
3518 {
3519     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
3520     struct ofport *port;
3521     struct ovs_list replies;
3522
3523     ofpmp_init(&replies, request);
3524     if (port_no != OFPP_ANY) {
3525         port = ofproto_get_port(ofproto, port_no);
3526         if (port) {
3527             cb(port, &replies);
3528         }
3529     } else {
3530         HMAP_FOR_EACH (port, hmap_node, &ofproto->ports) {
3531             cb(port, &replies);
3532         }
3533     }
3534
3535     ofconn_send_replies(ofconn, &replies);
3536 }
3537
3538 static enum ofperr
3539 handle_port_stats_request(struct ofconn *ofconn,
3540                           const struct ofp_header *request)
3541 {
3542     ofp_port_t port_no;
3543     enum ofperr error;
3544
3545     error = ofputil_decode_port_stats_request(request, &port_no);
3546     if (!error) {
3547         handle_port_request(ofconn, request, port_no, append_port_stat);
3548     }
3549     return error;
3550 }
3551
3552 static void
3553 append_port_desc(struct ofport *port, struct ovs_list *replies)
3554 {
3555     ofputil_append_port_desc_stats_reply(&port->pp, replies);
3556 }
3557
3558 static enum ofperr
3559 handle_port_desc_stats_request(struct ofconn *ofconn,
3560                                const struct ofp_header *request)
3561 {
3562     ofp_port_t port_no;
3563     enum ofperr error;
3564
3565     error = ofputil_decode_port_desc_stats_request(request, &port_no);
3566     if (!error) {
3567         handle_port_request(ofconn, request, port_no, append_port_desc);
3568     }
3569     return error;
3570 }
3571
3572 static uint32_t
3573 hash_cookie(ovs_be64 cookie)
3574 {
3575     return hash_uint64((OVS_FORCE uint64_t)cookie);
3576 }
3577
3578 static void
3579 cookies_insert(struct ofproto *ofproto, struct rule *rule)
3580     OVS_REQUIRES(ofproto_mutex)
3581 {
3582     hindex_insert(&ofproto->cookies, &rule->cookie_node,
3583                   hash_cookie(rule->flow_cookie));
3584 }
3585
3586 static void
3587 cookies_remove(struct ofproto *ofproto, struct rule *rule)
3588     OVS_REQUIRES(ofproto_mutex)
3589 {
3590     hindex_remove(&ofproto->cookies, &rule->cookie_node);
3591 }
3592
3593 static void
3594 calc_duration(long long int start, long long int now,
3595               uint32_t *sec, uint32_t *nsec)
3596 {
3597     long long int msecs = now - start;
3598     *sec = msecs / 1000;
3599     *nsec = (msecs % 1000) * (1000 * 1000);
3600 }
3601
3602 /* Checks whether 'table_id' is 0xff or a valid table ID in 'ofproto'.  Returns
3603  * true if 'table_id' is OK, false otherwise.  */
3604 static bool
3605 check_table_id(const struct ofproto *ofproto, uint8_t table_id)
3606 {
3607     return table_id == OFPTT_ALL || table_id < ofproto->n_tables;
3608 }
3609
3610 static struct oftable *
3611 next_visible_table(const struct ofproto *ofproto, uint8_t table_id)
3612 {
3613     struct oftable *table;
3614
3615     for (table = &ofproto->tables[table_id];
3616          table < &ofproto->tables[ofproto->n_tables];
3617          table++) {
3618         if (!(table->flags & OFTABLE_HIDDEN)) {
3619             return table;
3620         }
3621     }
3622
3623     return NULL;
3624 }
3625
3626 static struct oftable *
3627 first_matching_table(const struct ofproto *ofproto, uint8_t table_id)
3628 {
3629     if (table_id == 0xff) {
3630         return next_visible_table(ofproto, 0);
3631     } else if (table_id < ofproto->n_tables) {
3632         return &ofproto->tables[table_id];
3633     } else {
3634         return NULL;
3635     }
3636 }
3637
3638 static struct oftable *
3639 next_matching_table(const struct ofproto *ofproto,
3640                     const struct oftable *table, uint8_t table_id)
3641 {
3642     return (table_id == 0xff
3643             ? next_visible_table(ofproto, (table - ofproto->tables) + 1)
3644             : NULL);
3645 }
3646
3647 /* Assigns TABLE to each oftable, in turn, that matches TABLE_ID in OFPROTO:
3648  *
3649  *   - If TABLE_ID is 0xff, this iterates over every classifier table in
3650  *     OFPROTO, skipping tables marked OFTABLE_HIDDEN.
3651  *
3652  *   - If TABLE_ID is the number of a table in OFPROTO, then the loop iterates
3653  *     only once, for that table.  (This can be used to access tables marked
3654  *     OFTABLE_HIDDEN.)
3655  *
3656  *   - Otherwise, TABLE_ID isn't valid for OFPROTO, so the loop won't be
3657  *     entered at all.  (Perhaps you should have validated TABLE_ID with
3658  *     check_table_id().)
3659  *
3660  * All parameters are evaluated multiple times.
3661  */
3662 #define FOR_EACH_MATCHING_TABLE(TABLE, TABLE_ID, OFPROTO)         \
3663     for ((TABLE) = first_matching_table(OFPROTO, TABLE_ID);       \
3664          (TABLE) != NULL;                                         \
3665          (TABLE) = next_matching_table(OFPROTO, TABLE, TABLE_ID))
3666
3667 /* Initializes 'criteria' in a straightforward way based on the other
3668  * parameters.
3669  *
3670  * By default, the criteria include flows that are read-only, on the assumption
3671  * that the collected flows won't be modified.  Call rule_criteria_require_rw()
3672  * if flows will be modified.
3673  *
3674  * For "loose" matching, the 'priority' parameter is unimportant and may be
3675  * supplied as 0. */
3676 static void
3677 rule_criteria_init(struct rule_criteria *criteria, uint8_t table_id,
3678                    const struct match *match, int priority,
3679                    ovs_be64 cookie, ovs_be64 cookie_mask,
3680                    ofp_port_t out_port, uint32_t out_group)
3681 {
3682     criteria->table_id = table_id;
3683     cls_rule_init(&criteria->cr, match, priority);
3684     criteria->cookie = cookie;
3685     criteria->cookie_mask = cookie_mask;
3686     criteria->out_port = out_port;
3687     criteria->out_group = out_group;
3688
3689     /* We ordinarily want to skip hidden rules, but there has to be a way for
3690      * code internal to OVS to modify and delete them, so if the criteria
3691      * specify a priority that can only be for a hidden flow, then allow hidden
3692      * rules to be selected.  (This doesn't allow OpenFlow clients to meddle
3693      * with hidden flows because OpenFlow uses only a 16-bit field to specify
3694      * priority.) */
3695     criteria->include_hidden = priority > UINT16_MAX;
3696
3697     /* We assume that the criteria are being used to collect flows for reading
3698      * but not modification.  Thus, we should collect read-only flows. */
3699     criteria->include_readonly = true;
3700 }
3701
3702 /* By default, criteria initialized by rule_criteria_init() will match flows
3703  * that are read-only, on the assumption that the collected flows won't be
3704  * modified.  Call this function to match only flows that are be modifiable.
3705  *
3706  * Specify 'can_write_readonly' as false in ordinary circumstances, true if the
3707  * caller has special privileges that allow it to modify even "read-only"
3708  * flows. */
3709 static void
3710 rule_criteria_require_rw(struct rule_criteria *criteria,
3711                          bool can_write_readonly)
3712 {
3713     criteria->include_readonly = can_write_readonly;
3714 }
3715
3716 static void
3717 rule_criteria_destroy(struct rule_criteria *criteria)
3718 {
3719     cls_rule_destroy(&criteria->cr);
3720 }
3721
3722 void
3723 rule_collection_init(struct rule_collection *rules)
3724 {
3725     rules->rules = rules->stub;
3726     rules->n = 0;
3727     rules->capacity = ARRAY_SIZE(rules->stub);
3728 }
3729
3730 void
3731 rule_collection_add(struct rule_collection *rules, struct rule *rule)
3732 {
3733     if (rules->n >= rules->capacity) {
3734         size_t old_size, new_size;
3735
3736         old_size = rules->capacity * sizeof *rules->rules;
3737         rules->capacity *= 2;
3738         new_size = rules->capacity * sizeof *rules->rules;
3739
3740         if (rules->rules == rules->stub) {
3741             rules->rules = xmalloc(new_size);
3742             memcpy(rules->rules, rules->stub, old_size);
3743         } else {
3744             rules->rules = xrealloc(rules->rules, new_size);
3745         }
3746     }
3747
3748     rules->rules[rules->n++] = rule;
3749 }
3750
3751 void
3752 rule_collection_ref(struct rule_collection *rules)
3753     OVS_REQUIRES(ofproto_mutex)
3754 {
3755     size_t i;
3756
3757     for (i = 0; i < rules->n; i++) {
3758         ofproto_rule_ref(rules->rules[i]);
3759     }
3760 }
3761
3762 void
3763 rule_collection_unref(struct rule_collection *rules)
3764 {
3765     size_t i;
3766
3767     for (i = 0; i < rules->n; i++) {
3768         ofproto_rule_unref(rules->rules[i]);
3769     }
3770 }
3771
3772 void
3773 rule_collection_destroy(struct rule_collection *rules)
3774 {
3775     if (rules->rules != rules->stub) {
3776         free(rules->rules);
3777     }
3778
3779     /* Make repeated destruction harmless. */
3780     rule_collection_init(rules);
3781 }
3782
3783 /* Checks whether 'rule' matches 'c' and, if so, adds it to 'rules'.  This
3784  * function verifies most of the criteria in 'c' itself, but the caller must
3785  * check 'c->cr' itself.
3786  *
3787  * Rules that have already been marked as 'to_be_removed' are not collected.
3788  *
3789  * Increments '*n_readonly' if 'rule' wasn't added because it's read-only (and
3790  * 'c' only includes modifiable rules). */
3791 static void
3792 collect_rule(struct rule *rule, const struct rule_criteria *c,
3793              struct rule_collection *rules, size_t *n_readonly)
3794     OVS_REQUIRES(ofproto_mutex)
3795 {
3796     if ((c->table_id == rule->table_id || c->table_id == 0xff)
3797         && ofproto_rule_has_out_port(rule, c->out_port)
3798         && ofproto_rule_has_out_group(rule, c->out_group)
3799         && !((rule->flow_cookie ^ c->cookie) & c->cookie_mask)
3800         && (!rule_is_hidden(rule) || c->include_hidden)
3801         && !rule->cr.to_be_removed) {
3802         /* Rule matches all the criteria... */
3803         if (!rule_is_readonly(rule) || c->include_readonly) {
3804             /* ...add it. */
3805             rule_collection_add(rules, rule);
3806         } else {
3807             /* ...except it's read-only. */
3808             ++*n_readonly;
3809         }
3810     }
3811 }
3812
3813 /* Searches 'ofproto' for rules that match the criteria in 'criteria'.  Matches
3814  * on classifiers rules are done in the "loose" way required for OpenFlow
3815  * OFPFC_MODIFY and OFPFC_DELETE requests.  Puts the selected rules on list
3816  * 'rules'.
3817  *
3818  * Returns 0 on success, otherwise an OpenFlow error code. */
3819 static enum ofperr
3820 collect_rules_loose(struct ofproto *ofproto,
3821                     const struct rule_criteria *criteria,
3822                     struct rule_collection *rules)
3823     OVS_REQUIRES(ofproto_mutex)
3824 {
3825     struct oftable *table;
3826     enum ofperr error = 0;
3827     size_t n_readonly = 0;
3828
3829     rule_collection_init(rules);
3830
3831     if (!check_table_id(ofproto, criteria->table_id)) {
3832         error = OFPERR_OFPBRC_BAD_TABLE_ID;
3833         goto exit;
3834     }
3835
3836     if (criteria->cookie_mask == OVS_BE64_MAX) {
3837         struct rule *rule;
3838
3839         HINDEX_FOR_EACH_WITH_HASH (rule, cookie_node,
3840                                    hash_cookie(criteria->cookie),
3841                                    &ofproto->cookies) {
3842             if (cls_rule_is_loose_match(&rule->cr, &criteria->cr.match)) {
3843                 collect_rule(rule, criteria, rules, &n_readonly);
3844             }
3845         }
3846     } else {
3847         FOR_EACH_MATCHING_TABLE (table, criteria->table_id, ofproto) {
3848             struct rule *rule;
3849
3850             CLS_FOR_EACH_TARGET (rule, cr, &table->cls, &criteria->cr) {
3851                 collect_rule(rule, criteria, rules, &n_readonly);
3852             }
3853         }
3854     }
3855
3856 exit:
3857     if (!error && !rules->n && n_readonly) {
3858         /* We didn't find any rules to modify.  We did find some read-only
3859          * rules that we're not allowed to modify, so report that. */
3860         error = OFPERR_OFPBRC_EPERM;
3861     }
3862     if (error) {
3863         rule_collection_destroy(rules);
3864     }
3865     return error;
3866 }
3867
3868 /* Searches 'ofproto' for rules that match the criteria in 'criteria'.  Matches
3869  * on classifiers rules are done in the "strict" way required for OpenFlow
3870  * OFPFC_MODIFY_STRICT and OFPFC_DELETE_STRICT requests.  Puts the selected
3871  * rules on list 'rules'.
3872  *
3873  * Returns 0 on success, otherwise an OpenFlow error code. */
3874 static enum ofperr
3875 collect_rules_strict(struct ofproto *ofproto,
3876                      const struct rule_criteria *criteria,
3877                      struct rule_collection *rules)
3878     OVS_REQUIRES(ofproto_mutex)
3879 {
3880     struct oftable *table;
3881     size_t n_readonly = 0;
3882     enum ofperr error = 0;
3883
3884     rule_collection_init(rules);
3885
3886     if (!check_table_id(ofproto, criteria->table_id)) {
3887         error = OFPERR_OFPBRC_BAD_TABLE_ID;
3888         goto exit;
3889     }
3890
3891     if (criteria->cookie_mask == OVS_BE64_MAX) {
3892         struct rule *rule;
3893
3894         HINDEX_FOR_EACH_WITH_HASH (rule, cookie_node,
3895                                    hash_cookie(criteria->cookie),
3896                                    &ofproto->cookies) {
3897             if (cls_rule_equal(&rule->cr, &criteria->cr)) {
3898                 collect_rule(rule, criteria, rules, &n_readonly);
3899             }
3900         }
3901     } else {
3902         FOR_EACH_MATCHING_TABLE (table, criteria->table_id, ofproto) {
3903             struct rule *rule;
3904
3905             rule = rule_from_cls_rule(classifier_find_rule_exactly(
3906                                           &table->cls, &criteria->cr));
3907             if (rule) {
3908                 collect_rule(rule, criteria, rules, &n_readonly);
3909             }
3910         }
3911     }
3912
3913 exit:
3914     if (!error && !rules->n && n_readonly) {
3915         /* We didn't find any rules to modify.  We did find some read-only
3916          * rules that we're not allowed to modify, so report that. */
3917         error = OFPERR_OFPBRC_EPERM;
3918     }
3919     if (error) {
3920         rule_collection_destroy(rules);
3921     }
3922     return error;
3923 }
3924
3925 /* Returns 'age_ms' (a duration in milliseconds), converted to seconds and
3926  * forced into the range of a uint16_t. */
3927 static int
3928 age_secs(long long int age_ms)
3929 {
3930     return (age_ms < 0 ? 0
3931             : age_ms >= UINT16_MAX * 1000 ? UINT16_MAX
3932             : (unsigned int) age_ms / 1000);
3933 }
3934
3935 static enum ofperr
3936 handle_flow_stats_request(struct ofconn *ofconn,
3937                           const struct ofp_header *request)
3938     OVS_EXCLUDED(ofproto_mutex)
3939 {
3940     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
3941     struct ofputil_flow_stats_request fsr;
3942     struct rule_criteria criteria;
3943     struct rule_collection rules;
3944     struct ovs_list replies;
3945     enum ofperr error;
3946     size_t i;
3947
3948     error = ofputil_decode_flow_stats_request(&fsr, request);
3949     if (error) {
3950         return error;
3951     }
3952
3953     rule_criteria_init(&criteria, fsr.table_id, &fsr.match, 0, fsr.cookie,
3954                        fsr.cookie_mask, fsr.out_port, fsr.out_group);
3955
3956     ovs_mutex_lock(&ofproto_mutex);
3957     error = collect_rules_loose(ofproto, &criteria, &rules);
3958     rule_criteria_destroy(&criteria);
3959     if (!error) {
3960         rule_collection_ref(&rules);
3961     }
3962     ovs_mutex_unlock(&ofproto_mutex);
3963
3964     if (error) {
3965         return error;
3966     }
3967
3968     ofpmp_init(&replies, request);
3969     for (i = 0; i < rules.n; i++) {
3970         struct rule *rule = rules.rules[i];
3971         long long int now = time_msec();
3972         struct ofputil_flow_stats fs;
3973         long long int created, used, modified;
3974         const struct rule_actions *actions;
3975         enum ofputil_flow_mod_flags flags;
3976
3977         ovs_mutex_lock(&rule->mutex);
3978         fs.cookie = rule->flow_cookie;
3979         fs.idle_timeout = rule->idle_timeout;
3980         fs.hard_timeout = rule->hard_timeout;
3981         fs.importance = rule->importance;
3982         created = rule->created;
3983         modified = rule->modified;
3984         actions = rule_get_actions(rule);
3985         flags = rule->flags;
3986         ovs_mutex_unlock(&rule->mutex);
3987
3988         ofproto->ofproto_class->rule_get_stats(rule, &fs.packet_count,
3989                                                &fs.byte_count, &used);
3990
3991         minimatch_expand(&rule->cr.match, &fs.match);
3992         fs.table_id = rule->table_id;
3993         calc_duration(created, now, &fs.duration_sec, &fs.duration_nsec);
3994         fs.priority = rule->cr.priority;
3995         fs.idle_age = age_secs(now - used);
3996         fs.hard_age = age_secs(now - modified);
3997         fs.ofpacts = actions->ofpacts;
3998         fs.ofpacts_len = actions->ofpacts_len;
3999
4000         fs.flags = flags;
4001         ofputil_append_flow_stats_reply(&fs, &replies);
4002     }
4003
4004     rule_collection_unref(&rules);
4005     rule_collection_destroy(&rules);
4006
4007     ofconn_send_replies(ofconn, &replies);
4008
4009     return 0;
4010 }
4011
4012 static void
4013 flow_stats_ds(struct rule *rule, struct ds *results)
4014 {
4015     uint64_t packet_count, byte_count;
4016     const struct rule_actions *actions;
4017     long long int created, used;
4018
4019     rule->ofproto->ofproto_class->rule_get_stats(rule, &packet_count,
4020                                                  &byte_count, &used);
4021
4022     ovs_mutex_lock(&rule->mutex);
4023     actions = rule_get_actions(rule);
4024     created = rule->created;
4025     ovs_mutex_unlock(&rule->mutex);
4026
4027     if (rule->table_id != 0) {
4028         ds_put_format(results, "table_id=%"PRIu8", ", rule->table_id);
4029     }
4030     ds_put_format(results, "duration=%llds, ", (time_msec() - created) / 1000);
4031     ds_put_format(results, "n_packets=%"PRIu64", ", packet_count);
4032     ds_put_format(results, "n_bytes=%"PRIu64", ", byte_count);
4033     cls_rule_format(&rule->cr, results);
4034     ds_put_char(results, ',');
4035
4036     ds_put_cstr(results, "actions=");
4037     ofpacts_format(actions->ofpacts, actions->ofpacts_len, results);
4038
4039     ds_put_cstr(results, "\n");
4040 }
4041
4042 /* Adds a pretty-printed description of all flows to 'results', including
4043  * hidden flows (e.g., set up by in-band control). */
4044 void
4045 ofproto_get_all_flows(struct ofproto *p, struct ds *results)
4046 {
4047     struct oftable *table;
4048
4049     OFPROTO_FOR_EACH_TABLE (table, p) {
4050         struct rule *rule;
4051
4052         CLS_FOR_EACH (rule, cr, &table->cls) {
4053             flow_stats_ds(rule, results);
4054         }
4055     }
4056 }
4057
4058 /* Obtains the NetFlow engine type and engine ID for 'ofproto' into
4059  * '*engine_type' and '*engine_id', respectively. */
4060 void
4061 ofproto_get_netflow_ids(const struct ofproto *ofproto,
4062                         uint8_t *engine_type, uint8_t *engine_id)
4063 {
4064     ofproto->ofproto_class->get_netflow_ids(ofproto, engine_type, engine_id);
4065 }
4066
4067 /* Checks the status change of CFM on 'ofport'.
4068  *
4069  * Returns true if 'ofproto_class' does not support 'cfm_status_changed'. */
4070 bool
4071 ofproto_port_cfm_status_changed(struct ofproto *ofproto, ofp_port_t ofp_port)
4072 {
4073     struct ofport *ofport = ofproto_get_port(ofproto, ofp_port);
4074     return (ofport && ofproto->ofproto_class->cfm_status_changed
4075             ? ofproto->ofproto_class->cfm_status_changed(ofport)
4076             : true);
4077 }
4078
4079 /* Checks the status of CFM configured on 'ofp_port' within 'ofproto'.
4080  * Returns 0 if the port's CFM status was successfully stored into
4081  * '*status'.  Returns positive errno if the port did not have CFM
4082  * configured.
4083  *
4084  * The caller must provide and own '*status', and must free 'status->rmps'.
4085  * '*status' is indeterminate if the return value is non-zero. */
4086 int
4087 ofproto_port_get_cfm_status(const struct ofproto *ofproto, ofp_port_t ofp_port,
4088                             struct cfm_status *status)
4089 {
4090     struct ofport *ofport = ofproto_get_port(ofproto, ofp_port);
4091     return (ofport && ofproto->ofproto_class->get_cfm_status
4092             ? ofproto->ofproto_class->get_cfm_status(ofport, status)
4093             : EOPNOTSUPP);
4094 }
4095
4096 static enum ofperr
4097 handle_aggregate_stats_request(struct ofconn *ofconn,
4098                                const struct ofp_header *oh)
4099     OVS_EXCLUDED(ofproto_mutex)
4100 {
4101     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
4102     struct ofputil_flow_stats_request request;
4103     struct ofputil_aggregate_stats stats;
4104     bool unknown_packets, unknown_bytes;
4105     struct rule_criteria criteria;
4106     struct rule_collection rules;
4107     struct ofpbuf *reply;
4108     enum ofperr error;
4109     size_t i;
4110
4111     error = ofputil_decode_flow_stats_request(&request, oh);
4112     if (error) {
4113         return error;
4114     }
4115
4116     rule_criteria_init(&criteria, request.table_id, &request.match, 0,
4117                        request.cookie, request.cookie_mask,
4118                        request.out_port, request.out_group);
4119
4120     ovs_mutex_lock(&ofproto_mutex);
4121     error = collect_rules_loose(ofproto, &criteria, &rules);
4122     rule_criteria_destroy(&criteria);
4123     if (!error) {
4124         rule_collection_ref(&rules);
4125     }
4126     ovs_mutex_unlock(&ofproto_mutex);
4127
4128     if (error) {
4129         return error;
4130     }
4131
4132     memset(&stats, 0, sizeof stats);
4133     unknown_packets = unknown_bytes = false;
4134     for (i = 0; i < rules.n; i++) {
4135         struct rule *rule = rules.rules[i];
4136         uint64_t packet_count;
4137         uint64_t byte_count;
4138         long long int used;
4139
4140         ofproto->ofproto_class->rule_get_stats(rule, &packet_count,
4141                                                &byte_count, &used);
4142
4143         if (packet_count == UINT64_MAX) {
4144             unknown_packets = true;
4145         } else {
4146             stats.packet_count += packet_count;
4147         }
4148
4149         if (byte_count == UINT64_MAX) {
4150             unknown_bytes = true;
4151         } else {
4152             stats.byte_count += byte_count;
4153         }
4154
4155         stats.flow_count++;
4156     }
4157     if (unknown_packets) {
4158         stats.packet_count = UINT64_MAX;
4159     }
4160     if (unknown_bytes) {
4161         stats.byte_count = UINT64_MAX;
4162     }
4163
4164     rule_collection_unref(&rules);
4165     rule_collection_destroy(&rules);
4166
4167     reply = ofputil_encode_aggregate_stats_reply(&stats, oh);
4168     ofconn_send_reply(ofconn, reply);
4169
4170     return 0;
4171 }
4172
4173 struct queue_stats_cbdata {
4174     struct ofport *ofport;
4175     struct ovs_list replies;
4176     long long int now;
4177 };
4178
4179 static void
4180 put_queue_stats(struct queue_stats_cbdata *cbdata, uint32_t queue_id,
4181                 const struct netdev_queue_stats *stats)
4182 {
4183     struct ofputil_queue_stats oqs;
4184
4185     oqs.port_no = cbdata->ofport->pp.port_no;
4186     oqs.queue_id = queue_id;
4187     oqs.tx_bytes = stats->tx_bytes;
4188     oqs.tx_packets = stats->tx_packets;
4189     oqs.tx_errors = stats->tx_errors;
4190     if (stats->created != LLONG_MIN) {
4191         calc_duration(stats->created, cbdata->now,
4192                       &oqs.duration_sec, &oqs.duration_nsec);
4193     } else {
4194         oqs.duration_sec = oqs.duration_nsec = UINT32_MAX;
4195     }
4196     ofputil_append_queue_stat(&cbdata->replies, &oqs);
4197 }
4198
4199 static void
4200 handle_queue_stats_dump_cb(uint32_t queue_id,
4201                            struct netdev_queue_stats *stats,
4202                            void *cbdata_)
4203 {
4204     struct queue_stats_cbdata *cbdata = cbdata_;
4205
4206     put_queue_stats(cbdata, queue_id, stats);
4207 }
4208
4209 static enum ofperr
4210 handle_queue_stats_for_port(struct ofport *port, uint32_t queue_id,
4211                             struct queue_stats_cbdata *cbdata)
4212 {
4213     cbdata->ofport = port;
4214     if (queue_id == OFPQ_ALL) {
4215         netdev_dump_queue_stats(port->netdev,
4216                                 handle_queue_stats_dump_cb, cbdata);
4217     } else {
4218         struct netdev_queue_stats stats;
4219
4220         if (!netdev_get_queue_stats(port->netdev, queue_id, &stats)) {
4221             put_queue_stats(cbdata, queue_id, &stats);
4222         } else {
4223             return OFPERR_OFPQOFC_BAD_QUEUE;
4224         }
4225     }
4226     return 0;
4227 }
4228
4229 static enum ofperr
4230 handle_queue_stats_request(struct ofconn *ofconn,
4231                            const struct ofp_header *rq)
4232 {
4233     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
4234     struct queue_stats_cbdata cbdata;
4235     struct ofport *port;
4236     enum ofperr error;
4237     struct ofputil_queue_stats_request oqsr;
4238
4239     COVERAGE_INC(ofproto_queue_req);
4240
4241     ofpmp_init(&cbdata.replies, rq);
4242     cbdata.now = time_msec();
4243
4244     error = ofputil_decode_queue_stats_request(rq, &oqsr);
4245     if (error) {
4246         return error;
4247     }
4248
4249     if (oqsr.port_no == OFPP_ANY) {
4250         error = OFPERR_OFPQOFC_BAD_QUEUE;
4251         HMAP_FOR_EACH (port, hmap_node, &ofproto->ports) {
4252             if (!handle_queue_stats_for_port(port, oqsr.queue_id, &cbdata)) {
4253                 error = 0;
4254             }
4255         }
4256     } else {
4257         port = ofproto_get_port(ofproto, oqsr.port_no);
4258         error = (port
4259                  ? handle_queue_stats_for_port(port, oqsr.queue_id, &cbdata)
4260                  : OFPERR_OFPQOFC_BAD_PORT);
4261     }
4262     if (!error) {
4263         ofconn_send_replies(ofconn, &cbdata.replies);
4264     } else {
4265         ofpbuf_list_delete(&cbdata.replies);
4266     }
4267
4268     return error;
4269 }
4270
4271 static enum ofperr
4272 evict_rules_from_table(struct oftable *table, unsigned int extra_space)
4273     OVS_REQUIRES(ofproto_mutex)
4274 {
4275     enum ofperr error = 0;
4276     struct rule_collection rules;
4277     unsigned int count = classifier_count(&table->cls) + extra_space;
4278     unsigned int max_flows = table->max_flows;
4279
4280     rule_collection_init(&rules);
4281
4282     while (count-- > max_flows) {
4283         struct rule *rule;
4284
4285         if (!choose_rule_to_evict(table, &rule)) {
4286             error = OFPERR_OFPFMFC_TABLE_FULL;
4287             break;
4288         } else {
4289             eviction_group_remove_rule(rule);
4290             rule_collection_add(&rules, rule);
4291         }
4292     }
4293     delete_flows__(&rules, OFPRR_EVICTION, NULL);
4294     rule_collection_destroy(&rules);
4295
4296     return error;
4297 }
4298
4299 static bool
4300 is_conjunction(const struct ofpact *ofpacts, size_t ofpacts_len)
4301 {
4302     return ofpacts_len > 0 && ofpacts->type == OFPACT_CONJUNCTION;
4303 }
4304
4305 static void
4306 get_conjunctions(const struct ofputil_flow_mod *fm,
4307                  struct cls_conjunction **conjsp, size_t *n_conjsp)
4308     OVS_REQUIRES(ofproto_mutex)
4309 {
4310     struct cls_conjunction *conjs = NULL;
4311     int n_conjs = 0;
4312
4313     if (is_conjunction(fm->ofpacts, fm->ofpacts_len)) {
4314         const struct ofpact *ofpact;
4315         int i;
4316
4317         n_conjs = 0;
4318         OFPACT_FOR_EACH (ofpact, fm->ofpacts, fm->ofpacts_len) {
4319             n_conjs++;
4320         }
4321
4322         conjs = xzalloc(n_conjs * sizeof *conjs);
4323         i = 0;
4324         OFPACT_FOR_EACH (ofpact, fm->ofpacts, fm->ofpacts_len) {
4325             struct ofpact_conjunction *oc = ofpact_get_CONJUNCTION(ofpact);
4326             conjs[i].clause = oc->clause;
4327             conjs[i].n_clauses = oc->n_clauses;
4328             conjs[i].id = oc->id;
4329             i++;
4330         }
4331     }
4332
4333     *conjsp = conjs;
4334     *n_conjsp = n_conjs;
4335 }
4336
4337 static void
4338 set_conjunctions(struct rule *rule, const struct cls_conjunction *conjs,
4339                  size_t n_conjs)
4340     OVS_REQUIRES(ofproto_mutex)
4341 {
4342     struct cls_rule *cr = CONST_CAST(struct cls_rule *, &rule->cr);
4343
4344     cls_rule_set_conjunctions(cr, conjs, n_conjs);
4345 }
4346
4347 /* Implements OFPFC_ADD and the cases for OFPFC_MODIFY and OFPFC_MODIFY_STRICT
4348  * in which no matching flow already exists in the flow table.
4349  *
4350  * Adds the flow specified by 'fm', to the ofproto's flow table.  Returns 0 on
4351  * success, or an OpenFlow error code on failure.
4352  *
4353  * On successful return the caller must complete the operation either by
4354  * calling add_flow_finish(), or add_flow_revert() if the operation needs to
4355  * be reverted.
4356  *
4357  * The caller retains ownership of 'fm->ofpacts'. */
4358 static enum ofperr
4359 add_flow_begin(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
4360                struct rule **rulep, bool *modify)
4361     OVS_REQUIRES(ofproto_mutex)
4362 {
4363     struct oftable *table;
4364     struct cls_rule cr;
4365     struct rule *rule;
4366     uint8_t table_id;
4367     enum ofperr error = 0;
4368
4369     if (!check_table_id(ofproto, fm->table_id)) {
4370         error = OFPERR_OFPBRC_BAD_TABLE_ID;
4371         return error;
4372     }
4373
4374     /* Pick table. */
4375     if (fm->table_id == 0xff) {
4376         if (ofproto->ofproto_class->rule_choose_table) {
4377             error = ofproto->ofproto_class->rule_choose_table(ofproto,
4378                                                               &fm->match,
4379                                                               &table_id);
4380             if (error) {
4381                 return error;
4382             }
4383             ovs_assert(table_id < ofproto->n_tables);
4384         } else {
4385             table_id = 0;
4386         }
4387     } else if (fm->table_id < ofproto->n_tables) {
4388         table_id = fm->table_id;
4389     } else {
4390         return OFPERR_OFPBRC_BAD_TABLE_ID;
4391     }
4392
4393     table = &ofproto->tables[table_id];
4394     if (table->flags & OFTABLE_READONLY
4395         && !(fm->flags & OFPUTIL_FF_NO_READONLY)) {
4396         return OFPERR_OFPBRC_EPERM;
4397     }
4398
4399     if (!(fm->flags & OFPUTIL_FF_HIDDEN_FIELDS)
4400         && !match_has_default_hidden_fields(&fm->match)) {
4401         VLOG_WARN_RL(&rl, "%s: (add_flow) only internal flows can set "
4402                      "non-default values to hidden fields", ofproto->name);
4403         return OFPERR_OFPBRC_EPERM;
4404     }
4405
4406     cls_rule_init(&cr, &fm->match, fm->priority);
4407
4408     /* Check for the existence of an identical rule.
4409      * This will not return rules earlier marked as 'to_be_removed'. */
4410     rule = rule_from_cls_rule(classifier_find_rule_exactly(&table->cls, &cr));
4411     if (rule) {
4412         /* Transform "add" into "modify" of an existing identical flow. */
4413         cls_rule_destroy(&cr);
4414
4415         fm->modify_cookie = true;
4416         error = modify_flow_check__(ofproto, fm, rule);
4417         if (error) {
4418             return error;
4419         }
4420
4421         *modify = true;
4422     } else {   /* New rule. */
4423         struct cls_conjunction *conjs;
4424         size_t n_conjs;
4425
4426         /* Check for overlap, if requested. */
4427         if (fm->flags & OFPUTIL_FF_CHECK_OVERLAP
4428             && classifier_rule_overlaps(&table->cls, &cr)) {
4429             cls_rule_destroy(&cr);
4430             return OFPERR_OFPFMFC_OVERLAP;
4431         }
4432
4433         /* If necessary, evict an existing rule to clear out space. */
4434         error = evict_rules_from_table(table, 1);
4435         if (error) {
4436             cls_rule_destroy(&cr);
4437             return error;
4438         }
4439
4440         /* Allocate new rule. */
4441         error = ofproto_rule_create(ofproto, fm, &cr, table - ofproto->tables,
4442                                     &rule);
4443         if (error) {
4444             return error;
4445         }
4446
4447         /* Insert flow to the classifier, so that later flow_mods may relate
4448          * to it.  This is reversible, in case later errors require this to
4449          * be reverted. */
4450         ofproto_rule_insert__(ofproto, rule);
4451         /* Make the new rule invisible for classifier lookups. */
4452         classifier_defer(&table->cls);
4453         get_conjunctions(fm, &conjs, &n_conjs);
4454         classifier_insert(&table->cls, &rule->cr, conjs, n_conjs);
4455         free(conjs);
4456
4457         error = ofproto->ofproto_class->rule_insert(rule);
4458         if (error) {
4459             oftable_remove_rule(rule);
4460             ofproto_rule_unref(rule);
4461             return error;
4462         }
4463
4464         *modify = false;
4465     }
4466
4467     *rulep = rule;
4468     return 0;
4469 }
4470
4471 /* Revert the effects of add_flow_begin().
4472  * 'new_rule' must be passed in as NULL, if no new rule was allocated and
4473  * inserted to the classifier.
4474  * Note: evictions cannot be reverted. */
4475 static void
4476 add_flow_revert(struct ofproto *ofproto, struct rule *new_rule)
4477     OVS_REQUIRES(ofproto_mutex)
4478 {
4479     /* Old rule was not changed yet, only need to revert a new rule. */
4480     if (new_rule) {
4481         struct oftable *table = &ofproto->tables[new_rule->table_id];
4482
4483         if (!classifier_remove(&table->cls, &new_rule->cr)) {
4484             OVS_NOT_REACHED();
4485         }
4486         classifier_publish(&table->cls);
4487
4488         ofproto_rule_remove__(ofproto, new_rule);
4489         ofproto->ofproto_class->rule_delete(new_rule);
4490         ofproto_rule_unref(new_rule);
4491     }
4492 }
4493
4494 static void
4495 add_flow_finish(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
4496                 const struct flow_mod_requester *req,
4497                 struct rule *rule, bool modify)
4498     OVS_REQUIRES(ofproto_mutex)
4499 {
4500     if (modify) {
4501         struct ovs_list dead_cookies = OVS_LIST_INITIALIZER(&dead_cookies);
4502
4503         modify_flow__(ofproto, fm, req, rule, &dead_cookies);
4504         learned_cookies_flush(ofproto, &dead_cookies);
4505     } else {
4506         struct oftable *table = &ofproto->tables[rule->table_id];
4507
4508         cls_rule_make_visible(&rule->cr);
4509         classifier_publish(&table->cls);
4510
4511         learned_cookies_inc(ofproto, rule_get_actions(rule));
4512
4513         if (minimask_get_vid_mask(&rule->cr.match.mask) == VLAN_VID_MASK) {
4514             if (ofproto->vlan_bitmap) {
4515                 uint16_t vid = miniflow_get_vid(&rule->cr.match.flow);
4516
4517                 if (!bitmap_is_set(ofproto->vlan_bitmap, vid)) {
4518                     bitmap_set1(ofproto->vlan_bitmap, vid);
4519                     ofproto->vlans_changed = true;
4520                 }
4521             } else {
4522                 ofproto->vlans_changed = true;
4523             }
4524         }
4525
4526         ofmonitor_report(ofproto->connmgr, rule, NXFME_ADDED, 0,
4527                          req ? req->ofconn : NULL,
4528                          req ? req->request->xid : 0, NULL);
4529     }
4530
4531     send_buffered_packet(req, fm->buffer_id, rule);
4532 }
4533 \f
4534 /* OFPFC_MODIFY and OFPFC_MODIFY_STRICT. */
4535
4536 /* Checks if the 'rule' can be modified to match 'fm'.
4537  *
4538  * Returns 0 on success, otherwise an OpenFlow error code. */
4539 static enum ofperr
4540 modify_flow_check__(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
4541                     const struct rule *rule)
4542     OVS_REQUIRES(ofproto_mutex)
4543 {
4544     if (ofproto->ofproto_class->rule_premodify_actions) {
4545         return ofproto->ofproto_class->rule_premodify_actions(
4546             rule, fm->ofpacts, fm->ofpacts_len);
4547     }
4548     return 0;
4549 }
4550
4551 /* Checks if the rules listed in 'rules' can have their actions changed to
4552  * match those in 'fm'.
4553  *
4554  * Returns 0 on success, otherwise an OpenFlow error code. */
4555 static enum ofperr
4556 modify_flows_check__(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
4557                      const struct rule_collection *rules)
4558     OVS_REQUIRES(ofproto_mutex)
4559 {
4560     enum ofperr error;
4561     size_t i;
4562
4563     if (ofproto->ofproto_class->rule_premodify_actions) {
4564         for (i = 0; i < rules->n; i++) {
4565             error = modify_flow_check__(ofproto, fm, rules->rules[i]);
4566             if (error) {
4567                 return error;
4568             }
4569         }
4570     }
4571
4572     return 0;
4573 }
4574
4575 /* Modifies the 'rule', changing them to match 'fm'. */
4576 static void
4577 modify_flow__(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
4578               const struct flow_mod_requester *req, struct rule *rule,
4579               struct ovs_list *dead_cookies)
4580     OVS_REQUIRES(ofproto_mutex)
4581 {
4582     enum nx_flow_update_event event = fm->command == OFPFC_ADD
4583         ? NXFME_ADDED : NXFME_MODIFIED;
4584
4585     /*  'fm' says that  */
4586     bool change_cookie = (fm->modify_cookie
4587                           && fm->new_cookie != OVS_BE64_MAX
4588                           && fm->new_cookie != rule->flow_cookie);
4589
4590     const struct rule_actions *actions = rule_get_actions(rule);
4591     bool change_actions = !ofpacts_equal(fm->ofpacts, fm->ofpacts_len,
4592                                          actions->ofpacts,
4593                                          actions->ofpacts_len);
4594
4595     bool reset_counters = (fm->flags & OFPUTIL_FF_RESET_COUNTS) != 0;
4596
4597     long long int now = time_msec();
4598
4599     if (change_cookie) {
4600         cookies_remove(ofproto, rule);
4601     }
4602
4603     ovs_mutex_lock(&rule->mutex);
4604     if (fm->command == OFPFC_ADD) {
4605         rule->idle_timeout = fm->idle_timeout;
4606         rule->hard_timeout = fm->hard_timeout;
4607         rule->importance = fm->importance;
4608         rule->flags = fm->flags & OFPUTIL_FF_STATE;
4609         rule->created = now;
4610     }
4611     if (change_cookie) {
4612         rule->flow_cookie = fm->new_cookie;
4613     }
4614     rule->modified = now;
4615     ovs_mutex_unlock(&rule->mutex);
4616
4617     if (change_cookie) {
4618         cookies_insert(ofproto, rule);
4619     }
4620     if (fm->command == OFPFC_ADD) {
4621         if (fm->idle_timeout || fm->hard_timeout || fm->importance) {
4622             if (!rule->eviction_group) {
4623                 eviction_group_add_rule(rule);
4624             }
4625         } else {
4626             eviction_group_remove_rule(rule);
4627         }
4628     }
4629
4630     if (change_actions) {
4631         /* We have to change the actions.  The rule's conjunctive match set
4632          * is a function of its actions, so we need to update that too.  The
4633          * conjunctive match set is used in the lookup process to figure
4634          * which (if any) collection of conjunctive sets the packet matches
4635          * with.  However, a rule with conjunction actions is never to be
4636          * returned as a classifier lookup result.  To make sure a rule with
4637          * conjunction actions is not returned as a lookup result, we update
4638          * them in a carefully chosen order:
4639          *
4640          * - If we're adding a conjunctive match set where there wasn't one
4641          *   before, we have to make the conjunctive match set available to
4642          *   lookups before the rule's actions are changed, as otherwise
4643          *   rule with a conjunction action could be returned as a lookup
4644          *   result.
4645          *
4646          * - To clear some nonempty conjunctive set, we set the rule's
4647          *   actions first, so that a lookup can't return a rule with
4648          *   conjunction actions.
4649          *
4650          * - Otherwise, order doesn't matter for changing one nonempty
4651          *   conjunctive match set to some other nonempty set, since the
4652          *   rule's actions are not seen by the classifier, and hence don't
4653          *   matter either before or after the change. */
4654         struct cls_conjunction *conjs;
4655         size_t n_conjs;
4656         get_conjunctions(fm, &conjs, &n_conjs);
4657
4658         if (n_conjs) {
4659             set_conjunctions(rule, conjs, n_conjs);
4660         }
4661         ovsrcu_set(&rule->actions, rule_actions_create(fm->ofpacts,
4662                                                            fm->ofpacts_len));
4663         if (!conjs) {
4664             set_conjunctions(rule, conjs, n_conjs);
4665         }
4666
4667         free(conjs);
4668     }
4669
4670     if (change_actions || reset_counters) {
4671         ofproto->ofproto_class->rule_modify_actions(rule, reset_counters);
4672     }
4673
4674     if (event != NXFME_MODIFIED || change_actions || change_cookie) {
4675         ofmonitor_report(ofproto->connmgr, rule, event, 0,
4676                          req ? req->ofconn : NULL, req ? req->request->xid : 0,
4677                          change_actions ? actions : NULL);
4678     }
4679
4680     if (change_actions) {
4681         learned_cookies_inc(ofproto, rule_get_actions(rule));
4682         learned_cookies_dec(ofproto, actions, dead_cookies);
4683         rule_actions_destroy(actions);
4684     }
4685 }
4686
4687 /* Modifies the rules listed in 'rules', changing their actions to match those
4688  * in 'fm'.
4689  *
4690  * 'req' is used to retrieve the packet buffer specified in fm->buffer_id,
4691  * if any. */
4692 static void
4693 modify_flows__(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
4694                const struct flow_mod_requester *req,
4695                const struct rule_collection *rules)
4696     OVS_REQUIRES(ofproto_mutex)
4697 {
4698     struct ovs_list dead_cookies = OVS_LIST_INITIALIZER(&dead_cookies);
4699     size_t i;
4700
4701     for (i = 0; i < rules->n; i++) {
4702         modify_flow__(ofproto, fm, req, rules->rules[i], &dead_cookies);
4703     }
4704     learned_cookies_flush(ofproto, &dead_cookies);
4705 }
4706
4707 static enum ofperr
4708 modify_flows_begin__(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
4709                      struct rule_collection *rules)
4710     OVS_REQUIRES(ofproto_mutex)
4711 {
4712     enum ofperr error;
4713
4714     if (rules->n > 0) {
4715         error = modify_flows_check__(ofproto, fm, rules);
4716     } else if (!(fm->cookie_mask != htonll(0)
4717                  || fm->new_cookie == OVS_BE64_MAX)) {
4718         bool modify;
4719
4720         error = add_flow_begin(ofproto, fm, &rules->rules[0], &modify);
4721         if (!error) {
4722             ovs_assert(!modify);
4723         }
4724     } else {
4725         rules->rules[0] = NULL;
4726         error = 0;
4727     }
4728     return error;
4729 }
4730
4731 /* Implements OFPFC_MODIFY.  Returns 0 on success or an OpenFlow error code on
4732  * failure.
4733  *
4734  * 'ofconn' is used to retrieve the packet buffer specified in fm->buffer_id,
4735  * if any. */
4736 static enum ofperr
4737 modify_flows_begin_loose(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
4738                          struct rule_collection *rules)
4739     OVS_REQUIRES(ofproto_mutex)
4740 {
4741     struct rule_criteria criteria;
4742     enum ofperr error;
4743
4744     rule_criteria_init(&criteria, fm->table_id, &fm->match, 0,
4745                        fm->cookie, fm->cookie_mask, OFPP_ANY, OFPG11_ANY);
4746     rule_criteria_require_rw(&criteria,
4747                              (fm->flags & OFPUTIL_FF_NO_READONLY) != 0);
4748     error = collect_rules_loose(ofproto, &criteria, rules);
4749     rule_criteria_destroy(&criteria);
4750
4751     if (!error) {
4752         error = modify_flows_begin__(ofproto, fm, rules);
4753     }
4754
4755     if (error) {
4756         rule_collection_destroy(rules);
4757     }
4758     return error;
4759 }
4760
4761 static void
4762 modify_flows_revert(struct ofproto *ofproto, struct rule_collection *rules)
4763     OVS_REQUIRES(ofproto_mutex)
4764 {
4765     /* Old rules were not changed yet, only need to revert a new rule. */
4766     if (rules->n == 0 && rules->rules[0] != NULL) {
4767         add_flow_revert(ofproto, rules->rules[0]);
4768     }
4769     rule_collection_destroy(rules);
4770 }
4771
4772 static void
4773 modify_flows_finish(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
4774                     const struct flow_mod_requester *req,
4775                     struct rule_collection *rules)
4776     OVS_REQUIRES(ofproto_mutex)
4777 {
4778     if (rules->n > 0) {
4779         modify_flows__(ofproto, fm, req, rules);
4780         send_buffered_packet(req, fm->buffer_id, rules->rules[0]);
4781     } else if (rules->rules[0] != NULL) {
4782         add_flow_finish(ofproto, fm, req, rules->rules[0], false);
4783     }
4784     rule_collection_destroy(rules);
4785 }
4786
4787 /* Implements OFPFC_MODIFY_STRICT.  Returns 0 on success or an OpenFlow error
4788  * code on failure. */
4789 static enum ofperr
4790 modify_flow_begin_strict(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
4791                          struct rule_collection *rules)
4792     OVS_REQUIRES(ofproto_mutex)
4793 {
4794     struct rule_criteria criteria;
4795     enum ofperr error;
4796
4797     rule_criteria_init(&criteria, fm->table_id, &fm->match, fm->priority,
4798                        fm->cookie, fm->cookie_mask, OFPP_ANY, OFPG11_ANY);
4799     rule_criteria_require_rw(&criteria,
4800                              (fm->flags & OFPUTIL_FF_NO_READONLY) != 0);
4801     error = collect_rules_strict(ofproto, &criteria, rules);
4802     rule_criteria_destroy(&criteria);
4803
4804     if (!error) {
4805         /* collect_rules_strict() can return max 1 rule. */
4806         error = modify_flows_begin__(ofproto, fm, rules);
4807     }
4808
4809     if (error) {
4810         rule_collection_destroy(rules);
4811     }
4812     return error;
4813 }
4814 \f
4815 /* OFPFC_DELETE implementation. */
4816
4817 /* Deletes the rules listed in 'rules'. */
4818 static void
4819 delete_flows__(const struct rule_collection *rules,
4820                enum ofp_flow_removed_reason reason,
4821                const struct flow_mod_requester *req)
4822     OVS_REQUIRES(ofproto_mutex)
4823 {
4824     if (rules->n) {
4825         struct ovs_list dead_cookies = OVS_LIST_INITIALIZER(&dead_cookies);
4826         struct ofproto *ofproto = rules->rules[0]->ofproto;
4827         struct rule *rule, *next;
4828         size_t i;
4829
4830         for (i = 0, next = rules->rules[0];
4831              rule = next, next = (++i < rules->n) ? rules->rules[i] : NULL,
4832                  rule; ) {
4833             struct classifier *cls = &ofproto->tables[rule->table_id].cls;
4834             uint8_t next_table = next ? next->table_id : UINT8_MAX;
4835
4836             ofproto_rule_send_removed(rule, reason);
4837
4838             ofmonitor_report(ofproto->connmgr, rule, NXFME_DELETED, reason,
4839                              req ? req->ofconn : NULL,
4840                              req ? req->request->xid : 0, NULL);
4841
4842             if (next_table == rule->table_id) {
4843                 classifier_defer(cls);
4844             }
4845             classifier_remove(cls, &rule->cr);
4846             if (next_table != rule->table_id) {
4847                 classifier_publish(cls);
4848             }
4849             ofproto_rule_remove__(ofproto, rule);
4850
4851             ofproto->ofproto_class->rule_delete(rule);
4852
4853             learned_cookies_dec(ofproto, rule_get_actions(rule),
4854                                 &dead_cookies);
4855
4856             ofproto_rule_unref(rule);
4857         }
4858         learned_cookies_flush(ofproto, &dead_cookies);
4859         ofmonitor_flush(ofproto->connmgr);
4860     }
4861 }
4862
4863 /* Implements OFPFC_DELETE. */
4864 static enum ofperr
4865 delete_flows_begin_loose(struct ofproto *ofproto,
4866                          const struct ofputil_flow_mod *fm,
4867                          struct rule_collection *rules)
4868     OVS_REQUIRES(ofproto_mutex)
4869 {
4870     struct rule_criteria criteria;
4871     enum ofperr error;
4872
4873     rule_criteria_init(&criteria, fm->table_id, &fm->match, 0,
4874                        fm->cookie, fm->cookie_mask,
4875                        fm->out_port, fm->out_group);
4876     rule_criteria_require_rw(&criteria,
4877                              (fm->flags & OFPUTIL_FF_NO_READONLY) != 0);
4878     error = collect_rules_loose(ofproto, &criteria, rules);
4879     rule_criteria_destroy(&criteria);
4880
4881     if (!error) {
4882         for (size_t i = 0; i < rules->n; i++) {
4883             struct rule *rule = rules->rules[i];
4884
4885             CONST_CAST(struct cls_rule *, &rule->cr)->to_be_removed = true;
4886         }
4887     }
4888
4889     return error;
4890 }
4891
4892 static void
4893 delete_flows_revert(struct rule_collection *rules)
4894     OVS_REQUIRES(ofproto_mutex)
4895 {
4896     for (size_t i = 0; i < rules->n; i++) {
4897         struct rule *rule = rules->rules[i];
4898
4899         CONST_CAST(struct cls_rule *, &rule->cr)->to_be_removed = false;
4900     }
4901     rule_collection_destroy(rules);
4902 }
4903
4904 static void
4905 delete_flows_finish(const struct ofputil_flow_mod *fm,
4906                     const struct flow_mod_requester *req,
4907                     struct rule_collection *rules)
4908     OVS_REQUIRES(ofproto_mutex)
4909 {
4910     delete_flows__(rules, fm->delete_reason, req);
4911     rule_collection_destroy(rules);
4912 }
4913
4914 /* Implements OFPFC_DELETE_STRICT. */
4915 static enum ofperr
4916 delete_flow_begin_strict(struct ofproto *ofproto,
4917                          const struct ofputil_flow_mod *fm,
4918                          struct rule_collection *rules)
4919     OVS_REQUIRES(ofproto_mutex)
4920 {
4921     struct rule_criteria criteria;
4922     enum ofperr error;
4923
4924     rule_criteria_init(&criteria, fm->table_id, &fm->match, fm->priority,
4925                        fm->cookie, fm->cookie_mask,
4926                        fm->out_port, fm->out_group);
4927     rule_criteria_require_rw(&criteria,
4928                              (fm->flags & OFPUTIL_FF_NO_READONLY) != 0);
4929     error = collect_rules_strict(ofproto, &criteria, rules);
4930     rule_criteria_destroy(&criteria);
4931
4932     if (!error) {
4933         for (size_t i = 0; i < rules->n; i++) {
4934             struct rule *rule = rules->rules[i];
4935
4936             CONST_CAST(struct cls_rule *, &rule->cr)->to_be_removed = true;
4937         }
4938     }
4939
4940     return error;
4941 }
4942
4943 static void
4944 ofproto_rule_send_removed(struct rule *rule, uint8_t reason)
4945     OVS_REQUIRES(ofproto_mutex)
4946 {
4947     struct ofputil_flow_removed fr;
4948     long long int used;
4949
4950     if (rule_is_hidden(rule) ||
4951         !(rule->flags & OFPUTIL_FF_SEND_FLOW_REM)) {
4952         return;
4953     }
4954
4955     minimatch_expand(&rule->cr.match, &fr.match);
4956     fr.priority = rule->cr.priority;
4957     fr.cookie = rule->flow_cookie;
4958     fr.reason = reason;
4959     fr.table_id = rule->table_id;
4960     calc_duration(rule->created, time_msec(),
4961                   &fr.duration_sec, &fr.duration_nsec);
4962     ovs_mutex_lock(&rule->mutex);
4963     fr.idle_timeout = rule->idle_timeout;
4964     fr.hard_timeout = rule->hard_timeout;
4965     ovs_mutex_unlock(&rule->mutex);
4966     rule->ofproto->ofproto_class->rule_get_stats(rule, &fr.packet_count,
4967                                                  &fr.byte_count, &used);
4968
4969     connmgr_send_flow_removed(rule->ofproto->connmgr, &fr);
4970 }
4971
4972 /* Sends an OpenFlow "flow removed" message with the given 'reason' (either
4973  * OFPRR_HARD_TIMEOUT or OFPRR_IDLE_TIMEOUT), and then removes 'rule' from its
4974  * ofproto.
4975  *
4976  * ofproto implementation ->run() functions should use this function to expire
4977  * OpenFlow flows. */
4978 void
4979 ofproto_rule_expire(struct rule *rule, uint8_t reason)
4980     OVS_REQUIRES(ofproto_mutex)
4981 {
4982     struct rule_collection rules;
4983
4984     rules.rules = rules.stub;
4985     rules.n = 1;
4986     rules.stub[0] = rule;
4987     delete_flows__(&rules, reason, NULL);
4988 }
4989
4990 /* Reduces '*timeout' to no more than 'max'.  A value of zero in either case
4991  * means "infinite". */
4992 static void
4993 reduce_timeout(uint16_t max, uint16_t *timeout)
4994 {
4995     if (max && (!*timeout || *timeout > max)) {
4996         *timeout = max;
4997     }
4998 }
4999
5000 /* If 'idle_timeout' is nonzero, and 'rule' has no idle timeout or an idle
5001  * timeout greater than 'idle_timeout', lowers 'rule''s idle timeout to
5002  * 'idle_timeout' seconds.  Similarly for 'hard_timeout'.
5003  *
5004  * Suitable for implementing OFPACT_FIN_TIMEOUT. */
5005 void
5006 ofproto_rule_reduce_timeouts(struct rule *rule,
5007                              uint16_t idle_timeout, uint16_t hard_timeout)
5008     OVS_EXCLUDED(ofproto_mutex, rule->mutex)
5009 {
5010     if (!idle_timeout && !hard_timeout) {
5011         return;
5012     }
5013
5014     ovs_mutex_lock(&ofproto_mutex);
5015     if (list_is_empty(&rule->expirable)) {
5016         list_insert(&rule->ofproto->expirable, &rule->expirable);
5017     }
5018     ovs_mutex_unlock(&ofproto_mutex);
5019
5020     ovs_mutex_lock(&rule->mutex);
5021     reduce_timeout(idle_timeout, &rule->idle_timeout);
5022     reduce_timeout(hard_timeout, &rule->hard_timeout);
5023     ovs_mutex_unlock(&rule->mutex);
5024 }
5025 \f
5026 static enum ofperr
5027 handle_flow_mod(struct ofconn *ofconn, const struct ofp_header *oh)
5028     OVS_EXCLUDED(ofproto_mutex)
5029 {
5030     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
5031     struct ofputil_flow_mod fm;
5032     uint64_t ofpacts_stub[1024 / 8];
5033     struct ofpbuf ofpacts;
5034     enum ofperr error;
5035
5036     error = reject_slave_controller(ofconn);
5037     if (error) {
5038         goto exit;
5039     }
5040
5041     ofpbuf_use_stub(&ofpacts, ofpacts_stub, sizeof ofpacts_stub);
5042     error = ofputil_decode_flow_mod(&fm, oh, ofconn_get_protocol(ofconn),
5043                                     &ofpacts,
5044                                     u16_to_ofp(ofproto->max_ports),
5045                                     ofproto->n_tables);
5046     if (!error) {
5047         error = ofproto_check_ofpacts(ofproto, fm.ofpacts, fm.ofpacts_len);
5048     }
5049     if (!error) {
5050         struct flow_mod_requester req;
5051
5052         req.ofconn = ofconn;
5053         req.request = oh;
5054         error = handle_flow_mod__(ofproto, &fm, &req);
5055     }
5056     if (error) {
5057         goto exit_free_ofpacts;
5058     }
5059
5060     ofconn_report_flow_mod(ofconn, fm.command);
5061
5062 exit_free_ofpacts:
5063     ofpbuf_uninit(&ofpacts);
5064 exit:
5065     return error;
5066 }
5067
5068 static enum ofperr
5069 handle_flow_mod__(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
5070                   const struct flow_mod_requester *req)
5071     OVS_EXCLUDED(ofproto_mutex)
5072 {
5073     struct ofp_bundle_entry be;
5074     enum ofperr error;
5075
5076     ovs_mutex_lock(&ofproto_mutex);
5077     error = do_bundle_flow_mod_begin(ofproto, fm, &be);
5078     if (!error) {
5079         do_bundle_flow_mod_finish(ofproto, fm, req, &be);
5080     }
5081     ofmonitor_flush(ofproto->connmgr);
5082     ovs_mutex_unlock(&ofproto_mutex);
5083
5084     run_rule_executes(ofproto);
5085     return error;
5086 }
5087
5088 static enum ofperr
5089 handle_role_request(struct ofconn *ofconn, const struct ofp_header *oh)
5090 {
5091     struct ofputil_role_request request;
5092     struct ofputil_role_request reply;
5093     struct ofpbuf *buf;
5094     enum ofperr error;
5095
5096     error = ofputil_decode_role_message(oh, &request);
5097     if (error) {
5098         return error;
5099     }
5100
5101     if (request.role != OFPCR12_ROLE_NOCHANGE) {
5102         if (request.have_generation_id
5103             && !ofconn_set_master_election_id(ofconn, request.generation_id)) {
5104                 return OFPERR_OFPRRFC_STALE;
5105         }
5106
5107         ofconn_set_role(ofconn, request.role);
5108     }
5109
5110     reply.role = ofconn_get_role(ofconn);
5111     reply.have_generation_id = ofconn_get_master_election_id(
5112         ofconn, &reply.generation_id);
5113     buf = ofputil_encode_role_reply(oh, &reply);
5114     ofconn_send_reply(ofconn, buf);
5115
5116     return 0;
5117 }
5118
5119 static enum ofperr
5120 handle_nxt_flow_mod_table_id(struct ofconn *ofconn,
5121                              const struct ofp_header *oh)
5122 {
5123     const struct nx_flow_mod_table_id *msg = ofpmsg_body(oh);
5124     enum ofputil_protocol cur, next;
5125
5126     cur = ofconn_get_protocol(ofconn);
5127     next = ofputil_protocol_set_tid(cur, msg->set != 0);
5128     ofconn_set_protocol(ofconn, next);
5129
5130     return 0;
5131 }
5132
5133 static enum ofperr
5134 handle_nxt_set_flow_format(struct ofconn *ofconn, const struct ofp_header *oh)
5135 {
5136     const struct nx_set_flow_format *msg = ofpmsg_body(oh);
5137     enum ofputil_protocol cur, next;
5138     enum ofputil_protocol next_base;
5139
5140     next_base = ofputil_nx_flow_format_to_protocol(ntohl(msg->format));
5141     if (!next_base) {
5142         return OFPERR_OFPBRC_EPERM;
5143     }
5144
5145     cur = ofconn_get_protocol(ofconn);
5146     next = ofputil_protocol_set_base(cur, next_base);
5147     ofconn_set_protocol(ofconn, next);
5148
5149     return 0;
5150 }
5151
5152 static enum ofperr
5153 handle_nxt_set_packet_in_format(struct ofconn *ofconn,
5154                                 const struct ofp_header *oh)
5155 {
5156     const struct nx_set_packet_in_format *msg = ofpmsg_body(oh);
5157     uint32_t format;
5158
5159     format = ntohl(msg->format);
5160     if (format != NXPIF_OPENFLOW10 && format != NXPIF_NXM) {
5161         return OFPERR_OFPBRC_EPERM;
5162     }
5163
5164     ofconn_set_packet_in_format(ofconn, format);
5165     return 0;
5166 }
5167
5168 static enum ofperr
5169 handle_nxt_set_async_config(struct ofconn *ofconn, const struct ofp_header *oh)
5170 {
5171     const struct nx_async_config *msg = ofpmsg_body(oh);
5172     uint32_t master[OAM_N_TYPES];
5173     uint32_t slave[OAM_N_TYPES];
5174
5175     master[OAM_PACKET_IN] = ntohl(msg->packet_in_mask[0]);
5176     master[OAM_PORT_STATUS] = ntohl(msg->port_status_mask[0]);
5177     master[OAM_FLOW_REMOVED] = ntohl(msg->flow_removed_mask[0]);
5178
5179     slave[OAM_PACKET_IN] = ntohl(msg->packet_in_mask[1]);
5180     slave[OAM_PORT_STATUS] = ntohl(msg->port_status_mask[1]);
5181     slave[OAM_FLOW_REMOVED] = ntohl(msg->flow_removed_mask[1]);
5182
5183     ofconn_set_async_config(ofconn, master, slave);
5184     if (ofconn_get_type(ofconn) == OFCONN_SERVICE &&
5185         !ofconn_get_miss_send_len(ofconn)) {
5186         ofconn_set_miss_send_len(ofconn, OFP_DEFAULT_MISS_SEND_LEN);
5187     }
5188
5189     return 0;
5190 }
5191
5192 static enum ofperr
5193 handle_nxt_get_async_request(struct ofconn *ofconn, const struct ofp_header *oh)
5194 {
5195     struct ofpbuf *buf;
5196     uint32_t master[OAM_N_TYPES];
5197     uint32_t slave[OAM_N_TYPES];
5198     struct nx_async_config *msg;
5199
5200     ofconn_get_async_config(ofconn, master, slave);
5201     buf = ofpraw_alloc_reply(OFPRAW_OFPT13_GET_ASYNC_REPLY, oh, 0);
5202     msg = ofpbuf_put_zeros(buf, sizeof *msg);
5203
5204     msg->packet_in_mask[0] = htonl(master[OAM_PACKET_IN]);
5205     msg->port_status_mask[0] = htonl(master[OAM_PORT_STATUS]);
5206     msg->flow_removed_mask[0] = htonl(master[OAM_FLOW_REMOVED]);
5207
5208     msg->packet_in_mask[1] = htonl(slave[OAM_PACKET_IN]);
5209     msg->port_status_mask[1] = htonl(slave[OAM_PORT_STATUS]);
5210     msg->flow_removed_mask[1] = htonl(slave[OAM_FLOW_REMOVED]);
5211
5212     ofconn_send_reply(ofconn, buf);
5213
5214     return 0;
5215 }
5216
5217 static enum ofperr
5218 handle_nxt_set_controller_id(struct ofconn *ofconn,
5219                              const struct ofp_header *oh)
5220 {
5221     const struct nx_controller_id *nci = ofpmsg_body(oh);
5222
5223     if (!is_all_zeros(nci->zero, sizeof nci->zero)) {
5224         return OFPERR_NXBRC_MUST_BE_ZERO;
5225     }
5226
5227     ofconn_set_controller_id(ofconn, ntohs(nci->controller_id));
5228     return 0;
5229 }
5230
5231 static enum ofperr
5232 handle_barrier_request(struct ofconn *ofconn, const struct ofp_header *oh)
5233 {
5234     struct ofpbuf *buf;
5235
5236     buf = ofpraw_alloc_reply((oh->version == OFP10_VERSION
5237                               ? OFPRAW_OFPT10_BARRIER_REPLY
5238                               : OFPRAW_OFPT11_BARRIER_REPLY), oh, 0);
5239     ofconn_send_reply(ofconn, buf);
5240     return 0;
5241 }
5242
5243 static void
5244 ofproto_compose_flow_refresh_update(const struct rule *rule,
5245                                     enum nx_flow_monitor_flags flags,
5246                                     struct ovs_list *msgs)
5247     OVS_REQUIRES(ofproto_mutex)
5248 {
5249     const struct rule_actions *actions;
5250     struct ofputil_flow_update fu;
5251     struct match match;
5252
5253     fu.event = (flags & (NXFMF_INITIAL | NXFMF_ADD)
5254                 ? NXFME_ADDED : NXFME_MODIFIED);
5255     fu.reason = 0;
5256     ovs_mutex_lock(&rule->mutex);
5257     fu.idle_timeout = rule->idle_timeout;
5258     fu.hard_timeout = rule->hard_timeout;
5259     ovs_mutex_unlock(&rule->mutex);
5260     fu.table_id = rule->table_id;
5261     fu.cookie = rule->flow_cookie;
5262     minimatch_expand(&rule->cr.match, &match);
5263     fu.match = &match;
5264     fu.priority = rule->cr.priority;
5265
5266     actions = flags & NXFMF_ACTIONS ? rule_get_actions(rule) : NULL;
5267     fu.ofpacts = actions ? actions->ofpacts : NULL;
5268     fu.ofpacts_len = actions ? actions->ofpacts_len : 0;
5269
5270     if (list_is_empty(msgs)) {
5271         ofputil_start_flow_update(msgs);
5272     }
5273     ofputil_append_flow_update(&fu, msgs);
5274 }
5275
5276 void
5277 ofmonitor_compose_refresh_updates(struct rule_collection *rules,
5278                                   struct ovs_list *msgs)
5279     OVS_REQUIRES(ofproto_mutex)
5280 {
5281     size_t i;
5282
5283     for (i = 0; i < rules->n; i++) {
5284         struct rule *rule = rules->rules[i];
5285         enum nx_flow_monitor_flags flags = rule->monitor_flags;
5286         rule->monitor_flags = 0;
5287
5288         ofproto_compose_flow_refresh_update(rule, flags, msgs);
5289     }
5290 }
5291
5292 static void
5293 ofproto_collect_ofmonitor_refresh_rule(const struct ofmonitor *m,
5294                                        struct rule *rule, uint64_t seqno,
5295                                        struct rule_collection *rules)
5296     OVS_REQUIRES(ofproto_mutex)
5297 {
5298     enum nx_flow_monitor_flags update;
5299
5300     if (rule_is_hidden(rule)) {
5301         return;
5302     }
5303
5304     if (!ofproto_rule_has_out_port(rule, m->out_port)) {
5305         return;
5306     }
5307
5308     if (seqno) {
5309         if (rule->add_seqno > seqno) {
5310             update = NXFMF_ADD | NXFMF_MODIFY;
5311         } else if (rule->modify_seqno > seqno) {
5312             update = NXFMF_MODIFY;
5313         } else {
5314             return;
5315         }
5316
5317         if (!(m->flags & update)) {
5318             return;
5319         }
5320     } else {
5321         update = NXFMF_INITIAL;
5322     }
5323
5324     if (!rule->monitor_flags) {
5325         rule_collection_add(rules, rule);
5326     }
5327     rule->monitor_flags |= update | (m->flags & NXFMF_ACTIONS);
5328 }
5329
5330 static void
5331 ofproto_collect_ofmonitor_refresh_rules(const struct ofmonitor *m,
5332                                         uint64_t seqno,
5333                                         struct rule_collection *rules)
5334     OVS_REQUIRES(ofproto_mutex)
5335 {
5336     const struct ofproto *ofproto = ofconn_get_ofproto(m->ofconn);
5337     const struct oftable *table;
5338     struct cls_rule target;
5339
5340     cls_rule_init_from_minimatch(&target, &m->match, 0);
5341     FOR_EACH_MATCHING_TABLE (table, m->table_id, ofproto) {
5342         struct rule *rule;
5343
5344         CLS_FOR_EACH_TARGET (rule, cr, &table->cls, &target) {
5345             ofproto_collect_ofmonitor_refresh_rule(m, rule, seqno, rules);
5346         }
5347     }
5348     cls_rule_destroy(&target);
5349 }
5350
5351 static void
5352 ofproto_collect_ofmonitor_initial_rules(struct ofmonitor *m,
5353                                         struct rule_collection *rules)
5354     OVS_REQUIRES(ofproto_mutex)
5355 {
5356     if (m->flags & NXFMF_INITIAL) {
5357         ofproto_collect_ofmonitor_refresh_rules(m, 0, rules);
5358     }
5359 }
5360
5361 void
5362 ofmonitor_collect_resume_rules(struct ofmonitor *m,
5363                                uint64_t seqno, struct rule_collection *rules)
5364     OVS_REQUIRES(ofproto_mutex)
5365 {
5366     ofproto_collect_ofmonitor_refresh_rules(m, seqno, rules);
5367 }
5368
5369 static enum ofperr
5370 flow_monitor_delete(struct ofconn *ofconn, uint32_t id)
5371     OVS_REQUIRES(ofproto_mutex)
5372 {
5373     struct ofmonitor *m;
5374     enum ofperr error;
5375
5376     m = ofmonitor_lookup(ofconn, id);
5377     if (m) {
5378         ofmonitor_destroy(m);
5379         error = 0;
5380     } else {
5381         error = OFPERR_OFPMOFC_UNKNOWN_MONITOR;
5382     }
5383
5384     return error;
5385 }
5386
5387 static enum ofperr
5388 handle_flow_monitor_request(struct ofconn *ofconn, const struct ofp_header *oh)
5389     OVS_EXCLUDED(ofproto_mutex)
5390 {
5391     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
5392     struct ofmonitor **monitors;
5393     size_t n_monitors, allocated_monitors;
5394     struct rule_collection rules;
5395     struct ovs_list replies;
5396     enum ofperr error;
5397     struct ofpbuf b;
5398     size_t i;
5399
5400     ofpbuf_use_const(&b, oh, ntohs(oh->length));
5401     monitors = NULL;
5402     n_monitors = allocated_monitors = 0;
5403
5404     ovs_mutex_lock(&ofproto_mutex);
5405     for (;;) {
5406         struct ofputil_flow_monitor_request request;
5407         struct ofmonitor *m;
5408         int retval;
5409
5410         retval = ofputil_decode_flow_monitor_request(&request, &b);
5411         if (retval == EOF) {
5412             break;
5413         } else if (retval) {
5414             error = retval;
5415             goto error;
5416         }
5417
5418         if (request.table_id != 0xff
5419             && request.table_id >= ofproto->n_tables) {
5420             error = OFPERR_OFPBRC_BAD_TABLE_ID;
5421             goto error;
5422         }
5423
5424         error = ofmonitor_create(&request, ofconn, &m);
5425         if (error) {
5426             goto error;
5427         }
5428
5429         if (n_monitors >= allocated_monitors) {
5430             monitors = x2nrealloc(monitors, &allocated_monitors,
5431                                   sizeof *monitors);
5432         }
5433         monitors[n_monitors++] = m;
5434     }
5435
5436     rule_collection_init(&rules);
5437     for (i = 0; i < n_monitors; i++) {
5438         ofproto_collect_ofmonitor_initial_rules(monitors[i], &rules);
5439     }
5440
5441     ofpmp_init(&replies, oh);
5442     ofmonitor_compose_refresh_updates(&rules, &replies);
5443     ovs_mutex_unlock(&ofproto_mutex);
5444
5445     rule_collection_destroy(&rules);
5446
5447     ofconn_send_replies(ofconn, &replies);
5448     free(monitors);
5449
5450     return 0;
5451
5452 error:
5453     for (i = 0; i < n_monitors; i++) {
5454         ofmonitor_destroy(monitors[i]);
5455     }
5456     free(monitors);
5457     ovs_mutex_unlock(&ofproto_mutex);
5458
5459     return error;
5460 }
5461
5462 static enum ofperr
5463 handle_flow_monitor_cancel(struct ofconn *ofconn, const struct ofp_header *oh)
5464     OVS_EXCLUDED(ofproto_mutex)
5465 {
5466     enum ofperr error;
5467     uint32_t id;
5468
5469     id = ofputil_decode_flow_monitor_cancel(oh);
5470
5471     ovs_mutex_lock(&ofproto_mutex);
5472     error = flow_monitor_delete(ofconn, id);
5473     ovs_mutex_unlock(&ofproto_mutex);
5474
5475     return error;
5476 }
5477
5478 /* Meters implementation.
5479  *
5480  * Meter table entry, indexed by the OpenFlow meter_id.
5481  * 'created' is used to compute the duration for meter stats.
5482  * 'list rules' is needed so that we can delete the dependent rules when the
5483  * meter table entry is deleted.
5484  * 'provider_meter_id' is for the provider's private use.
5485  */
5486 struct meter {
5487     long long int created;      /* Time created. */
5488     struct ovs_list rules;      /* List of "struct rule_dpif"s. */
5489     ofproto_meter_id provider_meter_id;
5490     uint16_t flags;             /* Meter flags. */
5491     uint16_t n_bands;           /* Number of meter bands. */
5492     struct ofputil_meter_band *bands;
5493 };
5494
5495 /*
5496  * This is used in instruction validation at flow set-up time,
5497  * as flows may not use non-existing meters.
5498  * Return value of UINT32_MAX signifies an invalid meter.
5499  */
5500 static uint32_t
5501 get_provider_meter_id(const struct ofproto *ofproto, uint32_t of_meter_id)
5502 {
5503     if (of_meter_id && of_meter_id <= ofproto->meter_features.max_meters) {
5504         const struct meter *meter = ofproto->meters[of_meter_id];
5505         if (meter) {
5506             return meter->provider_meter_id.uint32;
5507         }
5508     }
5509     return UINT32_MAX;
5510 }
5511
5512 /* Finds the meter invoked by 'rule''s actions and adds 'rule' to the meter's
5513  * list of rules. */
5514 static void
5515 meter_insert_rule(struct rule *rule)
5516 {
5517     const struct rule_actions *a = rule_get_actions(rule);
5518     uint32_t meter_id = ofpacts_get_meter(a->ofpacts, a->ofpacts_len);
5519     struct meter *meter = rule->ofproto->meters[meter_id];
5520
5521     list_insert(&meter->rules, &rule->meter_list_node);
5522 }
5523
5524 static void
5525 meter_update(struct meter *meter, const struct ofputil_meter_config *config)
5526 {
5527     free(meter->bands);
5528
5529     meter->flags = config->flags;
5530     meter->n_bands = config->n_bands;
5531     meter->bands = xmemdup(config->bands,
5532                            config->n_bands * sizeof *meter->bands);
5533 }
5534
5535 static struct meter *
5536 meter_create(const struct ofputil_meter_config *config,
5537              ofproto_meter_id provider_meter_id)
5538 {
5539     struct meter *meter;
5540
5541     meter = xzalloc(sizeof *meter);
5542     meter->provider_meter_id = provider_meter_id;
5543     meter->created = time_msec();
5544     list_init(&meter->rules);
5545
5546     meter_update(meter, config);
5547
5548     return meter;
5549 }
5550
5551 static void
5552 meter_delete(struct ofproto *ofproto, uint32_t first, uint32_t last)
5553     OVS_REQUIRES(ofproto_mutex)
5554 {
5555     uint32_t mid;
5556     for (mid = first; mid <= last; ++mid) {
5557         struct meter *meter = ofproto->meters[mid];
5558         if (meter) {
5559             ofproto->meters[mid] = NULL;
5560             ofproto->ofproto_class->meter_del(ofproto,
5561                                               meter->provider_meter_id);
5562             free(meter->bands);
5563             free(meter);
5564         }
5565     }
5566 }
5567
5568 static enum ofperr
5569 handle_add_meter(struct ofproto *ofproto, struct ofputil_meter_mod *mm)
5570 {
5571     ofproto_meter_id provider_meter_id = { UINT32_MAX };
5572     struct meter **meterp = &ofproto->meters[mm->meter.meter_id];
5573     enum ofperr error;
5574
5575     if (*meterp) {
5576         return OFPERR_OFPMMFC_METER_EXISTS;
5577     }
5578
5579     error = ofproto->ofproto_class->meter_set(ofproto, &provider_meter_id,
5580                                               &mm->meter);
5581     if (!error) {
5582         ovs_assert(provider_meter_id.uint32 != UINT32_MAX);
5583         *meterp = meter_create(&mm->meter, provider_meter_id);
5584     }
5585     return error;
5586 }
5587
5588 static enum ofperr
5589 handle_modify_meter(struct ofproto *ofproto, struct ofputil_meter_mod *mm)
5590 {
5591     struct meter *meter = ofproto->meters[mm->meter.meter_id];
5592     enum ofperr error;
5593     uint32_t provider_meter_id;
5594
5595     if (!meter) {
5596         return OFPERR_OFPMMFC_UNKNOWN_METER;
5597     }
5598
5599     provider_meter_id = meter->provider_meter_id.uint32;
5600     error = ofproto->ofproto_class->meter_set(ofproto,
5601                                               &meter->provider_meter_id,
5602                                               &mm->meter);
5603     ovs_assert(meter->provider_meter_id.uint32 == provider_meter_id);
5604     if (!error) {
5605         meter_update(meter, &mm->meter);
5606     }
5607     return error;
5608 }
5609
5610 static enum ofperr
5611 handle_delete_meter(struct ofconn *ofconn, struct ofputil_meter_mod *mm)
5612     OVS_EXCLUDED(ofproto_mutex)
5613 {
5614     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
5615     uint32_t meter_id = mm->meter.meter_id;
5616     struct rule_collection rules;
5617     enum ofperr error = 0;
5618     uint32_t first, last;
5619
5620     if (meter_id == OFPM13_ALL) {
5621         first = 1;
5622         last = ofproto->meter_features.max_meters;
5623     } else {
5624         if (!meter_id || meter_id > ofproto->meter_features.max_meters) {
5625             return 0;
5626         }
5627         first = last = meter_id;
5628     }
5629
5630     /* First delete the rules that use this meter.  If any of those rules are
5631      * currently being modified, postpone the whole operation until later. */
5632     rule_collection_init(&rules);
5633     ovs_mutex_lock(&ofproto_mutex);
5634     for (meter_id = first; meter_id <= last; ++meter_id) {
5635         struct meter *meter = ofproto->meters[meter_id];
5636         if (meter && !list_is_empty(&meter->rules)) {
5637             struct rule *rule;
5638
5639             LIST_FOR_EACH (rule, meter_list_node, &meter->rules) {
5640                 rule_collection_add(&rules, rule);
5641             }
5642         }
5643     }
5644     delete_flows__(&rules, OFPRR_METER_DELETE, NULL);
5645
5646     /* Delete the meters. */
5647     meter_delete(ofproto, first, last);
5648
5649     ovs_mutex_unlock(&ofproto_mutex);
5650     rule_collection_destroy(&rules);
5651
5652     return error;
5653 }
5654
5655 static enum ofperr
5656 handle_meter_mod(struct ofconn *ofconn, const struct ofp_header *oh)
5657 {
5658     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
5659     struct ofputil_meter_mod mm;
5660     uint64_t bands_stub[256 / 8];
5661     struct ofpbuf bands;
5662     uint32_t meter_id;
5663     enum ofperr error;
5664
5665     error = reject_slave_controller(ofconn);
5666     if (error) {
5667         return error;
5668     }
5669
5670     ofpbuf_use_stub(&bands, bands_stub, sizeof bands_stub);
5671
5672     error = ofputil_decode_meter_mod(oh, &mm, &bands);
5673     if (error) {
5674         goto exit_free_bands;
5675     }
5676
5677     meter_id = mm.meter.meter_id;
5678
5679     if (mm.command != OFPMC13_DELETE) {
5680         /* Fails also when meters are not implemented by the provider. */
5681         if (meter_id == 0 || meter_id > OFPM13_MAX) {
5682             error = OFPERR_OFPMMFC_INVALID_METER;
5683             goto exit_free_bands;
5684         } else if (meter_id > ofproto->meter_features.max_meters) {
5685             error = OFPERR_OFPMMFC_OUT_OF_METERS;
5686             goto exit_free_bands;
5687         }
5688         if (mm.meter.n_bands > ofproto->meter_features.max_bands) {
5689             error = OFPERR_OFPMMFC_OUT_OF_BANDS;
5690             goto exit_free_bands;
5691         }
5692     }
5693
5694     switch (mm.command) {
5695     case OFPMC13_ADD:
5696         error = handle_add_meter(ofproto, &mm);
5697         break;
5698
5699     case OFPMC13_MODIFY:
5700         error = handle_modify_meter(ofproto, &mm);
5701         break;
5702
5703     case OFPMC13_DELETE:
5704         error = handle_delete_meter(ofconn, &mm);
5705         break;
5706
5707     default:
5708         error = OFPERR_OFPMMFC_BAD_COMMAND;
5709         break;
5710     }
5711
5712 exit_free_bands:
5713     ofpbuf_uninit(&bands);
5714     return error;
5715 }
5716
5717 static enum ofperr
5718 handle_meter_features_request(struct ofconn *ofconn,
5719                               const struct ofp_header *request)
5720 {
5721     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
5722     struct ofputil_meter_features features;
5723     struct ofpbuf *b;
5724
5725     if (ofproto->ofproto_class->meter_get_features) {
5726         ofproto->ofproto_class->meter_get_features(ofproto, &features);
5727     } else {
5728         memset(&features, 0, sizeof features);
5729     }
5730     b = ofputil_encode_meter_features_reply(&features, request);
5731
5732     ofconn_send_reply(ofconn, b);
5733     return 0;
5734 }
5735
5736 static enum ofperr
5737 handle_meter_request(struct ofconn *ofconn, const struct ofp_header *request,
5738                      enum ofptype type)
5739 {
5740     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
5741     struct ovs_list replies;
5742     uint64_t bands_stub[256 / 8];
5743     struct ofpbuf bands;
5744     uint32_t meter_id, first, last;
5745
5746     ofputil_decode_meter_request(request, &meter_id);
5747
5748     if (meter_id == OFPM13_ALL) {
5749         first = 1;
5750         last = ofproto->meter_features.max_meters;
5751     } else {
5752         if (!meter_id || meter_id > ofproto->meter_features.max_meters ||
5753             !ofproto->meters[meter_id]) {
5754             return OFPERR_OFPMMFC_UNKNOWN_METER;
5755         }
5756         first = last = meter_id;
5757     }
5758
5759     ofpbuf_use_stub(&bands, bands_stub, sizeof bands_stub);
5760     ofpmp_init(&replies, request);
5761
5762     for (meter_id = first; meter_id <= last; ++meter_id) {
5763         struct meter *meter = ofproto->meters[meter_id];
5764         if (!meter) {
5765             continue; /* Skip non-existing meters. */
5766         }
5767         if (type == OFPTYPE_METER_STATS_REQUEST) {
5768             struct ofputil_meter_stats stats;
5769
5770             stats.meter_id = meter_id;
5771
5772             /* Provider sets the packet and byte counts, we do the rest. */
5773             stats.flow_count = list_size(&meter->rules);
5774             calc_duration(meter->created, time_msec(),
5775                           &stats.duration_sec, &stats.duration_nsec);
5776             stats.n_bands = meter->n_bands;
5777             ofpbuf_clear(&bands);
5778             stats.bands
5779                 = ofpbuf_put_uninit(&bands,
5780                                     meter->n_bands * sizeof *stats.bands);
5781
5782             if (!ofproto->ofproto_class->meter_get(ofproto,
5783                                                    meter->provider_meter_id,
5784                                                    &stats)) {
5785                 ofputil_append_meter_stats(&replies, &stats);
5786             }
5787         } else { /* type == OFPTYPE_METER_CONFIG_REQUEST */
5788             struct ofputil_meter_config config;
5789
5790             config.meter_id = meter_id;
5791             config.flags = meter->flags;
5792             config.n_bands = meter->n_bands;
5793             config.bands = meter->bands;
5794             ofputil_append_meter_config(&replies, &config);
5795         }
5796     }
5797
5798     ofconn_send_replies(ofconn, &replies);
5799     ofpbuf_uninit(&bands);
5800     return 0;
5801 }
5802
5803 static bool
5804 ofproto_group_lookup__(const struct ofproto *ofproto, uint32_t group_id,
5805                        struct ofgroup **group)
5806     OVS_REQ_RDLOCK(ofproto->groups_rwlock)
5807 {
5808     HMAP_FOR_EACH_IN_BUCKET (*group, hmap_node,
5809                              hash_int(group_id, 0), &ofproto->groups) {
5810         if ((*group)->group_id == group_id) {
5811             return true;
5812         }
5813     }
5814
5815     return false;
5816 }
5817
5818 /* If the group exists, this function increments the groups's reference count.
5819  *
5820  * Make sure to call ofproto_group_unref() after no longer needing to maintain
5821  * a reference to the group. */
5822 bool
5823 ofproto_group_lookup(const struct ofproto *ofproto, uint32_t group_id,
5824                      struct ofgroup **group)
5825 {
5826     bool found;
5827
5828     ovs_rwlock_rdlock(&ofproto->groups_rwlock);
5829     found = ofproto_group_lookup__(ofproto, group_id, group);
5830     if (found) {
5831         ofproto_group_ref(*group);
5832     }
5833     ovs_rwlock_unlock(&ofproto->groups_rwlock);
5834     return found;
5835 }
5836
5837 static bool
5838 ofproto_group_exists__(const struct ofproto *ofproto, uint32_t group_id)
5839     OVS_REQ_RDLOCK(ofproto->groups_rwlock)
5840 {
5841     struct ofgroup *grp;
5842
5843     HMAP_FOR_EACH_IN_BUCKET (grp, hmap_node,
5844                              hash_int(group_id, 0), &ofproto->groups) {
5845         if (grp->group_id == group_id) {
5846             return true;
5847         }
5848     }
5849     return false;
5850 }
5851
5852 static bool
5853 ofproto_group_exists(const struct ofproto *ofproto, uint32_t group_id)
5854     OVS_EXCLUDED(ofproto->groups_rwlock)
5855 {
5856     bool exists;
5857
5858     ovs_rwlock_rdlock(&ofproto->groups_rwlock);
5859     exists = ofproto_group_exists__(ofproto, group_id);
5860     ovs_rwlock_unlock(&ofproto->groups_rwlock);
5861
5862     return exists;
5863 }
5864
5865 static uint32_t
5866 group_get_ref_count(struct ofgroup *group)
5867     OVS_EXCLUDED(ofproto_mutex)
5868 {
5869     struct ofproto *ofproto = CONST_CAST(struct ofproto *, group->ofproto);
5870     struct rule_criteria criteria;
5871     struct rule_collection rules;
5872     struct match match;
5873     enum ofperr error;
5874     uint32_t count;
5875
5876     match_init_catchall(&match);
5877     rule_criteria_init(&criteria, 0xff, &match, 0, htonll(0), htonll(0),
5878                        OFPP_ANY, group->group_id);
5879     ovs_mutex_lock(&ofproto_mutex);
5880     error = collect_rules_loose(ofproto, &criteria, &rules);
5881     ovs_mutex_unlock(&ofproto_mutex);
5882     rule_criteria_destroy(&criteria);
5883
5884     count = !error && rules.n < UINT32_MAX ? rules.n : UINT32_MAX;
5885
5886     rule_collection_destroy(&rules);
5887     return count;
5888 }
5889
5890 static void
5891 append_group_stats(struct ofgroup *group, struct ovs_list *replies)
5892 {
5893     struct ofputil_group_stats ogs;
5894     const struct ofproto *ofproto = group->ofproto;
5895     long long int now = time_msec();
5896     int error;
5897
5898     ogs.bucket_stats = xmalloc(group->n_buckets * sizeof *ogs.bucket_stats);
5899
5900     /* Provider sets the packet and byte counts, we do the rest. */
5901     ogs.ref_count = group_get_ref_count(group);
5902     ogs.n_buckets = group->n_buckets;
5903
5904     error = (ofproto->ofproto_class->group_get_stats
5905              ? ofproto->ofproto_class->group_get_stats(group, &ogs)
5906              : EOPNOTSUPP);
5907     if (error) {
5908         ogs.packet_count = UINT64_MAX;
5909         ogs.byte_count = UINT64_MAX;
5910         memset(ogs.bucket_stats, 0xff,
5911                ogs.n_buckets * sizeof *ogs.bucket_stats);
5912     }
5913
5914     ogs.group_id = group->group_id;
5915     calc_duration(group->created, now, &ogs.duration_sec, &ogs.duration_nsec);
5916
5917     ofputil_append_group_stats(replies, &ogs);
5918
5919     free(ogs.bucket_stats);
5920 }
5921
5922 static void
5923 handle_group_request(struct ofconn *ofconn,
5924                      const struct ofp_header *request, uint32_t group_id,
5925                      void (*cb)(struct ofgroup *, struct ovs_list *replies))
5926 {
5927     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
5928     struct ofgroup *group;
5929     struct ovs_list replies;
5930
5931     ofpmp_init(&replies, request);
5932     if (group_id == OFPG_ALL) {
5933         ovs_rwlock_rdlock(&ofproto->groups_rwlock);
5934         HMAP_FOR_EACH (group, hmap_node, &ofproto->groups) {
5935             cb(group, &replies);
5936         }
5937         ovs_rwlock_unlock(&ofproto->groups_rwlock);
5938     } else {
5939         if (ofproto_group_lookup(ofproto, group_id, &group)) {
5940             cb(group, &replies);
5941             ofproto_group_unref(group);
5942         }
5943     }
5944     ofconn_send_replies(ofconn, &replies);
5945 }
5946
5947 static enum ofperr
5948 handle_group_stats_request(struct ofconn *ofconn,
5949                            const struct ofp_header *request)
5950 {
5951     uint32_t group_id;
5952     enum ofperr error;
5953
5954     error = ofputil_decode_group_stats_request(request, &group_id);
5955     if (error) {
5956         return error;
5957     }
5958
5959     handle_group_request(ofconn, request, group_id, append_group_stats);
5960     return 0;
5961 }
5962
5963 static void
5964 append_group_desc(struct ofgroup *group, struct ovs_list *replies)
5965 {
5966     struct ofputil_group_desc gds;
5967
5968     gds.group_id = group->group_id;
5969     gds.type = group->type;
5970     gds.props = group->props;
5971
5972     ofputil_append_group_desc_reply(&gds, &group->buckets, replies);
5973 }
5974
5975 static enum ofperr
5976 handle_group_desc_stats_request(struct ofconn *ofconn,
5977                                 const struct ofp_header *request)
5978 {
5979     handle_group_request(ofconn, request,
5980                          ofputil_decode_group_desc_request(request),
5981                          append_group_desc);
5982     return 0;
5983 }
5984
5985 static enum ofperr
5986 handle_group_features_stats_request(struct ofconn *ofconn,
5987                                     const struct ofp_header *request)
5988 {
5989     struct ofproto *p = ofconn_get_ofproto(ofconn);
5990     struct ofpbuf *msg;
5991
5992     msg = ofputil_encode_group_features_reply(&p->ogf, request);
5993     if (msg) {
5994         ofconn_send_reply(ofconn, msg);
5995     }
5996
5997     return 0;
5998 }
5999
6000 static enum ofperr
6001 handle_queue_get_config_request(struct ofconn *ofconn,
6002                                 const struct ofp_header *oh)
6003 {
6004    struct ofproto *p = ofconn_get_ofproto(ofconn);
6005    struct netdev_queue_dump queue_dump;
6006    struct ofport *ofport;
6007    unsigned int queue_id;
6008    struct ofpbuf *reply;
6009    struct smap details;
6010    ofp_port_t request;
6011    enum ofperr error;
6012
6013    error = ofputil_decode_queue_get_config_request(oh, &request);
6014    if (error) {
6015        return error;
6016    }
6017
6018    ofport = ofproto_get_port(p, request);
6019    if (!ofport) {
6020       return OFPERR_OFPQOFC_BAD_PORT;
6021    }
6022
6023    reply = ofputil_encode_queue_get_config_reply(oh);
6024
6025    smap_init(&details);
6026    NETDEV_QUEUE_FOR_EACH (&queue_id, &details, &queue_dump, ofport->netdev) {
6027        struct ofputil_queue_config queue;
6028
6029        /* None of the existing queues have compatible properties, so we
6030         * hard-code omitting min_rate and max_rate. */
6031        queue.queue_id = queue_id;
6032        queue.min_rate = UINT16_MAX;
6033        queue.max_rate = UINT16_MAX;
6034        ofputil_append_queue_get_config_reply(reply, &queue);
6035    }
6036    smap_destroy(&details);
6037
6038    ofconn_send_reply(ofconn, reply);
6039
6040    return 0;
6041 }
6042
6043 static enum ofperr
6044 init_group(struct ofproto *ofproto, struct ofputil_group_mod *gm,
6045            struct ofgroup **ofgroup)
6046 {
6047     enum ofperr error;
6048     const long long int now = time_msec();
6049
6050     if (gm->group_id > OFPG_MAX) {
6051         return OFPERR_OFPGMFC_INVALID_GROUP;
6052     }
6053     if (gm->type > OFPGT11_FF) {
6054         return OFPERR_OFPGMFC_BAD_TYPE;
6055     }
6056
6057     *ofgroup = ofproto->ofproto_class->group_alloc();
6058     if (!*ofgroup) {
6059         VLOG_WARN_RL(&rl, "%s: failed to allocate group", ofproto->name);
6060         return OFPERR_OFPGMFC_OUT_OF_GROUPS;
6061     }
6062
6063     (*ofgroup)->ofproto = ofproto;
6064     *CONST_CAST(uint32_t *, &((*ofgroup)->group_id)) = gm->group_id;
6065     *CONST_CAST(enum ofp11_group_type *, &(*ofgroup)->type) = gm->type;
6066     *CONST_CAST(long long int *, &((*ofgroup)->created)) = now;
6067     *CONST_CAST(long long int *, &((*ofgroup)->modified)) = now;
6068     ovs_refcount_init(&(*ofgroup)->ref_count);
6069
6070     list_move(&(*ofgroup)->buckets, &gm->buckets);
6071     *CONST_CAST(uint32_t *, &(*ofgroup)->n_buckets) =
6072         list_size(&(*ofgroup)->buckets);
6073
6074     memcpy(CONST_CAST(struct ofputil_group_props *, &(*ofgroup)->props),
6075            &gm->props, sizeof (struct ofputil_group_props));
6076
6077     /* Construct called BEFORE any locks are held. */
6078     error = ofproto->ofproto_class->group_construct(*ofgroup);
6079     if (error) {
6080         ofputil_bucket_list_destroy(&(*ofgroup)->buckets);
6081         ofproto->ofproto_class->group_dealloc(*ofgroup);
6082     }
6083     return error;
6084 }
6085
6086 /* Implements the OFPGC11_ADD operation specified by 'gm', adding a group to
6087  * 'ofproto''s group table.  Returns 0 on success or an OpenFlow error code on
6088  * failure. */
6089 static enum ofperr
6090 add_group(struct ofproto *ofproto, struct ofputil_group_mod *gm)
6091 {
6092     struct ofgroup *ofgroup;
6093     enum ofperr error;
6094
6095     /* Allocate new group and initialize it. */
6096     error = init_group(ofproto, gm, &ofgroup);
6097     if (error) {
6098         return error;
6099     }
6100
6101     /* We wrlock as late as possible to minimize the time we jam any other
6102      * threads: No visible state changes before acquiring the lock. */
6103     ovs_rwlock_wrlock(&ofproto->groups_rwlock);
6104
6105     if (ofproto->n_groups[gm->type] >= ofproto->ogf.max_groups[gm->type]) {
6106         error = OFPERR_OFPGMFC_OUT_OF_GROUPS;
6107         goto unlock_out;
6108     }
6109
6110     if (ofproto_group_exists__(ofproto, gm->group_id)) {
6111         error = OFPERR_OFPGMFC_GROUP_EXISTS;
6112         goto unlock_out;
6113     }
6114
6115     if (!error) {
6116         /* Insert new group. */
6117         hmap_insert(&ofproto->groups, &ofgroup->hmap_node,
6118                     hash_int(ofgroup->group_id, 0));
6119         ofproto->n_groups[ofgroup->type]++;
6120
6121         ovs_rwlock_unlock(&ofproto->groups_rwlock);
6122         return error;
6123     }
6124
6125  unlock_out:
6126     ovs_rwlock_unlock(&ofproto->groups_rwlock);
6127     ofproto->ofproto_class->group_destruct(ofgroup);
6128     ofputil_bucket_list_destroy(&ofgroup->buckets);
6129     ofproto->ofproto_class->group_dealloc(ofgroup);
6130
6131     return error;
6132 }
6133
6134 /* Adds all of the buckets from 'ofgroup' to 'new_ofgroup'.  The buckets
6135  * already in 'new_ofgroup' will be placed just after the (copy of the) bucket
6136  * in 'ofgroup' with bucket ID 'command_bucket_id'.  Special
6137  * 'command_bucket_id' values OFPG15_BUCKET_FIRST and OFPG15_BUCKET_LAST are
6138  * also honored. */
6139 static enum ofperr
6140 copy_buckets_for_insert_bucket(const struct ofgroup *ofgroup,
6141                                struct ofgroup *new_ofgroup,
6142                                uint32_t command_bucket_id)
6143 {
6144     struct ofputil_bucket *last = NULL;
6145
6146     if (command_bucket_id <= OFPG15_BUCKET_MAX) {
6147         /* Check here to ensure that a bucket corresponding to
6148          * command_bucket_id exists in the old bucket list.
6149          *
6150          * The subsequent search of below of new_ofgroup covers
6151          * both buckets in the old bucket list and buckets added
6152          * by the insert buckets group mod message this function processes. */
6153         if (!ofputil_bucket_find(&ofgroup->buckets, command_bucket_id)) {
6154             return OFPERR_OFPGMFC_UNKNOWN_BUCKET;
6155         }
6156
6157         if (!list_is_empty(&new_ofgroup->buckets)) {
6158             last = ofputil_bucket_list_back(&new_ofgroup->buckets);
6159         }
6160     }
6161
6162     ofputil_bucket_clone_list(&new_ofgroup->buckets, &ofgroup->buckets, NULL);
6163
6164     if (ofputil_bucket_check_duplicate_id(&ofgroup->buckets)) {
6165             VLOG_WARN_RL(&rl, "Duplicate bucket id");
6166             return OFPERR_OFPGMFC_BUCKET_EXISTS;
6167     }
6168
6169     /* Rearrange list according to command_bucket_id */
6170     if (command_bucket_id == OFPG15_BUCKET_LAST) {
6171         struct ofputil_bucket *new_first;
6172         const struct ofputil_bucket *first;
6173
6174         first = ofputil_bucket_list_front(&ofgroup->buckets);
6175         new_first = ofputil_bucket_find(&new_ofgroup->buckets,
6176                                         first->bucket_id);
6177
6178         list_splice(new_ofgroup->buckets.next, &new_first->list_node,
6179                     &new_ofgroup->buckets);
6180     } else if (command_bucket_id <= OFPG15_BUCKET_MAX && last) {
6181         struct ofputil_bucket *after;
6182
6183         /* Presence of bucket is checked above so after should never be NULL */
6184         after = ofputil_bucket_find(&new_ofgroup->buckets, command_bucket_id);
6185
6186         list_splice(after->list_node.next, new_ofgroup->buckets.next,
6187                     last->list_node.next);
6188     }
6189
6190     return 0;
6191 }
6192
6193 /* Appends all of the a copy of all the buckets from 'ofgroup' to 'new_ofgroup'
6194  * with the exception of the bucket whose bucket id is 'command_bucket_id'.
6195  * Special 'command_bucket_id' values OFPG15_BUCKET_FIRST, OFPG15_BUCKET_LAST
6196  * and OFPG15_BUCKET_ALL are also honored. */
6197 static enum ofperr
6198 copy_buckets_for_remove_bucket(const struct ofgroup *ofgroup,
6199                                struct ofgroup *new_ofgroup,
6200                                uint32_t command_bucket_id)
6201 {
6202     const struct ofputil_bucket *skip = NULL;
6203
6204     if (command_bucket_id == OFPG15_BUCKET_ALL) {
6205         return 0;
6206     }
6207
6208     if (command_bucket_id == OFPG15_BUCKET_FIRST) {
6209         if (!list_is_empty(&ofgroup->buckets)) {
6210             skip = ofputil_bucket_list_front(&ofgroup->buckets);
6211         }
6212     } else if (command_bucket_id == OFPG15_BUCKET_LAST) {
6213         if (!list_is_empty(&ofgroup->buckets)) {
6214             skip = ofputil_bucket_list_back(&ofgroup->buckets);
6215         }
6216     } else {
6217         skip = ofputil_bucket_find(&ofgroup->buckets, command_bucket_id);
6218         if (!skip) {
6219             return OFPERR_OFPGMFC_UNKNOWN_BUCKET;
6220         }
6221     }
6222
6223     ofputil_bucket_clone_list(&new_ofgroup->buckets, &ofgroup->buckets, skip);
6224
6225     return 0;
6226 }
6227
6228 /* Implements OFPGC11_MODIFY, OFPGC15_INSERT_BUCKET and
6229  * OFPGC15_REMOVE_BUCKET.  Returns 0 on success or an OpenFlow error code
6230  * on failure.
6231  *
6232  * Note that the group is re-created and then replaces the old group in
6233  * ofproto's ofgroup hash map. Thus, the group is never altered while users of
6234  * the xlate module hold a pointer to the group. */
6235 static enum ofperr
6236 modify_group(struct ofproto *ofproto, struct ofputil_group_mod *gm)
6237 {
6238     struct ofgroup *ofgroup, *new_ofgroup, *retiring;
6239     enum ofperr error;
6240
6241     error = init_group(ofproto, gm, &new_ofgroup);
6242     if (error) {
6243         return error;
6244     }
6245
6246     retiring = new_ofgroup;
6247
6248     ovs_rwlock_wrlock(&ofproto->groups_rwlock);
6249     if (!ofproto_group_lookup__(ofproto, gm->group_id, &ofgroup)) {
6250         error = OFPERR_OFPGMFC_UNKNOWN_GROUP;
6251         goto out;
6252     }
6253
6254     /* Ofproto's group write lock is held now. */
6255     if (ofgroup->type != gm->type
6256         && ofproto->n_groups[gm->type] >= ofproto->ogf.max_groups[gm->type]) {
6257         error = OFPERR_OFPGMFC_OUT_OF_GROUPS;
6258         goto out;
6259     }
6260
6261     /* Manipulate bucket list for bucket commands */
6262     if (gm->command == OFPGC15_INSERT_BUCKET) {
6263         error = copy_buckets_for_insert_bucket(ofgroup, new_ofgroup,
6264                                                gm->command_bucket_id);
6265     } else if (gm->command == OFPGC15_REMOVE_BUCKET) {
6266         error = copy_buckets_for_remove_bucket(ofgroup, new_ofgroup,
6267                                                gm->command_bucket_id);
6268     }
6269     if (error) {
6270         goto out;
6271     }
6272
6273     /* The group creation time does not change during modification. */
6274     *CONST_CAST(long long int *, &(new_ofgroup->created)) = ofgroup->created;
6275     *CONST_CAST(long long int *, &(new_ofgroup->modified)) = time_msec();
6276
6277     error = ofproto->ofproto_class->group_modify(new_ofgroup);
6278     if (error) {
6279         goto out;
6280     }
6281
6282     retiring = ofgroup;
6283     /* Replace ofgroup in ofproto's groups hash map with new_ofgroup. */
6284     hmap_remove(&ofproto->groups, &ofgroup->hmap_node);
6285     hmap_insert(&ofproto->groups, &new_ofgroup->hmap_node,
6286                 hash_int(new_ofgroup->group_id, 0));
6287     if (ofgroup->type != new_ofgroup->type) {
6288         ofproto->n_groups[ofgroup->type]--;
6289         ofproto->n_groups[new_ofgroup->type]++;
6290     }
6291
6292 out:
6293     ofproto_group_unref(retiring);
6294     ovs_rwlock_unlock(&ofproto->groups_rwlock);
6295     return error;
6296 }
6297
6298 static void
6299 delete_group__(struct ofproto *ofproto, struct ofgroup *ofgroup)
6300     OVS_RELEASES(ofproto->groups_rwlock)
6301 {
6302     struct match match;
6303     struct ofputil_flow_mod fm;
6304
6305     /* Delete all flow entries containing this group in a group action */
6306     match_init_catchall(&match);
6307     flow_mod_init(&fm, &match, 0, NULL, 0, OFPFC_DELETE);
6308     fm.delete_reason = OFPRR_GROUP_DELETE;
6309     fm.out_group = ofgroup->group_id;
6310     handle_flow_mod__(ofproto, &fm, NULL);
6311
6312     hmap_remove(&ofproto->groups, &ofgroup->hmap_node);
6313     /* No-one can find this group any more. */
6314     ofproto->n_groups[ofgroup->type]--;
6315     ovs_rwlock_unlock(&ofproto->groups_rwlock);
6316     ofproto_group_unref(ofgroup);
6317 }
6318
6319 /* Implements OFPGC11_DELETE. */
6320 static void
6321 delete_group(struct ofproto *ofproto, uint32_t group_id)
6322 {
6323     struct ofgroup *ofgroup;
6324
6325     ovs_rwlock_wrlock(&ofproto->groups_rwlock);
6326     if (group_id == OFPG_ALL) {
6327         for (;;) {
6328             struct hmap_node *node = hmap_first(&ofproto->groups);
6329             if (!node) {
6330                 break;
6331             }
6332             ofgroup = CONTAINER_OF(node, struct ofgroup, hmap_node);
6333             delete_group__(ofproto, ofgroup);
6334             /* Lock for each node separately, so that we will not jam the
6335              * other threads for too long time. */
6336             ovs_rwlock_wrlock(&ofproto->groups_rwlock);
6337         }
6338     } else {
6339         HMAP_FOR_EACH_IN_BUCKET (ofgroup, hmap_node,
6340                                  hash_int(group_id, 0), &ofproto->groups) {
6341             if (ofgroup->group_id == group_id) {
6342                 delete_group__(ofproto, ofgroup);
6343                 return;
6344             }
6345         }
6346     }
6347     ovs_rwlock_unlock(&ofproto->groups_rwlock);
6348 }
6349
6350 static enum ofperr
6351 handle_group_mod(struct ofconn *ofconn, const struct ofp_header *oh)
6352 {
6353     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
6354     struct ofputil_group_mod gm;
6355     enum ofperr error;
6356
6357     error = reject_slave_controller(ofconn);
6358     if (error) {
6359         return error;
6360     }
6361
6362     error = ofputil_decode_group_mod(oh, &gm);
6363     if (error) {
6364         return error;
6365     }
6366
6367     switch (gm.command) {
6368     case OFPGC11_ADD:
6369         return add_group(ofproto, &gm);
6370
6371     case OFPGC11_MODIFY:
6372         return modify_group(ofproto, &gm);
6373
6374     case OFPGC11_DELETE:
6375         delete_group(ofproto, gm.group_id);
6376         return 0;
6377
6378     case OFPGC15_INSERT_BUCKET:
6379         return modify_group(ofproto, &gm);
6380
6381     case OFPGC15_REMOVE_BUCKET:
6382         return modify_group(ofproto, &gm);
6383
6384     default:
6385         if (gm.command > OFPGC11_DELETE) {
6386             VLOG_WARN_RL(&rl, "%s: Invalid group_mod command type %d",
6387                          ofproto->name, gm.command);
6388         }
6389         return OFPERR_OFPGMFC_BAD_COMMAND;
6390     }
6391 }
6392
6393 enum ofputil_table_miss
6394 ofproto_table_get_miss_config(const struct ofproto *ofproto, uint8_t table_id)
6395 {
6396     enum ofputil_table_miss value;
6397
6398     atomic_read_relaxed(&ofproto->tables[table_id].miss_config, &value);
6399     return value;
6400 }
6401
6402 static enum ofperr
6403 table_mod(struct ofproto *ofproto, const struct ofputil_table_mod *tm)
6404 {
6405     if (!check_table_id(ofproto, tm->table_id)) {
6406         return OFPERR_OFPTMFC_BAD_TABLE;
6407     } else if (tm->miss_config != OFPUTIL_TABLE_MISS_DEFAULT) {
6408         if (tm->table_id == OFPTT_ALL) {
6409             int i;
6410             for (i = 0; i < ofproto->n_tables; i++) {
6411                 atomic_store_relaxed(&ofproto->tables[i].miss_config,
6412                                      tm->miss_config);
6413             }
6414         } else {
6415             atomic_store_relaxed(&ofproto->tables[tm->table_id].miss_config,
6416                                  tm->miss_config);
6417         }
6418     }
6419     return 0;
6420 }
6421
6422 static enum ofperr
6423 handle_table_mod(struct ofconn *ofconn, const struct ofp_header *oh)
6424 {
6425     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
6426     struct ofputil_table_mod tm;
6427     enum ofperr error;
6428
6429     error = reject_slave_controller(ofconn);
6430     if (error) {
6431         return error;
6432     }
6433
6434     error = ofputil_decode_table_mod(oh, &tm);
6435     if (error) {
6436         return error;
6437     }
6438
6439     return table_mod(ofproto, &tm);
6440 }
6441
6442 static enum ofperr
6443 do_bundle_flow_mod_begin(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
6444                          struct ofp_bundle_entry *be)
6445     OVS_REQUIRES(ofproto_mutex)
6446 {
6447     switch (fm->command) {
6448     case OFPFC_ADD:
6449         return add_flow_begin(ofproto, fm, &be->rule, &be->modify);
6450
6451     case OFPFC_MODIFY:
6452         return modify_flows_begin_loose(ofproto, fm, &be->rules);
6453
6454     case OFPFC_MODIFY_STRICT:
6455         return modify_flow_begin_strict(ofproto, fm, &be->rules);
6456
6457     case OFPFC_DELETE:
6458         return delete_flows_begin_loose(ofproto, fm, &be->rules);
6459
6460     case OFPFC_DELETE_STRICT:
6461         return delete_flow_begin_strict(ofproto, fm, &be->rules);
6462     }
6463
6464     return OFPERR_OFPFMFC_BAD_COMMAND;
6465 }
6466
6467 static void
6468 do_bundle_flow_mod_revert(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
6469                           struct ofp_bundle_entry *be)
6470     OVS_REQUIRES(ofproto_mutex)
6471 {
6472     switch (fm->command) {
6473     case OFPFC_ADD:
6474         add_flow_revert(ofproto, be->modify ? NULL : be->rule);
6475         break;
6476
6477     case OFPFC_MODIFY:
6478     case OFPFC_MODIFY_STRICT:
6479         modify_flows_revert(ofproto, &be->rules);
6480         break;
6481
6482     case OFPFC_DELETE:
6483     case OFPFC_DELETE_STRICT:
6484         delete_flows_revert(&be->rules);
6485         break;
6486
6487     default:
6488         break;
6489     }
6490 }
6491
6492 static void
6493 do_bundle_flow_mod_finish(struct ofproto *ofproto, struct ofputil_flow_mod *fm,
6494                           const struct flow_mod_requester *req,
6495                           struct ofp_bundle_entry *be)
6496     OVS_REQUIRES(ofproto_mutex)
6497 {
6498     switch (fm->command) {
6499     case OFPFC_ADD:
6500         add_flow_finish(ofproto, fm, req, be->rule, be->modify);
6501         break;
6502
6503     case OFPFC_MODIFY:
6504     case OFPFC_MODIFY_STRICT:
6505         modify_flows_finish(ofproto, fm, req, &be->rules);
6506         break;
6507
6508     case OFPFC_DELETE:
6509     case OFPFC_DELETE_STRICT:
6510         delete_flows_finish(fm, req, &be->rules);
6511         break;
6512
6513     default:
6514         break;
6515     }
6516 }
6517
6518 /* Commit phases (all while locking ofproto_mutex):
6519  *
6520  * 1. Gather resources - do not send any events or notifications.
6521  *
6522  * add: Check conflicts, check for a displaced flow. If no displaced flow
6523  *      exists, add the new flow, but mark it as "invisible".
6524  * mod: Collect affected flows, Do not modify yet.
6525  * del: Collect affected flows, Do not delete yet.
6526  *
6527  * 2a. Fail if any errors are found.  After this point no errors are possible.
6528  * No visible changes were made, so rollback is minimal (remove added invisible
6529  * flows, revert 'to_be_removed' status of flows).
6530  *
6531  * 2b. Commit the changes
6532  *
6533  * add: if have displaced flow, modify it, otherwise mark the new flow as
6534  *      "visible".
6535  * mod: Modify the collected flows.
6536  * del: Delete the collected flows.
6537  */
6538 static enum ofperr
6539 do_bundle_commit(struct ofconn *ofconn, uint32_t id, uint16_t flags)
6540 {
6541     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
6542     struct ofp_bundle *bundle;
6543     struct ofp_bundle_entry *be;
6544     enum ofperr error;
6545
6546     bundle = ofconn_get_bundle(ofconn, id);
6547
6548     if (!bundle) {
6549         return OFPERR_OFPBFC_BAD_ID;
6550     }
6551     if (bundle->flags != flags) {
6552         error = OFPERR_OFPBFC_BAD_FLAGS;
6553     } else {
6554         error = 0;
6555         ovs_mutex_lock(&ofproto_mutex);
6556         LIST_FOR_EACH (be, node, &bundle->msg_list) {
6557             if (be->type == OFPTYPE_PORT_MOD) {
6558                 /* Not supported yet. */
6559                 error = OFPERR_OFPBFC_MSG_FAILED;
6560             } else if (be->type == OFPTYPE_FLOW_MOD) {
6561                 error = do_bundle_flow_mod_begin(ofproto, &be->fm, be);
6562             } else {
6563                 OVS_NOT_REACHED();
6564             }
6565             if (error) {
6566                 break;
6567             }
6568         }
6569         if (error) {
6570             /* Send error referring to the original message. */
6571             if (error) {
6572                 ofconn_send_error(ofconn, be->ofp_msg, error);
6573                 error = OFPERR_OFPBFC_MSG_FAILED;
6574             }
6575
6576             /* Revert all previous entires. */
6577             LIST_FOR_EACH_REVERSE_CONTINUE(be, node, &bundle->msg_list) {
6578                 if (be->type == OFPTYPE_FLOW_MOD) {
6579                     do_bundle_flow_mod_revert(ofproto, &be->fm, be);
6580                 }
6581             }
6582         } else {
6583             /* Finish the changes. */
6584             LIST_FOR_EACH (be, node, &bundle->msg_list) {
6585                 if (be->type == OFPTYPE_FLOW_MOD) {
6586                     struct flow_mod_requester req = { ofconn, be->ofp_msg };
6587
6588                     do_bundle_flow_mod_finish(ofproto, &be->fm, &req, be);
6589                 }
6590             }
6591         }
6592         ofmonitor_flush(ofproto->connmgr);
6593         ovs_mutex_unlock(&ofproto_mutex);
6594
6595         run_rule_executes(ofproto);
6596     }
6597
6598     /* The bundle is discarded regardless the outcome. */
6599     ofp_bundle_remove__(ofconn, bundle, !error);
6600     return error;
6601 }
6602
6603 static enum ofperr
6604 handle_bundle_control(struct ofconn *ofconn, const struct ofp_header *oh)
6605 {
6606     struct ofputil_bundle_ctrl_msg bctrl;
6607     struct ofputil_bundle_ctrl_msg reply;
6608     struct ofpbuf *buf;
6609     enum ofperr error;
6610
6611     error = reject_slave_controller(ofconn);
6612     if (error) {
6613         return error;
6614     }
6615
6616     error = ofputil_decode_bundle_ctrl(oh, &bctrl);
6617     if (error) {
6618         return error;
6619     }
6620     /* Atomic updates not supported yet. */
6621     if (bctrl.flags & OFPBF_ATOMIC) {
6622         return OFPERR_OFPBFC_BAD_FLAGS;
6623     }
6624     reply.flags = 0;
6625     reply.bundle_id = bctrl.bundle_id;
6626
6627     switch (bctrl.type) {
6628         case OFPBCT_OPEN_REQUEST:
6629         error = ofp_bundle_open(ofconn, bctrl.bundle_id, bctrl.flags);
6630         reply.type = OFPBCT_OPEN_REPLY;
6631         break;
6632     case OFPBCT_CLOSE_REQUEST:
6633         error = ofp_bundle_close(ofconn, bctrl.bundle_id, bctrl.flags);
6634         reply.type = OFPBCT_CLOSE_REPLY;;
6635         break;
6636     case OFPBCT_COMMIT_REQUEST:
6637         error = do_bundle_commit(ofconn, bctrl.bundle_id, bctrl.flags);
6638         reply.type = OFPBCT_COMMIT_REPLY;
6639         break;
6640     case OFPBCT_DISCARD_REQUEST:
6641         error = ofp_bundle_discard(ofconn, bctrl.bundle_id);
6642         reply.type = OFPBCT_DISCARD_REPLY;
6643         break;
6644
6645     case OFPBCT_OPEN_REPLY:
6646     case OFPBCT_CLOSE_REPLY:
6647     case OFPBCT_COMMIT_REPLY:
6648     case OFPBCT_DISCARD_REPLY:
6649         return OFPERR_OFPBFC_BAD_TYPE;
6650         break;
6651     }
6652
6653     if (!error) {
6654         buf = ofputil_encode_bundle_ctrl_reply(oh, &reply);
6655         ofconn_send_reply(ofconn, buf);
6656     }
6657     return error;
6658 }
6659
6660 static enum ofperr
6661 handle_bundle_add(struct ofconn *ofconn, const struct ofp_header *oh)
6662 {
6663     struct ofproto *ofproto = ofconn_get_ofproto(ofconn);
6664     enum ofperr error;
6665     struct ofputil_bundle_add_msg badd;
6666     struct ofp_bundle_entry *bmsg;
6667     enum ofptype type;
6668
6669     error = reject_slave_controller(ofconn);
6670     if (error) {
6671         return error;
6672     }
6673
6674     error = ofputil_decode_bundle_add(oh, &badd, &type);
6675     if (error) {
6676         return error;
6677     }
6678
6679     bmsg = ofp_bundle_entry_alloc(type, badd.msg);
6680
6681     if (type == OFPTYPE_PORT_MOD) {
6682         error = ofputil_decode_port_mod(badd.msg, &bmsg->pm, false);
6683     } else if (type == OFPTYPE_FLOW_MOD) {
6684         struct ofpbuf ofpacts;
6685         uint64_t ofpacts_stub[1024 / 8];
6686
6687         ofpbuf_use_stub(&ofpacts, ofpacts_stub, sizeof ofpacts_stub);
6688         error = ofputil_decode_flow_mod(&bmsg->fm, badd.msg,
6689                                         ofconn_get_protocol(ofconn),
6690                                         &ofpacts,
6691                                         u16_to_ofp(ofproto->max_ports),
6692                                         ofproto->n_tables);
6693         /* Move actions to heap. */
6694         bmsg->fm.ofpacts = ofpbuf_steal_data(&ofpacts);
6695
6696         if (!error && bmsg->fm.ofpacts_len) {
6697             error = ofproto_check_ofpacts(ofproto, bmsg->fm.ofpacts,
6698                                           bmsg->fm.ofpacts_len);
6699         }
6700     } else {
6701         OVS_NOT_REACHED();
6702     }
6703
6704     if (!error) {
6705         error = ofp_bundle_add_message(ofconn, badd.bundle_id, badd.flags,
6706                                        bmsg);
6707     }
6708
6709     if (error) {
6710         ofp_bundle_entry_free(bmsg);
6711     }
6712
6713     return error;
6714 }
6715
6716 static enum ofperr
6717 handle_openflow__(struct ofconn *ofconn, const struct ofpbuf *msg)
6718     OVS_EXCLUDED(ofproto_mutex)
6719 {
6720     const struct ofp_header *oh = msg->data;
6721     enum ofptype type;
6722     enum ofperr error;
6723
6724     error = ofptype_decode(&type, oh);
6725     if (error) {
6726         return error;
6727     }
6728     if (oh->version >= OFP13_VERSION && ofpmsg_is_stat_request(oh)
6729         && ofpmp_more(oh)) {
6730         /* We have no buffer implementation for multipart requests.
6731          * Report overflow for requests which consists of multiple
6732          * messages. */
6733         return OFPERR_OFPBRC_MULTIPART_BUFFER_OVERFLOW;
6734     }
6735
6736     switch (type) {
6737         /* OpenFlow requests. */
6738     case OFPTYPE_ECHO_REQUEST:
6739         return handle_echo_request(ofconn, oh);
6740
6741     case OFPTYPE_FEATURES_REQUEST:
6742         return handle_features_request(ofconn, oh);
6743
6744     case OFPTYPE_GET_CONFIG_REQUEST:
6745         return handle_get_config_request(ofconn, oh);
6746
6747     case OFPTYPE_SET_CONFIG:
6748         return handle_set_config(ofconn, oh);
6749
6750     case OFPTYPE_PACKET_OUT:
6751         return handle_packet_out(ofconn, oh);
6752
6753     case OFPTYPE_PORT_MOD:
6754         return handle_port_mod(ofconn, oh);
6755
6756     case OFPTYPE_FLOW_MOD:
6757         return handle_flow_mod(ofconn, oh);
6758
6759     case OFPTYPE_GROUP_MOD:
6760         return handle_group_mod(ofconn, oh);
6761
6762     case OFPTYPE_TABLE_MOD:
6763         return handle_table_mod(ofconn, oh);
6764
6765     case OFPTYPE_METER_MOD:
6766         return handle_meter_mod(ofconn, oh);
6767
6768     case OFPTYPE_BARRIER_REQUEST:
6769         return handle_barrier_request(ofconn, oh);
6770
6771     case OFPTYPE_ROLE_REQUEST:
6772         return handle_role_request(ofconn, oh);
6773
6774         /* OpenFlow replies. */
6775     case OFPTYPE_ECHO_REPLY:
6776         return 0;
6777
6778         /* Nicira extension requests. */
6779     case OFPTYPE_FLOW_MOD_TABLE_ID:
6780         return handle_nxt_flow_mod_table_id(ofconn, oh);
6781
6782     case OFPTYPE_SET_FLOW_FORMAT:
6783         return handle_nxt_set_flow_format(ofconn, oh);
6784
6785     case OFPTYPE_SET_PACKET_IN_FORMAT:
6786         return handle_nxt_set_packet_in_format(ofconn, oh);
6787
6788     case OFPTYPE_SET_CONTROLLER_ID:
6789         return handle_nxt_set_controller_id(ofconn, oh);
6790
6791     case OFPTYPE_FLOW_AGE:
6792         /* Nothing to do. */
6793         return 0;
6794
6795     case OFPTYPE_FLOW_MONITOR_CANCEL:
6796         return handle_flow_monitor_cancel(ofconn, oh);
6797
6798     case OFPTYPE_SET_ASYNC_CONFIG:
6799         return handle_nxt_set_async_config(ofconn, oh);
6800
6801     case OFPTYPE_GET_ASYNC_REQUEST:
6802         return handle_nxt_get_async_request(ofconn, oh);
6803
6804         /* Statistics requests. */
6805     case OFPTYPE_DESC_STATS_REQUEST:
6806         return handle_desc_stats_request(ofconn, oh);
6807
6808     case OFPTYPE_FLOW_STATS_REQUEST:
6809         return handle_flow_stats_request(ofconn, oh);
6810
6811     case OFPTYPE_AGGREGATE_STATS_REQUEST:
6812         return handle_aggregate_stats_request(ofconn, oh);
6813
6814     case OFPTYPE_TABLE_STATS_REQUEST:
6815         return handle_table_stats_request(ofconn, oh);
6816
6817     case OFPTYPE_TABLE_FEATURES_STATS_REQUEST:
6818         return handle_table_features_request(ofconn, oh);
6819
6820     case OFPTYPE_PORT_STATS_REQUEST:
6821         return handle_port_stats_request(ofconn, oh);
6822
6823     case OFPTYPE_QUEUE_STATS_REQUEST:
6824         return handle_queue_stats_request(ofconn, oh);
6825
6826     case OFPTYPE_PORT_DESC_STATS_REQUEST:
6827         return handle_port_desc_stats_request(ofconn, oh);
6828
6829     case OFPTYPE_FLOW_MONITOR_STATS_REQUEST:
6830         return handle_flow_monitor_request(ofconn, oh);
6831
6832     case OFPTYPE_METER_STATS_REQUEST:
6833     case OFPTYPE_METER_CONFIG_STATS_REQUEST:
6834         return handle_meter_request(ofconn, oh, type);
6835
6836     case OFPTYPE_METER_FEATURES_STATS_REQUEST:
6837         return handle_meter_features_request(ofconn, oh);
6838
6839     case OFPTYPE_GROUP_STATS_REQUEST:
6840         return handle_group_stats_request(ofconn, oh);
6841
6842     case OFPTYPE_GROUP_DESC_STATS_REQUEST:
6843         return handle_group_desc_stats_request(ofconn, oh);
6844
6845     case OFPTYPE_GROUP_FEATURES_STATS_REQUEST:
6846         return handle_group_features_stats_request(ofconn, oh);
6847
6848     case OFPTYPE_QUEUE_GET_CONFIG_REQUEST:
6849         return handle_queue_get_config_request(ofconn, oh);
6850
6851     case OFPTYPE_BUNDLE_CONTROL:
6852         return handle_bundle_control(ofconn, oh);
6853
6854     case OFPTYPE_BUNDLE_ADD_MESSAGE:
6855         return handle_bundle_add(ofconn, oh);
6856
6857     case OFPTYPE_HELLO:
6858     case OFPTYPE_ERROR:
6859     case OFPTYPE_FEATURES_REPLY:
6860     case OFPTYPE_GET_CONFIG_REPLY:
6861     case OFPTYPE_PACKET_IN:
6862     case OFPTYPE_FLOW_REMOVED:
6863     case OFPTYPE_PORT_STATUS:
6864     case OFPTYPE_BARRIER_REPLY:
6865     case OFPTYPE_QUEUE_GET_CONFIG_REPLY:
6866     case OFPTYPE_DESC_STATS_REPLY:
6867     case OFPTYPE_FLOW_STATS_REPLY:
6868     case OFPTYPE_QUEUE_STATS_REPLY:
6869     case OFPTYPE_PORT_STATS_REPLY:
6870     case OFPTYPE_TABLE_STATS_REPLY:
6871     case OFPTYPE_AGGREGATE_STATS_REPLY:
6872     case OFPTYPE_PORT_DESC_STATS_REPLY:
6873     case OFPTYPE_ROLE_REPLY:
6874     case OFPTYPE_FLOW_MONITOR_PAUSED:
6875     case OFPTYPE_FLOW_MONITOR_RESUMED:
6876     case OFPTYPE_FLOW_MONITOR_STATS_REPLY:
6877     case OFPTYPE_GET_ASYNC_REPLY:
6878     case OFPTYPE_GROUP_STATS_REPLY:
6879     case OFPTYPE_GROUP_DESC_STATS_REPLY:
6880     case OFPTYPE_GROUP_FEATURES_STATS_REPLY:
6881     case OFPTYPE_METER_STATS_REPLY:
6882     case OFPTYPE_METER_CONFIG_STATS_REPLY:
6883     case OFPTYPE_METER_FEATURES_STATS_REPLY:
6884     case OFPTYPE_TABLE_FEATURES_STATS_REPLY:
6885     case OFPTYPE_ROLE_STATUS:
6886     default:
6887         if (ofpmsg_is_stat_request(oh)) {
6888             return OFPERR_OFPBRC_BAD_STAT;
6889         } else {
6890             return OFPERR_OFPBRC_BAD_TYPE;
6891         }
6892     }
6893 }
6894
6895 static void
6896 handle_openflow(struct ofconn *ofconn, const struct ofpbuf *ofp_msg)
6897     OVS_EXCLUDED(ofproto_mutex)
6898 {
6899     enum ofperr error = handle_openflow__(ofconn, ofp_msg);
6900
6901     if (error) {
6902         ofconn_send_error(ofconn, ofp_msg->data, error);
6903     }
6904     COVERAGE_INC(ofproto_recv_openflow);
6905 }
6906 \f
6907 /* Asynchronous operations. */
6908
6909 static void
6910 send_buffered_packet(const struct flow_mod_requester *req, uint32_t buffer_id,
6911                      struct rule *rule)
6912     OVS_REQUIRES(ofproto_mutex)
6913 {
6914     if (req && req->ofconn && buffer_id != UINT32_MAX) {
6915         struct ofproto *ofproto = ofconn_get_ofproto(req->ofconn);
6916         struct dp_packet *packet;
6917         ofp_port_t in_port;
6918         enum ofperr error;
6919
6920         error = ofconn_pktbuf_retrieve(req->ofconn, buffer_id, &packet,
6921                                        &in_port);
6922         if (packet) {
6923             struct rule_execute *re;
6924
6925             ofproto_rule_ref(rule);
6926
6927             re = xmalloc(sizeof *re);
6928             re->rule = rule;
6929             re->in_port = in_port;
6930             re->packet = packet;
6931
6932             if (!guarded_list_push_back(&ofproto->rule_executes,
6933                                         &re->list_node, 1024)) {
6934                 ofproto_rule_unref(rule);
6935                 dp_packet_delete(re->packet);
6936                 free(re);
6937             }
6938         } else {
6939             ofconn_send_error(req->ofconn, req->request, error);
6940         }
6941     }
6942 }
6943 \f
6944 static uint64_t
6945 pick_datapath_id(const struct ofproto *ofproto)
6946 {
6947     const struct ofport *port;
6948
6949     port = ofproto_get_port(ofproto, OFPP_LOCAL);
6950     if (port) {
6951         uint8_t ea[ETH_ADDR_LEN];
6952         int error;
6953
6954         error = netdev_get_etheraddr(port->netdev, ea);
6955         if (!error) {
6956             return eth_addr_to_uint64(ea);
6957         }
6958         VLOG_WARN("%s: could not get MAC address for %s (%s)",
6959                   ofproto->name, netdev_get_name(port->netdev),
6960                   ovs_strerror(error));
6961     }
6962     return ofproto->fallback_dpid;
6963 }
6964
6965 static uint64_t
6966 pick_fallback_dpid(void)
6967 {
6968     uint8_t ea[ETH_ADDR_LEN];
6969     eth_addr_nicira_random(ea);
6970     return eth_addr_to_uint64(ea);
6971 }
6972 \f
6973 /* Table overflow policy. */
6974
6975 /* Chooses and updates 'rulep' with a rule to evict from 'table'.  Sets 'rulep'
6976  * to NULL if the table is not configured to evict rules or if the table
6977  * contains no evictable rules.  (Rules with a readlock on their evict rwlock,
6978  * or with no timeouts are not evictable.) */
6979 static bool
6980 choose_rule_to_evict(struct oftable *table, struct rule **rulep)
6981     OVS_REQUIRES(ofproto_mutex)
6982 {
6983     struct eviction_group *evg;
6984
6985     *rulep = NULL;
6986     if (!table->eviction_fields) {
6987         return false;
6988     }
6989
6990     /* In the common case, the outer and inner loops here will each be entered
6991      * exactly once:
6992      *
6993      *   - The inner loop normally "return"s in its first iteration.  If the
6994      *     eviction group has any evictable rules, then it always returns in
6995      *     some iteration.
6996      *
6997      *   - The outer loop only iterates more than once if the largest eviction
6998      *     group has no evictable rules.
6999      *
7000      *   - The outer loop can exit only if table's 'max_flows' is all filled up
7001      *     by unevictable rules. */
7002     HEAP_FOR_EACH (evg, size_node, &table->eviction_groups_by_size) {
7003         struct rule *rule;
7004
7005         HEAP_FOR_EACH (rule, evg_node, &evg->rules) {
7006             *rulep = rule;
7007             return true;
7008         }
7009     }
7010
7011     return false;
7012 }
7013 \f
7014 /* Eviction groups. */
7015
7016 /* Returns the priority to use for an eviction_group that contains 'n_rules'
7017  * rules.  The priority contains low-order random bits to ensure that eviction
7018  * groups with the same number of rules are prioritized randomly. */
7019 static uint32_t
7020 eviction_group_priority(size_t n_rules)
7021 {
7022     uint16_t size = MIN(UINT16_MAX, n_rules);
7023     return (size << 16) | random_uint16();
7024 }
7025
7026 /* Updates 'evg', an eviction_group within 'table', following a change that
7027  * adds or removes rules in 'evg'. */
7028 static void
7029 eviction_group_resized(struct oftable *table, struct eviction_group *evg)
7030     OVS_REQUIRES(ofproto_mutex)
7031 {
7032     heap_change(&table->eviction_groups_by_size, &evg->size_node,
7033                 eviction_group_priority(heap_count(&evg->rules)));
7034 }
7035
7036 /* Destroys 'evg', an eviction_group within 'table':
7037  *
7038  *   - Removes all the rules, if any, from 'evg'.  (It doesn't destroy the
7039  *     rules themselves, just removes them from the eviction group.)
7040  *
7041  *   - Removes 'evg' from 'table'.
7042  *
7043  *   - Frees 'evg'. */
7044 static void
7045 eviction_group_destroy(struct oftable *table, struct eviction_group *evg)
7046     OVS_REQUIRES(ofproto_mutex)
7047 {
7048     while (!heap_is_empty(&evg->rules)) {
7049         struct rule *rule;
7050
7051         rule = CONTAINER_OF(heap_pop(&evg->rules), struct rule, evg_node);
7052         rule->eviction_group = NULL;
7053     }
7054     hmap_remove(&table->eviction_groups_by_id, &evg->id_node);
7055     heap_remove(&table->eviction_groups_by_size, &evg->size_node);
7056     heap_destroy(&evg->rules);
7057     free(evg);
7058 }
7059
7060 /* Removes 'rule' from its eviction group, if any. */
7061 static void
7062 eviction_group_remove_rule(struct rule *rule)
7063     OVS_REQUIRES(ofproto_mutex)
7064 {
7065     if (rule->eviction_group) {
7066         struct oftable *table = &rule->ofproto->tables[rule->table_id];
7067         struct eviction_group *evg = rule->eviction_group;
7068
7069         rule->eviction_group = NULL;
7070         heap_remove(&evg->rules, &rule->evg_node);
7071         if (heap_is_empty(&evg->rules)) {
7072             eviction_group_destroy(table, evg);
7073         } else {
7074             eviction_group_resized(table, evg);
7075         }
7076     }
7077 }
7078
7079 /* Hashes the 'rule''s values for the eviction_fields of 'rule''s table, and
7080  * returns the hash value. */
7081 static uint32_t
7082 eviction_group_hash_rule(struct rule *rule)
7083     OVS_REQUIRES(ofproto_mutex)
7084 {
7085     struct oftable *table = &rule->ofproto->tables[rule->table_id];
7086     const struct mf_subfield *sf;
7087     struct flow flow;
7088     uint32_t hash;
7089
7090     hash = table->eviction_group_id_basis;
7091     miniflow_expand(&rule->cr.match.flow, &flow);
7092     for (sf = table->eviction_fields;
7093          sf < &table->eviction_fields[table->n_eviction_fields];
7094          sf++)
7095     {
7096         if (mf_are_prereqs_ok(sf->field, &flow)) {
7097             union mf_value value;
7098
7099             mf_get_value(sf->field, &flow, &value);
7100             if (sf->ofs) {
7101                 bitwise_zero(&value, sf->field->n_bytes, 0, sf->ofs);
7102             }
7103             if (sf->ofs + sf->n_bits < sf->field->n_bytes * 8) {
7104                 unsigned int start = sf->ofs + sf->n_bits;
7105                 bitwise_zero(&value, sf->field->n_bytes, start,
7106                              sf->field->n_bytes * 8 - start);
7107             }
7108             hash = hash_bytes(&value, sf->field->n_bytes, hash);
7109         } else {
7110             hash = hash_int(hash, 0);
7111         }
7112     }
7113
7114     return hash;
7115 }
7116
7117 /* Returns an eviction group within 'table' with the given 'id', creating one
7118  * if necessary. */
7119 static struct eviction_group *
7120 eviction_group_find(struct oftable *table, uint32_t id)
7121     OVS_REQUIRES(ofproto_mutex)
7122 {
7123     struct eviction_group *evg;
7124
7125     HMAP_FOR_EACH_WITH_HASH (evg, id_node, id, &table->eviction_groups_by_id) {
7126         return evg;
7127     }
7128
7129     evg = xmalloc(sizeof *evg);
7130     hmap_insert(&table->eviction_groups_by_id, &evg->id_node, id);
7131     heap_insert(&table->eviction_groups_by_size, &evg->size_node,
7132                 eviction_group_priority(0));
7133     heap_init(&evg->rules);
7134
7135     return evg;
7136 }
7137
7138 /* Returns an eviction priority for 'rule'.  The return value should be
7139  * interpreted so that higher priorities make a rule more attractive candidates
7140  * for eviction.
7141  * Called only if have a timeout. */
7142 static uint32_t
7143 rule_eviction_priority(struct ofproto *ofproto, struct rule *rule)
7144     OVS_REQUIRES(ofproto_mutex)
7145 {
7146     long long int expiration = LLONG_MAX;
7147     long long int modified;
7148     uint32_t expiration_offset;
7149
7150     /* 'modified' needs protection even when we hold 'ofproto_mutex'. */
7151     ovs_mutex_lock(&rule->mutex);
7152     modified = rule->modified;
7153     ovs_mutex_unlock(&rule->mutex);
7154
7155     if (rule->hard_timeout) {
7156         expiration = modified + rule->hard_timeout * 1000;
7157     }
7158     if (rule->idle_timeout) {
7159         uint64_t packets, bytes;
7160         long long int used;
7161         long long int idle_expiration;
7162
7163         ofproto->ofproto_class->rule_get_stats(rule, &packets, &bytes, &used);
7164         idle_expiration = used + rule->idle_timeout * 1000;
7165         expiration = MIN(expiration, idle_expiration);
7166     }
7167
7168     if (expiration == LLONG_MAX) {
7169         return 0;
7170     }
7171
7172     /* Calculate the time of expiration as a number of (approximate) seconds
7173      * after program startup.
7174      *
7175      * This should work OK for program runs that last UINT32_MAX seconds or
7176      * less.  Therefore, please restart OVS at least once every 136 years. */
7177     expiration_offset = (expiration >> 10) - (time_boot_msec() >> 10);
7178
7179     /* Invert the expiration offset because we're using a max-heap. */
7180     return UINT32_MAX - expiration_offset;
7181 }
7182
7183 /* Adds 'rule' to an appropriate eviction group for its oftable's
7184  * configuration.  Does nothing if 'rule''s oftable doesn't have eviction
7185  * enabled, or if 'rule' is a permanent rule (one that will never expire on its
7186  * own).
7187  *
7188  * The caller must ensure that 'rule' is not already in an eviction group. */
7189 static void
7190 eviction_group_add_rule(struct rule *rule)
7191     OVS_REQUIRES(ofproto_mutex)
7192 {
7193     struct ofproto *ofproto = rule->ofproto;
7194     struct oftable *table = &ofproto->tables[rule->table_id];
7195     bool has_timeout;
7196
7197     /* Timeouts may be modified only when holding 'ofproto_mutex'.  We have it
7198      * so no additional protection is needed. */
7199     has_timeout = rule->hard_timeout || rule->idle_timeout;
7200
7201     if (table->eviction_fields && has_timeout) {
7202         struct eviction_group *evg;
7203
7204         evg = eviction_group_find(table, eviction_group_hash_rule(rule));
7205
7206         rule->eviction_group = evg;
7207         heap_insert(&evg->rules, &rule->evg_node,
7208                     rule_eviction_priority(ofproto, rule));
7209         eviction_group_resized(table, evg);
7210     }
7211 }
7212 \f
7213 /* oftables. */
7214
7215 /* Initializes 'table'. */
7216 static void
7217 oftable_init(struct oftable *table)
7218 {
7219     memset(table, 0, sizeof *table);
7220     classifier_init(&table->cls, flow_segment_u64s);
7221     table->max_flows = UINT_MAX;
7222     atomic_init(&table->miss_config, OFPUTIL_TABLE_MISS_DEFAULT);
7223
7224     classifier_set_prefix_fields(&table->cls, default_prefix_fields,
7225                                  ARRAY_SIZE(default_prefix_fields));
7226
7227     atomic_init(&table->n_matched, 0);
7228     atomic_init(&table->n_missed, 0);
7229 }
7230
7231 /* Destroys 'table', including its classifier and eviction groups.
7232  *
7233  * The caller is responsible for freeing 'table' itself. */
7234 static void
7235 oftable_destroy(struct oftable *table)
7236 {
7237     ovs_assert(classifier_is_empty(&table->cls));
7238     oftable_disable_eviction(table);
7239     classifier_destroy(&table->cls);
7240     free(table->name);
7241 }
7242
7243 /* Changes the name of 'table' to 'name'.  If 'name' is NULL or the empty
7244  * string, then 'table' will use its default name.
7245  *
7246  * This only affects the name exposed for a table exposed through the OpenFlow
7247  * OFPST_TABLE (as printed by "ovs-ofctl dump-tables"). */
7248 static void
7249 oftable_set_name(struct oftable *table, const char *name)
7250 {
7251     if (name && name[0]) {
7252         int len = strnlen(name, OFP_MAX_TABLE_NAME_LEN);
7253         if (!table->name || strncmp(name, table->name, len)) {
7254             free(table->name);
7255             table->name = xmemdup0(name, len);
7256         }
7257     } else {
7258         free(table->name);
7259         table->name = NULL;
7260     }
7261 }
7262
7263 /* oftables support a choice of two policies when adding a rule would cause the
7264  * number of flows in the table to exceed the configured maximum number: either
7265  * they can refuse to add the new flow or they can evict some existing flow.
7266  * This function configures the former policy on 'table'. */
7267 static void
7268 oftable_disable_eviction(struct oftable *table)
7269     OVS_REQUIRES(ofproto_mutex)
7270 {
7271     if (table->eviction_fields) {
7272         struct eviction_group *evg, *next;
7273
7274         HMAP_FOR_EACH_SAFE (evg, next, id_node,
7275                             &table->eviction_groups_by_id) {
7276             eviction_group_destroy(table, evg);
7277         }
7278         hmap_destroy(&table->eviction_groups_by_id);
7279         heap_destroy(&table->eviction_groups_by_size);
7280
7281         free(table->eviction_fields);
7282         table->eviction_fields = NULL;
7283         table->n_eviction_fields = 0;
7284     }
7285 }
7286
7287 /* oftables support a choice of two policies when adding a rule would cause the
7288  * number of flows in the table to exceed the configured maximum number: either
7289  * they can refuse to add the new flow or they can evict some existing flow.
7290  * This function configures the latter policy on 'table', with fairness based
7291  * on the values of the 'n_fields' fields specified in 'fields'.  (Specifying
7292  * 'n_fields' as 0 disables fairness.) */
7293 static void
7294 oftable_enable_eviction(struct oftable *table,
7295                         const struct mf_subfield *fields, size_t n_fields)
7296     OVS_REQUIRES(ofproto_mutex)
7297 {
7298     struct rule *rule;
7299
7300     if (table->eviction_fields
7301         && n_fields == table->n_eviction_fields
7302         && (!n_fields
7303             || !memcmp(fields, table->eviction_fields,
7304                        n_fields * sizeof *fields))) {
7305         /* No change. */
7306         return;
7307     }
7308
7309     oftable_disable_eviction(table);
7310
7311     table->n_eviction_fields = n_fields;
7312     table->eviction_fields = xmemdup(fields, n_fields * sizeof *fields);
7313
7314     table->eviction_group_id_basis = random_uint32();
7315     hmap_init(&table->eviction_groups_by_id);
7316     heap_init(&table->eviction_groups_by_size);
7317
7318     CLS_FOR_EACH (rule, cr, &table->cls) {
7319         eviction_group_add_rule(rule);
7320     }
7321 }
7322
7323 /* Inserts 'rule' from the ofproto data structures BEFORE caller has inserted
7324  * it to the classifier. */
7325 static void
7326 ofproto_rule_insert__(struct ofproto *ofproto, struct rule *rule)
7327     OVS_REQUIRES(ofproto_mutex)
7328 {
7329     const struct rule_actions *actions = rule_get_actions(rule);
7330
7331     if (rule->hard_timeout || rule->idle_timeout) {
7332         list_insert(&ofproto->expirable, &rule->expirable);
7333     }
7334     cookies_insert(ofproto, rule);
7335     eviction_group_add_rule(rule);
7336     if (actions->has_meter) {
7337         meter_insert_rule(rule);
7338     }
7339 }
7340
7341 /* Removes 'rule' from the ofproto data structures AFTER caller has removed
7342  * it from the classifier. */
7343 static void
7344 ofproto_rule_remove__(struct ofproto *ofproto, struct rule *rule)
7345     OVS_REQUIRES(ofproto_mutex)
7346 {
7347     cookies_remove(ofproto, rule);
7348
7349     eviction_group_remove_rule(rule);
7350     if (!list_is_empty(&rule->expirable)) {
7351         list_remove(&rule->expirable);
7352     }
7353     if (!list_is_empty(&rule->meter_list_node)) {
7354         list_remove(&rule->meter_list_node);
7355         list_init(&rule->meter_list_node);
7356     }
7357 }
7358
7359 static void
7360 oftable_remove_rule(struct rule *rule)
7361     OVS_REQUIRES(ofproto_mutex)
7362 {
7363     struct classifier *cls = &rule->ofproto->tables[rule->table_id].cls;
7364
7365     if (classifier_remove(cls, &rule->cr)) {
7366         ofproto_rule_remove__(rule->ofproto, rule);
7367     }
7368 }
7369 \f
7370 /* unixctl commands. */
7371
7372 struct ofproto *
7373 ofproto_lookup(const char *name)
7374 {
7375     struct ofproto *ofproto;
7376
7377     HMAP_FOR_EACH_WITH_HASH (ofproto, hmap_node, hash_string(name, 0),
7378                              &all_ofprotos) {
7379         if (!strcmp(ofproto->name, name)) {
7380             return ofproto;
7381         }
7382     }
7383     return NULL;
7384 }
7385
7386 static void
7387 ofproto_unixctl_list(struct unixctl_conn *conn, int argc OVS_UNUSED,
7388                      const char *argv[] OVS_UNUSED, void *aux OVS_UNUSED)
7389 {
7390     struct ofproto *ofproto;
7391     struct ds results;
7392
7393     ds_init(&results);
7394     HMAP_FOR_EACH (ofproto, hmap_node, &all_ofprotos) {
7395         ds_put_format(&results, "%s\n", ofproto->name);
7396     }
7397     unixctl_command_reply(conn, ds_cstr(&results));
7398     ds_destroy(&results);
7399 }
7400
7401 static void
7402 ofproto_unixctl_init(void)
7403 {
7404     static bool registered;
7405     if (registered) {
7406         return;
7407     }
7408     registered = true;
7409
7410     unixctl_command_register("ofproto/list", "", 0, 0,
7411                              ofproto_unixctl_list, NULL);
7412 }
7413 \f
7414 /* Linux VLAN device support (e.g. "eth0.10" for VLAN 10.)
7415  *
7416  * This is deprecated.  It is only for compatibility with broken device drivers
7417  * in old versions of Linux that do not properly support VLANs when VLAN
7418  * devices are not used.  When broken device drivers are no longer in
7419  * widespread use, we will delete these interfaces. */
7420
7421 /* Sets a 1-bit in the 4096-bit 'vlan_bitmap' for each VLAN ID that is matched
7422  * (exactly) by an OpenFlow rule in 'ofproto'. */
7423 void
7424 ofproto_get_vlan_usage(struct ofproto *ofproto, unsigned long int *vlan_bitmap)
7425 {
7426     struct match match;
7427     struct cls_rule target;
7428     const struct oftable *oftable;
7429
7430     match_init_catchall(&match);
7431     match_set_vlan_vid_masked(&match, htons(VLAN_CFI), htons(VLAN_CFI));
7432     cls_rule_init(&target, &match, 0);
7433
7434     free(ofproto->vlan_bitmap);
7435     ofproto->vlan_bitmap = bitmap_allocate(4096);
7436     ofproto->vlans_changed = false;
7437
7438     OFPROTO_FOR_EACH_TABLE (oftable, ofproto) {
7439         struct rule *rule;
7440
7441         CLS_FOR_EACH_TARGET (rule, cr, &oftable->cls, &target) {
7442             if (minimask_get_vid_mask(&rule->cr.match.mask) == VLAN_VID_MASK) {
7443                 uint16_t vid = miniflow_get_vid(&rule->cr.match.flow);
7444
7445                 bitmap_set1(vlan_bitmap, vid);
7446                 bitmap_set1(ofproto->vlan_bitmap, vid);
7447             }
7448         }
7449     }
7450
7451     cls_rule_destroy(&target);
7452 }
7453
7454 /* Returns true if new VLANs have come into use by the flow table since the
7455  * last call to ofproto_get_vlan_usage().
7456  *
7457  * We don't track when old VLANs stop being used. */
7458 bool
7459 ofproto_has_vlan_usage_changed(const struct ofproto *ofproto)
7460 {
7461     return ofproto->vlans_changed;
7462 }
7463
7464 /* Configures a VLAN splinter binding between the ports identified by OpenFlow
7465  * port numbers 'vlandev_ofp_port' and 'realdev_ofp_port'.  If
7466  * 'realdev_ofp_port' is nonzero, then the VLAN device is enslaved to the real
7467  * device as a VLAN splinter for VLAN ID 'vid'.  If 'realdev_ofp_port' is zero,
7468  * then the VLAN device is un-enslaved. */
7469 int
7470 ofproto_port_set_realdev(struct ofproto *ofproto, ofp_port_t vlandev_ofp_port,
7471                          ofp_port_t realdev_ofp_port, int vid)
7472 {
7473     struct ofport *ofport;
7474     int error;
7475
7476     ovs_assert(vlandev_ofp_port != realdev_ofp_port);
7477
7478     ofport = ofproto_get_port(ofproto, vlandev_ofp_port);
7479     if (!ofport) {
7480         VLOG_WARN("%s: cannot set realdev on nonexistent port %"PRIu16,
7481                   ofproto->name, vlandev_ofp_port);
7482         return EINVAL;
7483     }
7484
7485     if (!ofproto->ofproto_class->set_realdev) {
7486         if (!vlandev_ofp_port) {
7487             return 0;
7488         }
7489         VLOG_WARN("%s: vlan splinters not supported", ofproto->name);
7490         return EOPNOTSUPP;
7491     }
7492
7493     error = ofproto->ofproto_class->set_realdev(ofport, realdev_ofp_port, vid);
7494     if (error) {
7495         VLOG_WARN("%s: setting realdev on port %"PRIu16" (%s) failed (%s)",
7496                   ofproto->name, vlandev_ofp_port,
7497                   netdev_get_name(ofport->netdev), ovs_strerror(error));
7498     }
7499     return error;
7500 }