datapath-windows: Update VXLAN header information
[cascardo/ovs.git] / lib / flow.c
1 /*
2  * Copyright (c) 2008, 2009, 2010, 2011, 2012, 2013, 2014, 2015 Nicira, Inc.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at:
7  *
8  *     http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16 #include <config.h>
17 #include <sys/types.h>
18 #include "flow.h"
19 #include <errno.h>
20 #include <inttypes.h>
21 #include <limits.h>
22 #include <netinet/in.h>
23 #include <netinet/icmp6.h>
24 #include <netinet/ip6.h>
25 #include <stdint.h>
26 #include <stdlib.h>
27 #include <string.h>
28 #include "byte-order.h"
29 #include "coverage.h"
30 #include "csum.h"
31 #include "dynamic-string.h"
32 #include "hash.h"
33 #include "jhash.h"
34 #include "match.h"
35 #include "dp-packet.h"
36 #include "openflow/openflow.h"
37 #include "packets.h"
38 #include "odp-util.h"
39 #include "random.h"
40 #include "unaligned.h"
41
42 COVERAGE_DEFINE(flow_extract);
43 COVERAGE_DEFINE(miniflow_malloc);
44
45 /* U64 indices for segmented flow classification. */
46 const uint8_t flow_segment_u64s[4] = {
47     FLOW_SEGMENT_1_ENDS_AT / sizeof(uint64_t),
48     FLOW_SEGMENT_2_ENDS_AT / sizeof(uint64_t),
49     FLOW_SEGMENT_3_ENDS_AT / sizeof(uint64_t),
50     FLOW_U64S
51 };
52
53 /* Asserts that field 'f1' follows immediately after 'f0' in struct flow,
54  * without any intervening padding. */
55 #define ASSERT_SEQUENTIAL(f0, f1)                       \
56     BUILD_ASSERT_DECL(offsetof(struct flow, f0)         \
57                       + MEMBER_SIZEOF(struct flow, f0)  \
58                       == offsetof(struct flow, f1))
59
60 /* Asserts that fields 'f0' and 'f1' are in the same 32-bit aligned word within
61  * struct flow. */
62 #define ASSERT_SAME_WORD(f0, f1)                        \
63     BUILD_ASSERT_DECL(offsetof(struct flow, f0) / 4     \
64                       == offsetof(struct flow, f1) / 4)
65
66 /* Asserts that 'f0' and 'f1' are both sequential and within the same 32-bit
67  * aligned word in struct flow. */
68 #define ASSERT_SEQUENTIAL_SAME_WORD(f0, f1)     \
69     ASSERT_SEQUENTIAL(f0, f1);                  \
70     ASSERT_SAME_WORD(f0, f1)
71
72 /* miniflow_extract() assumes the following to be true to optimize the
73  * extraction process. */
74 ASSERT_SEQUENTIAL_SAME_WORD(dl_type, vlan_tci);
75
76 ASSERT_SEQUENTIAL_SAME_WORD(nw_frag, nw_tos);
77 ASSERT_SEQUENTIAL_SAME_WORD(nw_tos, nw_ttl);
78 ASSERT_SEQUENTIAL_SAME_WORD(nw_ttl, nw_proto);
79
80 /* TCP flags in the middle of a BE64, zeroes in the other half. */
81 BUILD_ASSERT_DECL(offsetof(struct flow, tcp_flags) % 8 == 4);
82
83 #if WORDS_BIGENDIAN
84 #define TCP_FLAGS_BE32(tcp_ctl) ((OVS_FORCE ovs_be32)TCP_FLAGS_BE16(tcp_ctl) \
85                                  << 16)
86 #else
87 #define TCP_FLAGS_BE32(tcp_ctl) ((OVS_FORCE ovs_be32)TCP_FLAGS_BE16(tcp_ctl))
88 #endif
89
90 ASSERT_SEQUENTIAL_SAME_WORD(tp_src, tp_dst);
91
92 /* Removes 'size' bytes from the head end of '*datap', of size '*sizep', which
93  * must contain at least 'size' bytes of data.  Returns the first byte of data
94  * removed. */
95 static inline const void *
96 data_pull(const void **datap, size_t *sizep, size_t size)
97 {
98     const char *data = *datap;
99     *datap = data + size;
100     *sizep -= size;
101     return data;
102 }
103
104 /* If '*datap' has at least 'size' bytes of data, removes that many bytes from
105  * the head end of '*datap' and returns the first byte removed.  Otherwise,
106  * returns a null pointer without modifying '*datap'. */
107 static inline const void *
108 data_try_pull(const void **datap, size_t *sizep, size_t size)
109 {
110     return OVS_LIKELY(*sizep >= size) ? data_pull(datap, sizep, size) : NULL;
111 }
112
113 /* Context for pushing data to a miniflow. */
114 struct mf_ctx {
115     uint64_t map;
116     uint64_t *data;
117     uint64_t * const end;
118 };
119
120 /* miniflow_push_* macros allow filling in a miniflow data values in order.
121  * Assertions are needed only when the layout of the struct flow is modified.
122  * 'ofs' is a compile-time constant, which allows most of the code be optimized
123  * away.  Some GCC versions gave warnings on ALWAYS_INLINE, so these are
124  * defined as macros. */
125
126 #if (FLOW_WC_SEQ != 32)
127 #define MINIFLOW_ASSERT(X) ovs_assert(X)
128 BUILD_MESSAGE("FLOW_WC_SEQ changed: miniflow_extract() will have runtime "
129                "assertions enabled. Consider updating FLOW_WC_SEQ after "
130                "testing")
131 #else
132 #define MINIFLOW_ASSERT(X)
133 #endif
134
135 #define miniflow_push_uint64_(MF, OFS, VALUE)                   \
136 {                                                               \
137     MINIFLOW_ASSERT(MF.data < MF.end && (OFS) % 8 == 0          \
138                     && !(MF.map & (UINT64_MAX << (OFS) / 8)));  \
139     *MF.data++ = VALUE;                                         \
140     MF.map |= UINT64_C(1) << (OFS) / 8;                         \
141 }
142
143 #define miniflow_push_be64_(MF, OFS, VALUE) \
144     miniflow_push_uint64_(MF, OFS, (OVS_FORCE uint64_t)(VALUE))
145
146 #define miniflow_push_uint32_(MF, OFS, VALUE)                   \
147 {                                                               \
148     MINIFLOW_ASSERT(MF.data < MF.end &&                                 \
149                     (((OFS) % 8 == 0 && !(MF.map & (UINT64_MAX << (OFS) / 8))) \
150                      || ((OFS) % 8 == 4 && MF.map & (UINT64_C(1) << (OFS) / 8) \
151                          && !(MF.map & (UINT64_MAX << ((OFS) / 8 + 1)))))); \
152                                                                         \
153     if ((OFS) % 8 == 0) {                                               \
154         *(uint32_t *)MF.data = VALUE;                                   \
155         MF.map |= UINT64_C(1) << (OFS) / 8;                             \
156     } else if ((OFS) % 8 == 4) {                                        \
157         *((uint32_t *)MF.data + 1) = VALUE;                             \
158         MF.data++;                                                      \
159     }                                                                   \
160 }
161
162 #define miniflow_push_be32_(MF, OFS, VALUE)                     \
163     miniflow_push_uint32_(MF, OFS, (OVS_FORCE uint32_t)(VALUE))
164
165 #define miniflow_push_uint16_(MF, OFS, VALUE)                           \
166 {                                                                       \
167     MINIFLOW_ASSERT(MF.data < MF.end &&                                 \
168                     (((OFS) % 8 == 0 && !(MF.map & (UINT64_MAX << (OFS) / 8))) \
169                      || ((OFS) % 2 == 0 && MF.map & (UINT64_C(1) << (OFS) / 8) \
170                          && !(MF.map & (UINT64_MAX << ((OFS) / 8 + 1)))))); \
171                                                                         \
172     if ((OFS) % 8 == 0) {                                               \
173         *(uint16_t *)MF.data = VALUE;                                   \
174         MF.map |= UINT64_C(1) << (OFS) / 8;                             \
175     } else if ((OFS) % 8 == 2) {                                        \
176         *((uint16_t *)MF.data + 1) = VALUE;                             \
177     } else if ((OFS) % 8 == 4) {                                        \
178         *((uint16_t *)MF.data + 2) = VALUE;                             \
179     } else if ((OFS) % 8 == 6) {                                        \
180         *((uint16_t *)MF.data + 3) = VALUE;                             \
181         MF.data++;                                                      \
182     }                                                                   \
183 }
184
185 #define miniflow_pad_to_64_(MF, OFS)                                    \
186 {                                                                   \
187     MINIFLOW_ASSERT((OFS) % 8 != 0);                                    \
188     MINIFLOW_ASSERT(MF.map & (UINT64_C(1) << (OFS) / 8));               \
189     MINIFLOW_ASSERT(!(MF.map & (UINT64_MAX << ((OFS) / 8 + 1))));       \
190                                                                         \
191     memset((uint8_t *)MF.data + (OFS) % 8, 0, 8 - (OFS) % 8);           \
192     MF.data++;                                                          \
193 }
194
195 #define miniflow_push_be16_(MF, OFS, VALUE)                     \
196     miniflow_push_uint16_(MF, OFS, (OVS_FORCE uint16_t)VALUE);
197
198 /* Data at 'valuep' may be unaligned. */
199 #define miniflow_push_words_(MF, OFS, VALUEP, N_WORDS)          \
200 {                                                               \
201     int ofs64 = (OFS) / 8;                                      \
202                                                                         \
203     MINIFLOW_ASSERT(MF.data + (N_WORDS) <= MF.end && (OFS) % 8 == 0     \
204                     && !(MF.map & (UINT64_MAX << ofs64)));              \
205                                                                         \
206     memcpy(MF.data, (VALUEP), (N_WORDS) * sizeof *MF.data);             \
207     MF.data += (N_WORDS);                                               \
208     MF.map |= ((UINT64_MAX >> (64 - (N_WORDS))) << ofs64);              \
209 }
210
211 /* Push 32-bit words padded to 64-bits. */
212 #define miniflow_push_words_32_(MF, OFS, VALUEP, N_WORDS)               \
213 {                                                                       \
214     int ofs64 = (OFS) / 8;                                              \
215                                                                         \
216     MINIFLOW_ASSERT(MF.data + DIV_ROUND_UP(N_WORDS, 2) <= MF.end        \
217                     && (OFS) % 8 == 0                                   \
218                     && !(MF.map & (UINT64_MAX << ofs64)));              \
219                                                                         \
220     memcpy(MF.data, (VALUEP), (N_WORDS) * sizeof(uint32_t));            \
221     MF.data += DIV_ROUND_UP(N_WORDS, 2);                                \
222     MF.map |= ((UINT64_MAX >> (64 - DIV_ROUND_UP(N_WORDS, 2))) << ofs64); \
223     if ((N_WORDS) & 1) {                                                \
224         *((uint32_t *)MF.data - 1) = 0;                                 \
225     }                                                                   \
226 }
227
228 /* Data at 'valuep' may be unaligned. */
229 /* MACs start 64-aligned, and must be followed by other data or padding. */
230 #define miniflow_push_macs_(MF, OFS, VALUEP)                    \
231 {                                                               \
232     int ofs64 = (OFS) / 8;                                      \
233                                                                 \
234     MINIFLOW_ASSERT(MF.data + 2 <= MF.end && (OFS) % 8 == 0     \
235                     && !(MF.map & (UINT64_MAX << ofs64)));      \
236                                                                 \
237     memcpy(MF.data, (VALUEP), 2 * ETH_ADDR_LEN);                \
238     MF.data += 1;                   /* First word only. */      \
239     MF.map |= UINT64_C(3) << ofs64; /* Both words. */           \
240 }
241
242 #define miniflow_push_uint32(MF, FIELD, VALUE)                      \
243     miniflow_push_uint32_(MF, offsetof(struct flow, FIELD), VALUE)
244
245 #define miniflow_push_be32(MF, FIELD, VALUE)                        \
246     miniflow_push_be32_(MF, offsetof(struct flow, FIELD), VALUE)
247
248 #define miniflow_push_uint16(MF, FIELD, VALUE)                      \
249     miniflow_push_uint16_(MF, offsetof(struct flow, FIELD), VALUE)
250
251 #define miniflow_push_be16(MF, FIELD, VALUE)                        \
252     miniflow_push_be16_(MF, offsetof(struct flow, FIELD), VALUE)
253
254 #define miniflow_pad_to_64(MF, FIELD)                       \
255     miniflow_pad_to_64_(MF, offsetof(struct flow, FIELD))
256
257 #define miniflow_push_words(MF, FIELD, VALUEP, N_WORDS)                 \
258     miniflow_push_words_(MF, offsetof(struct flow, FIELD), VALUEP, N_WORDS)
259
260 #define miniflow_push_words_32(MF, FIELD, VALUEP, N_WORDS)              \
261     miniflow_push_words_32_(MF, offsetof(struct flow, FIELD), VALUEP, N_WORDS)
262
263 #define miniflow_push_macs(MF, FIELD, VALUEP)                       \
264     miniflow_push_macs_(MF, offsetof(struct flow, FIELD), VALUEP)
265
266 /* Pulls the MPLS headers at '*datap' and returns the count of them. */
267 static inline int
268 parse_mpls(const void **datap, size_t *sizep)
269 {
270     const struct mpls_hdr *mh;
271     int count = 0;
272
273     while ((mh = data_try_pull(datap, sizep, sizeof *mh))) {
274         count++;
275         if (mh->mpls_lse.lo & htons(1 << MPLS_BOS_SHIFT)) {
276             break;
277         }
278     }
279     return MIN(count, FLOW_MAX_MPLS_LABELS);
280 }
281
282 static inline ovs_be16
283 parse_vlan(const void **datap, size_t *sizep)
284 {
285     const struct eth_header *eth = *datap;
286
287     struct qtag_prefix {
288         ovs_be16 eth_type;      /* ETH_TYPE_VLAN */
289         ovs_be16 tci;
290     };
291
292     data_pull(datap, sizep, ETH_ADDR_LEN * 2);
293
294     if (eth->eth_type == htons(ETH_TYPE_VLAN)) {
295         if (OVS_LIKELY(*sizep
296                        >= sizeof(struct qtag_prefix) + sizeof(ovs_be16))) {
297             const struct qtag_prefix *qp = data_pull(datap, sizep, sizeof *qp);
298             return qp->tci | htons(VLAN_CFI);
299         }
300     }
301     return 0;
302 }
303
304 static inline ovs_be16
305 parse_ethertype(const void **datap, size_t *sizep)
306 {
307     const struct llc_snap_header *llc;
308     ovs_be16 proto;
309
310     proto = *(ovs_be16 *) data_pull(datap, sizep, sizeof proto);
311     if (OVS_LIKELY(ntohs(proto) >= ETH_TYPE_MIN)) {
312         return proto;
313     }
314
315     if (OVS_UNLIKELY(*sizep < sizeof *llc)) {
316         return htons(FLOW_DL_TYPE_NONE);
317     }
318
319     llc = *datap;
320     if (OVS_UNLIKELY(llc->llc.llc_dsap != LLC_DSAP_SNAP
321                      || llc->llc.llc_ssap != LLC_SSAP_SNAP
322                      || llc->llc.llc_cntl != LLC_CNTL_SNAP
323                      || memcmp(llc->snap.snap_org, SNAP_ORG_ETHERNET,
324                                sizeof llc->snap.snap_org))) {
325         return htons(FLOW_DL_TYPE_NONE);
326     }
327
328     data_pull(datap, sizep, sizeof *llc);
329
330     if (OVS_LIKELY(ntohs(llc->snap.snap_type) >= ETH_TYPE_MIN)) {
331         return llc->snap.snap_type;
332     }
333
334     return htons(FLOW_DL_TYPE_NONE);
335 }
336
337 static inline bool
338 parse_icmpv6(const void **datap, size_t *sizep, const struct icmp6_hdr *icmp,
339              const struct in6_addr **nd_target,
340              uint8_t arp_buf[2][ETH_ADDR_LEN])
341 {
342     if (icmp->icmp6_code == 0 &&
343         (icmp->icmp6_type == ND_NEIGHBOR_SOLICIT ||
344          icmp->icmp6_type == ND_NEIGHBOR_ADVERT)) {
345
346         *nd_target = data_try_pull(datap, sizep, sizeof **nd_target);
347         if (OVS_UNLIKELY(!*nd_target)) {
348             return false;
349         }
350
351         while (*sizep >= 8) {
352             /* The minimum size of an option is 8 bytes, which also is
353              * the size of Ethernet link-layer options. */
354             const struct nd_opt_hdr *nd_opt = *datap;
355             int opt_len = nd_opt->nd_opt_len * 8;
356
357             if (!opt_len || opt_len > *sizep) {
358                 goto invalid;
359             }
360
361             /* Store the link layer address if the appropriate option is
362              * provided.  It is considered an error if the same link
363              * layer option is specified twice. */
364             if (nd_opt->nd_opt_type == ND_OPT_SOURCE_LINKADDR
365                     && opt_len == 8) {
366                 if (OVS_LIKELY(eth_addr_is_zero(arp_buf[0]))) {
367                     memcpy(arp_buf[0], nd_opt + 1, ETH_ADDR_LEN);
368                 } else {
369                     goto invalid;
370                 }
371             } else if (nd_opt->nd_opt_type == ND_OPT_TARGET_LINKADDR
372                     && opt_len == 8) {
373                 if (OVS_LIKELY(eth_addr_is_zero(arp_buf[1]))) {
374                     memcpy(arp_buf[1], nd_opt + 1, ETH_ADDR_LEN);
375                 } else {
376                     goto invalid;
377                 }
378             }
379
380             if (OVS_UNLIKELY(!data_try_pull(datap, sizep, opt_len))) {
381                 goto invalid;
382             }
383         }
384     }
385
386     return true;
387
388 invalid:
389     return false;
390 }
391
392 /* Initializes 'flow' members from 'packet' and 'md'
393  *
394  * Initializes 'packet' header l2 pointer to the start of the Ethernet
395  * header, and the layer offsets as follows:
396  *
397  *    - packet->l2_5_ofs to the start of the MPLS shim header, or UINT16_MAX
398  *      when there is no MPLS shim header.
399  *
400  *    - packet->l3_ofs to just past the Ethernet header, or just past the
401  *      vlan_header if one is present, to the first byte of the payload of the
402  *      Ethernet frame.  UINT16_MAX if the frame is too short to contain an
403  *      Ethernet header.
404  *
405  *    - packet->l4_ofs to just past the IPv4 header, if one is present and
406  *      has at least the content used for the fields of interest for the flow,
407  *      otherwise UINT16_MAX.
408  */
409 void
410 flow_extract(struct dp_packet *packet, struct flow *flow)
411 {
412     struct {
413         struct miniflow mf;
414         uint64_t buf[FLOW_U64S];
415     } m;
416
417     COVERAGE_INC(flow_extract);
418
419     miniflow_initialize(&m.mf, m.buf);
420     miniflow_extract(packet, &m.mf);
421     miniflow_expand(&m.mf, flow);
422 }
423
424 /* Caller is responsible for initializing 'dst' with enough storage for
425  * FLOW_U64S * 8 bytes. */
426 void
427 miniflow_extract(struct dp_packet *packet, struct miniflow *dst)
428 {
429     const struct pkt_metadata *md = &packet->md;
430     const void *data = dp_packet_data(packet);
431     size_t size = dp_packet_size(packet);
432     uint64_t *values = miniflow_values(dst);
433     struct mf_ctx mf = { 0, values, values + FLOW_U64S };
434     const char *l2;
435     ovs_be16 dl_type;
436     uint8_t nw_frag, nw_tos, nw_ttl, nw_proto;
437
438     /* Metadata. */
439     if (md->tunnel.ip_dst) {
440         miniflow_push_words(mf, tunnel, &md->tunnel,
441                             offsetof(struct flow_tnl, metadata) /
442                             sizeof(uint64_t));
443         if (md->tunnel.metadata.opt_map) {
444             miniflow_push_words(mf, tunnel.metadata, &md->tunnel.metadata,
445                                  sizeof md->tunnel.metadata / sizeof(uint64_t));
446         }
447     }
448     if (md->skb_priority || md->pkt_mark) {
449         miniflow_push_uint32(mf, skb_priority, md->skb_priority);
450         miniflow_push_uint32(mf, pkt_mark, md->pkt_mark);
451     }
452     miniflow_push_uint32(mf, dp_hash, md->dp_hash);
453     miniflow_push_uint32(mf, in_port, odp_to_u32(md->in_port.odp_port));
454     if (md->recirc_id) {
455         miniflow_push_uint32(mf, recirc_id, md->recirc_id);
456         miniflow_pad_to_64(mf, conj_id);
457     }
458
459     /* Initialize packet's layer pointer and offsets. */
460     l2 = data;
461     dp_packet_reset_offsets(packet);
462
463     /* Must have full Ethernet header to proceed. */
464     if (OVS_UNLIKELY(size < sizeof(struct eth_header))) {
465         goto out;
466     } else {
467         ovs_be16 vlan_tci;
468
469         /* Link layer. */
470         ASSERT_SEQUENTIAL(dl_dst, dl_src);
471         miniflow_push_macs(mf, dl_dst, data);
472         /* dl_type, vlan_tci. */
473         vlan_tci = parse_vlan(&data, &size);
474         dl_type = parse_ethertype(&data, &size);
475         miniflow_push_be16(mf, dl_type, dl_type);
476         miniflow_push_be16(mf, vlan_tci, vlan_tci);
477     }
478
479     /* Parse mpls. */
480     if (OVS_UNLIKELY(eth_type_mpls(dl_type))) {
481         int count;
482         const void *mpls = data;
483
484         packet->l2_5_ofs = (char *)data - l2;
485         count = parse_mpls(&data, &size);
486         miniflow_push_words_32(mf, mpls_lse, mpls, count);
487     }
488
489     /* Network layer. */
490     packet->l3_ofs = (char *)data - l2;
491
492     nw_frag = 0;
493     if (OVS_LIKELY(dl_type == htons(ETH_TYPE_IP))) {
494         const struct ip_header *nh = data;
495         int ip_len;
496         uint16_t tot_len;
497
498         if (OVS_UNLIKELY(size < IP_HEADER_LEN)) {
499             goto out;
500         }
501         ip_len = IP_IHL(nh->ip_ihl_ver) * 4;
502
503         if (OVS_UNLIKELY(ip_len < IP_HEADER_LEN)) {
504             goto out;
505         }
506         if (OVS_UNLIKELY(size < ip_len)) {
507             goto out;
508         }
509         tot_len = ntohs(nh->ip_tot_len);
510         if (OVS_UNLIKELY(tot_len > size)) {
511             goto out;
512         }
513         if (OVS_UNLIKELY(size - tot_len > UINT8_MAX)) {
514             goto out;
515         }
516         dp_packet_set_l2_pad_size(packet, size - tot_len);
517         size = tot_len;   /* Never pull padding. */
518
519         /* Push both source and destination address at once. */
520         miniflow_push_words(mf, nw_src, &nh->ip_src, 1);
521
522         miniflow_push_be32(mf, ipv6_label, 0); /* Padding for IPv4. */
523
524         nw_tos = nh->ip_tos;
525         nw_ttl = nh->ip_ttl;
526         nw_proto = nh->ip_proto;
527         if (OVS_UNLIKELY(IP_IS_FRAGMENT(nh->ip_frag_off))) {
528             nw_frag = FLOW_NW_FRAG_ANY;
529             if (nh->ip_frag_off & htons(IP_FRAG_OFF_MASK)) {
530                 nw_frag |= FLOW_NW_FRAG_LATER;
531             }
532         }
533         data_pull(&data, &size, ip_len);
534     } else if (dl_type == htons(ETH_TYPE_IPV6)) {
535         const struct ovs_16aligned_ip6_hdr *nh;
536         ovs_be32 tc_flow;
537         uint16_t plen;
538
539         if (OVS_UNLIKELY(size < sizeof *nh)) {
540             goto out;
541         }
542         nh = data_pull(&data, &size, sizeof *nh);
543
544         plen = ntohs(nh->ip6_plen);
545         if (OVS_UNLIKELY(plen > size)) {
546             goto out;
547         }
548         /* Jumbo Payload option not supported yet. */
549         if (OVS_UNLIKELY(size - plen > UINT8_MAX)) {
550             goto out;
551         }
552         dp_packet_set_l2_pad_size(packet, size - plen);
553         size = plen;   /* Never pull padding. */
554
555         miniflow_push_words(mf, ipv6_src, &nh->ip6_src,
556                             sizeof nh->ip6_src / 8);
557         miniflow_push_words(mf, ipv6_dst, &nh->ip6_dst,
558                             sizeof nh->ip6_dst / 8);
559
560         tc_flow = get_16aligned_be32(&nh->ip6_flow);
561         {
562             ovs_be32 label = tc_flow & htonl(IPV6_LABEL_MASK);
563             miniflow_push_be32(mf, ipv6_label, label);
564         }
565
566         nw_tos = ntohl(tc_flow) >> 20;
567         nw_ttl = nh->ip6_hlim;
568         nw_proto = nh->ip6_nxt;
569
570         while (1) {
571             if (OVS_LIKELY((nw_proto != IPPROTO_HOPOPTS)
572                            && (nw_proto != IPPROTO_ROUTING)
573                            && (nw_proto != IPPROTO_DSTOPTS)
574                            && (nw_proto != IPPROTO_AH)
575                            && (nw_proto != IPPROTO_FRAGMENT))) {
576                 /* It's either a terminal header (e.g., TCP, UDP) or one we
577                  * don't understand.  In either case, we're done with the
578                  * packet, so use it to fill in 'nw_proto'. */
579                 break;
580             }
581
582             /* We only verify that at least 8 bytes of the next header are
583              * available, but many of these headers are longer.  Ensure that
584              * accesses within the extension header are within those first 8
585              * bytes. All extension headers are required to be at least 8
586              * bytes. */
587             if (OVS_UNLIKELY(size < 8)) {
588                 goto out;
589             }
590
591             if ((nw_proto == IPPROTO_HOPOPTS)
592                 || (nw_proto == IPPROTO_ROUTING)
593                 || (nw_proto == IPPROTO_DSTOPTS)) {
594                 /* These headers, while different, have the fields we care
595                  * about in the same location and with the same
596                  * interpretation. */
597                 const struct ip6_ext *ext_hdr = data;
598                 nw_proto = ext_hdr->ip6e_nxt;
599                 if (OVS_UNLIKELY(!data_try_pull(&data, &size,
600                                                 (ext_hdr->ip6e_len + 1) * 8))) {
601                     goto out;
602                 }
603             } else if (nw_proto == IPPROTO_AH) {
604                 /* A standard AH definition isn't available, but the fields
605                  * we care about are in the same location as the generic
606                  * option header--only the header length is calculated
607                  * differently. */
608                 const struct ip6_ext *ext_hdr = data;
609                 nw_proto = ext_hdr->ip6e_nxt;
610                 if (OVS_UNLIKELY(!data_try_pull(&data, &size,
611                                                 (ext_hdr->ip6e_len + 2) * 4))) {
612                     goto out;
613                 }
614             } else if (nw_proto == IPPROTO_FRAGMENT) {
615                 const struct ovs_16aligned_ip6_frag *frag_hdr = data;
616
617                 nw_proto = frag_hdr->ip6f_nxt;
618                 if (!data_try_pull(&data, &size, sizeof *frag_hdr)) {
619                     goto out;
620                 }
621
622                 /* We only process the first fragment. */
623                 if (frag_hdr->ip6f_offlg != htons(0)) {
624                     nw_frag = FLOW_NW_FRAG_ANY;
625                     if ((frag_hdr->ip6f_offlg & IP6F_OFF_MASK) != htons(0)) {
626                         nw_frag |= FLOW_NW_FRAG_LATER;
627                         nw_proto = IPPROTO_FRAGMENT;
628                         break;
629                     }
630                 }
631             }
632         }
633     } else {
634         if (dl_type == htons(ETH_TYPE_ARP) ||
635             dl_type == htons(ETH_TYPE_RARP)) {
636             uint8_t arp_buf[2][ETH_ADDR_LEN];
637             const struct arp_eth_header *arp = (const struct arp_eth_header *)
638                 data_try_pull(&data, &size, ARP_ETH_HEADER_LEN);
639
640             if (OVS_LIKELY(arp) && OVS_LIKELY(arp->ar_hrd == htons(1))
641                 && OVS_LIKELY(arp->ar_pro == htons(ETH_TYPE_IP))
642                 && OVS_LIKELY(arp->ar_hln == ETH_ADDR_LEN)
643                 && OVS_LIKELY(arp->ar_pln == 4)) {
644                 miniflow_push_be32(mf, nw_src,
645                                    get_16aligned_be32(&arp->ar_spa));
646                 miniflow_push_be32(mf, nw_dst,
647                                    get_16aligned_be32(&arp->ar_tpa));
648
649                 /* We only match on the lower 8 bits of the opcode. */
650                 if (OVS_LIKELY(ntohs(arp->ar_op) <= 0xff)) {
651                     miniflow_push_be32(mf, ipv6_label, 0); /* Pad with ARP. */
652                     miniflow_push_be32(mf, nw_frag, htonl(ntohs(arp->ar_op)));
653                 }
654
655                 /* Must be adjacent. */
656                 ASSERT_SEQUENTIAL(arp_sha, arp_tha);
657
658                 memcpy(arp_buf[0], arp->ar_sha, ETH_ADDR_LEN);
659                 memcpy(arp_buf[1], arp->ar_tha, ETH_ADDR_LEN);
660                 miniflow_push_macs(mf, arp_sha, arp_buf);
661                 miniflow_pad_to_64(mf, tcp_flags);
662             }
663         }
664         goto out;
665     }
666
667     packet->l4_ofs = (char *)data - l2;
668     miniflow_push_be32(mf, nw_frag,
669                        BYTES_TO_BE32(nw_frag, nw_tos, nw_ttl, nw_proto));
670
671     if (OVS_LIKELY(!(nw_frag & FLOW_NW_FRAG_LATER))) {
672         if (OVS_LIKELY(nw_proto == IPPROTO_TCP)) {
673             if (OVS_LIKELY(size >= TCP_HEADER_LEN)) {
674                 const struct tcp_header *tcp = data;
675
676                 miniflow_push_be32(mf, arp_tha[2], 0);
677                 miniflow_push_be32(mf, tcp_flags,
678                                    TCP_FLAGS_BE32(tcp->tcp_ctl));
679                 miniflow_push_be16(mf, tp_src, tcp->tcp_src);
680                 miniflow_push_be16(mf, tp_dst, tcp->tcp_dst);
681                 miniflow_pad_to_64(mf, igmp_group_ip4);
682             }
683         } else if (OVS_LIKELY(nw_proto == IPPROTO_UDP)) {
684             if (OVS_LIKELY(size >= UDP_HEADER_LEN)) {
685                 const struct udp_header *udp = data;
686
687                 miniflow_push_be16(mf, tp_src, udp->udp_src);
688                 miniflow_push_be16(mf, tp_dst, udp->udp_dst);
689                 miniflow_pad_to_64(mf, igmp_group_ip4);
690             }
691         } else if (OVS_LIKELY(nw_proto == IPPROTO_SCTP)) {
692             if (OVS_LIKELY(size >= SCTP_HEADER_LEN)) {
693                 const struct sctp_header *sctp = data;
694
695                 miniflow_push_be16(mf, tp_src, sctp->sctp_src);
696                 miniflow_push_be16(mf, tp_dst, sctp->sctp_dst);
697                 miniflow_pad_to_64(mf, igmp_group_ip4);
698             }
699         } else if (OVS_LIKELY(nw_proto == IPPROTO_ICMP)) {
700             if (OVS_LIKELY(size >= ICMP_HEADER_LEN)) {
701                 const struct icmp_header *icmp = data;
702
703                 miniflow_push_be16(mf, tp_src, htons(icmp->icmp_type));
704                 miniflow_push_be16(mf, tp_dst, htons(icmp->icmp_code));
705                 miniflow_pad_to_64(mf, igmp_group_ip4);
706             }
707         } else if (OVS_LIKELY(nw_proto == IPPROTO_IGMP)) {
708             if (OVS_LIKELY(size >= IGMP_HEADER_LEN)) {
709                 const struct igmp_header *igmp = data;
710
711                 miniflow_push_be16(mf, tp_src, htons(igmp->igmp_type));
712                 miniflow_push_be16(mf, tp_dst, htons(igmp->igmp_code));
713                 miniflow_push_be32(mf, igmp_group_ip4,
714                                    get_16aligned_be32(&igmp->group));
715             }
716         } else if (OVS_LIKELY(nw_proto == IPPROTO_ICMPV6)) {
717             if (OVS_LIKELY(size >= sizeof(struct icmp6_hdr))) {
718                 const struct in6_addr *nd_target = NULL;
719                 uint8_t arp_buf[2][ETH_ADDR_LEN];
720                 const struct icmp6_hdr *icmp = data_pull(&data, &size,
721                                                          sizeof *icmp);
722                 memset(arp_buf, 0, sizeof arp_buf);
723                 if (OVS_LIKELY(parse_icmpv6(&data, &size, icmp, &nd_target,
724                                             arp_buf))) {
725                     if (nd_target) {
726                         miniflow_push_words(mf, nd_target, nd_target,
727                                             sizeof *nd_target / 8);
728                     }
729                     miniflow_push_macs(mf, arp_sha, arp_buf);
730                     miniflow_pad_to_64(mf, tcp_flags);
731                     miniflow_push_be16(mf, tp_src, htons(icmp->icmp6_type));
732                     miniflow_push_be16(mf, tp_dst, htons(icmp->icmp6_code));
733                     miniflow_pad_to_64(mf, igmp_group_ip4);
734                 }
735             }
736         }
737     }
738  out:
739     dst->map = mf.map;
740 }
741
742 /* For every bit of a field that is wildcarded in 'wildcards', sets the
743  * corresponding bit in 'flow' to zero. */
744 void
745 flow_zero_wildcards(struct flow *flow, const struct flow_wildcards *wildcards)
746 {
747     uint64_t *flow_u64 = (uint64_t *) flow;
748     const uint64_t *wc_u64 = (const uint64_t *) &wildcards->masks;
749     size_t i;
750
751     for (i = 0; i < FLOW_U64S; i++) {
752         flow_u64[i] &= wc_u64[i];
753     }
754 }
755
756 void
757 flow_unwildcard_tp_ports(const struct flow *flow, struct flow_wildcards *wc)
758 {
759     if (flow->nw_proto != IPPROTO_ICMP) {
760         memset(&wc->masks.tp_src, 0xff, sizeof wc->masks.tp_src);
761         memset(&wc->masks.tp_dst, 0xff, sizeof wc->masks.tp_dst);
762     } else {
763         wc->masks.tp_src = htons(0xff);
764         wc->masks.tp_dst = htons(0xff);
765     }
766 }
767
768 /* Initializes 'flow_metadata' with the metadata found in 'flow'. */
769 void
770 flow_get_metadata(const struct flow *flow, struct match *flow_metadata)
771 {
772     int i;
773
774     BUILD_ASSERT_DECL(FLOW_WC_SEQ == 32);
775
776     match_init_catchall(flow_metadata);
777     if (flow->tunnel.tun_id != htonll(0)) {
778         match_set_tun_id(flow_metadata, flow->tunnel.tun_id);
779     }
780     if (flow->tunnel.ip_src != htonl(0)) {
781         match_set_tun_src(flow_metadata, flow->tunnel.ip_src);
782     }
783     if (flow->tunnel.ip_dst != htonl(0)) {
784         match_set_tun_dst(flow_metadata, flow->tunnel.ip_dst);
785     }
786     if (flow->tunnel.gbp_id != htons(0)) {
787         match_set_tun_gbp_id(flow_metadata, flow->tunnel.gbp_id);
788     }
789     if (flow->tunnel.gbp_flags) {
790         match_set_tun_gbp_flags(flow_metadata, flow->tunnel.gbp_flags);
791     }
792     tun_metadata_get_fmd(&flow->tunnel.metadata, flow_metadata);
793     if (flow->metadata != htonll(0)) {
794         match_set_metadata(flow_metadata, flow->metadata);
795     }
796
797     for (i = 0; i < FLOW_N_REGS; i++) {
798         if (flow->regs[i]) {
799             match_set_reg(flow_metadata, i, flow->regs[i]);
800         }
801     }
802
803     if (flow->pkt_mark != 0) {
804         match_set_pkt_mark(flow_metadata, flow->pkt_mark);
805     }
806
807     match_set_in_port(flow_metadata, flow->in_port.ofp_port);
808 }
809
810 char *
811 flow_to_string(const struct flow *flow)
812 {
813     struct ds ds = DS_EMPTY_INITIALIZER;
814     flow_format(&ds, flow);
815     return ds_cstr(&ds);
816 }
817
818 const char *
819 flow_tun_flag_to_string(uint32_t flags)
820 {
821     switch (flags) {
822     case FLOW_TNL_F_DONT_FRAGMENT:
823         return "df";
824     case FLOW_TNL_F_CSUM:
825         return "csum";
826     case FLOW_TNL_F_KEY:
827         return "key";
828     case FLOW_TNL_F_OAM:
829         return "oam";
830     default:
831         return NULL;
832     }
833 }
834
835 void
836 format_flags(struct ds *ds, const char *(*bit_to_string)(uint32_t),
837              uint32_t flags, char del)
838 {
839     uint32_t bad = 0;
840
841     if (!flags) {
842         return;
843     }
844     while (flags) {
845         uint32_t bit = rightmost_1bit(flags);
846         const char *s;
847
848         s = bit_to_string(bit);
849         if (s) {
850             ds_put_format(ds, "%s%c", s, del);
851         } else {
852             bad |= bit;
853         }
854
855         flags &= ~bit;
856     }
857
858     if (bad) {
859         ds_put_format(ds, "0x%"PRIx32"%c", bad, del);
860     }
861     ds_chomp(ds, del);
862 }
863
864 void
865 format_flags_masked(struct ds *ds, const char *name,
866                     const char *(*bit_to_string)(uint32_t), uint32_t flags,
867                     uint32_t mask)
868 {
869     if (name) {
870         ds_put_format(ds, "%s=", name);
871     }
872     while (mask) {
873         uint32_t bit = rightmost_1bit(mask);
874         const char *s = bit_to_string(bit);
875
876         ds_put_format(ds, "%s%s", (flags & bit) ? "+" : "-",
877                       s ? s : "[Unknown]");
878         mask &= ~bit;
879     }
880 }
881
882 void
883 flow_format(struct ds *ds, const struct flow *flow)
884 {
885     struct match match;
886     struct flow_wildcards *wc = &match.wc;
887
888     match_wc_init(&match, flow);
889
890     /* As this function is most often used for formatting a packet in a
891      * packet-in message, skip formatting the packet context fields that are
892      * all-zeroes to make the print-out easier on the eyes.  This means that a
893      * missing context field implies a zero value for that field.  This is
894      * similar to OpenFlow encoding of these fields, as the specification
895      * states that all-zeroes context fields should not be encoded in the
896      * packet-in messages. */
897     if (!flow->in_port.ofp_port) {
898         WC_UNMASK_FIELD(wc, in_port);
899     }
900     if (!flow->skb_priority) {
901         WC_UNMASK_FIELD(wc, skb_priority);
902     }
903     if (!flow->pkt_mark) {
904         WC_UNMASK_FIELD(wc, pkt_mark);
905     }
906     if (!flow->recirc_id) {
907         WC_UNMASK_FIELD(wc, recirc_id);
908     }
909     if (!flow->dp_hash) {
910         WC_UNMASK_FIELD(wc, dp_hash);
911     }
912     for (int i = 0; i < FLOW_N_REGS; i++) {
913         if (!flow->regs[i]) {
914             WC_UNMASK_FIELD(wc, regs[i]);
915         }
916     }
917     if (!flow->metadata) {
918         WC_UNMASK_FIELD(wc, metadata);
919     }
920
921     match_format(&match, ds, OFP_DEFAULT_PRIORITY);
922 }
923
924 void
925 flow_print(FILE *stream, const struct flow *flow)
926 {
927     char *s = flow_to_string(flow);
928     fputs(s, stream);
929     free(s);
930 }
931 \f
932 /* flow_wildcards functions. */
933
934 /* Initializes 'wc' as a set of wildcards that matches every packet. */
935 void
936 flow_wildcards_init_catchall(struct flow_wildcards *wc)
937 {
938     memset(&wc->masks, 0, sizeof wc->masks);
939 }
940
941 /* Converts a flow into flow wildcards.  It sets the wildcard masks based on
942  * the packet headers extracted to 'flow'.  It will not set the mask for fields
943  * that do not make sense for the packet type.  OpenFlow-only metadata is
944  * wildcarded, but other metadata is unconditionally exact-matched. */
945 void flow_wildcards_init_for_packet(struct flow_wildcards *wc,
946                                     const struct flow *flow)
947 {
948     memset(&wc->masks, 0x0, sizeof wc->masks);
949
950     /* Update this function whenever struct flow changes. */
951     BUILD_ASSERT_DECL(FLOW_WC_SEQ == 32);
952
953     if (flow->tunnel.ip_dst) {
954         if (flow->tunnel.flags & FLOW_TNL_F_KEY) {
955             WC_MASK_FIELD(wc, tunnel.tun_id);
956         }
957         WC_MASK_FIELD(wc, tunnel.ip_src);
958         WC_MASK_FIELD(wc, tunnel.ip_dst);
959         WC_MASK_FIELD(wc, tunnel.flags);
960         WC_MASK_FIELD(wc, tunnel.ip_tos);
961         WC_MASK_FIELD(wc, tunnel.ip_ttl);
962         WC_MASK_FIELD(wc, tunnel.tp_src);
963         WC_MASK_FIELD(wc, tunnel.tp_dst);
964         WC_MASK_FIELD(wc, tunnel.gbp_id);
965         WC_MASK_FIELD(wc, tunnel.gbp_flags);
966
967         if (flow->tunnel.metadata.opt_map) {
968             wc->masks.tunnel.metadata.opt_map = flow->tunnel.metadata.opt_map;
969             WC_MASK_FIELD(wc, tunnel.metadata.opts);
970         }
971     } else if (flow->tunnel.tun_id) {
972         WC_MASK_FIELD(wc, tunnel.tun_id);
973     }
974
975     /* metadata, regs, and conj_id wildcarded. */
976
977     WC_MASK_FIELD(wc, skb_priority);
978     WC_MASK_FIELD(wc, pkt_mark);
979     WC_MASK_FIELD(wc, recirc_id);
980     WC_MASK_FIELD(wc, dp_hash);
981     WC_MASK_FIELD(wc, in_port);
982
983     /* actset_output wildcarded. */
984
985     WC_MASK_FIELD(wc, dl_dst);
986     WC_MASK_FIELD(wc, dl_src);
987     WC_MASK_FIELD(wc, dl_type);
988     WC_MASK_FIELD(wc, vlan_tci);
989
990     if (flow->dl_type == htons(ETH_TYPE_IP)) {
991         WC_MASK_FIELD(wc, nw_src);
992         WC_MASK_FIELD(wc, nw_dst);
993     } else if (flow->dl_type == htons(ETH_TYPE_IPV6)) {
994         WC_MASK_FIELD(wc, ipv6_src);
995         WC_MASK_FIELD(wc, ipv6_dst);
996         WC_MASK_FIELD(wc, ipv6_label);
997     } else if (flow->dl_type == htons(ETH_TYPE_ARP) ||
998                flow->dl_type == htons(ETH_TYPE_RARP)) {
999         WC_MASK_FIELD(wc, nw_src);
1000         WC_MASK_FIELD(wc, nw_dst);
1001         WC_MASK_FIELD(wc, nw_proto);
1002         WC_MASK_FIELD(wc, arp_sha);
1003         WC_MASK_FIELD(wc, arp_tha);
1004         return;
1005     } else if (eth_type_mpls(flow->dl_type)) {
1006         for (int i = 0; i < FLOW_MAX_MPLS_LABELS; i++) {
1007             WC_MASK_FIELD(wc, mpls_lse[i]);
1008             if (flow->mpls_lse[i] & htonl(MPLS_BOS_MASK)) {
1009                 break;
1010             }
1011         }
1012         return;
1013     } else {
1014         return; /* Unknown ethertype. */
1015     }
1016
1017     /* IPv4 or IPv6. */
1018     WC_MASK_FIELD(wc, nw_frag);
1019     WC_MASK_FIELD(wc, nw_tos);
1020     WC_MASK_FIELD(wc, nw_ttl);
1021     WC_MASK_FIELD(wc, nw_proto);
1022
1023     /* No transport layer header in later fragments. */
1024     if (!(flow->nw_frag & FLOW_NW_FRAG_LATER) &&
1025         (flow->nw_proto == IPPROTO_ICMP ||
1026          flow->nw_proto == IPPROTO_ICMPV6 ||
1027          flow->nw_proto == IPPROTO_TCP ||
1028          flow->nw_proto == IPPROTO_UDP ||
1029          flow->nw_proto == IPPROTO_SCTP ||
1030          flow->nw_proto == IPPROTO_IGMP)) {
1031         WC_MASK_FIELD(wc, tp_src);
1032         WC_MASK_FIELD(wc, tp_dst);
1033
1034         if (flow->nw_proto == IPPROTO_TCP) {
1035             WC_MASK_FIELD(wc, tcp_flags);
1036         } else if (flow->nw_proto == IPPROTO_ICMPV6) {
1037             WC_MASK_FIELD(wc, arp_sha);
1038             WC_MASK_FIELD(wc, arp_tha);
1039             WC_MASK_FIELD(wc, nd_target);
1040         } else if (flow->nw_proto == IPPROTO_IGMP) {
1041             WC_MASK_FIELD(wc, igmp_group_ip4);
1042         }
1043     }
1044 }
1045
1046 /* Return a map of possible fields for a packet of the same type as 'flow'.
1047  * Including extra bits in the returned mask is not wrong, it is just less
1048  * optimal.
1049  *
1050  * This is a less precise version of flow_wildcards_init_for_packet() above. */
1051 uint64_t
1052 flow_wc_map(const struct flow *flow)
1053 {
1054     /* Update this function whenever struct flow changes. */
1055     BUILD_ASSERT_DECL(FLOW_WC_SEQ == 32);
1056
1057     uint64_t map = (flow->tunnel.ip_dst) ? MINIFLOW_MAP(tunnel) : 0;
1058
1059     /* Metadata fields that can appear on packet input. */
1060     map |= MINIFLOW_MAP(skb_priority) | MINIFLOW_MAP(pkt_mark)
1061         | MINIFLOW_MAP(recirc_id) | MINIFLOW_MAP(dp_hash)
1062         | MINIFLOW_MAP(in_port)
1063         | MINIFLOW_MAP(dl_dst) | MINIFLOW_MAP(dl_src)
1064         | MINIFLOW_MAP(dl_type) | MINIFLOW_MAP(vlan_tci);
1065
1066     /* Ethertype-dependent fields. */
1067     if (OVS_LIKELY(flow->dl_type == htons(ETH_TYPE_IP))) {
1068         map |= MINIFLOW_MAP(nw_src) | MINIFLOW_MAP(nw_dst)
1069             | MINIFLOW_MAP(nw_proto) | MINIFLOW_MAP(nw_frag)
1070             | MINIFLOW_MAP(nw_tos) | MINIFLOW_MAP(nw_ttl);
1071         if (OVS_UNLIKELY(flow->nw_proto == IPPROTO_IGMP)) {
1072             map |= MINIFLOW_MAP(igmp_group_ip4);
1073         } else {
1074             map |= MINIFLOW_MAP(tcp_flags)
1075                 | MINIFLOW_MAP(tp_src) | MINIFLOW_MAP(tp_dst);
1076         }
1077     } else if (flow->dl_type == htons(ETH_TYPE_IPV6)) {
1078         map |= MINIFLOW_MAP(ipv6_src) | MINIFLOW_MAP(ipv6_dst)
1079             | MINIFLOW_MAP(ipv6_label)
1080             | MINIFLOW_MAP(nw_proto) | MINIFLOW_MAP(nw_frag)
1081             | MINIFLOW_MAP(nw_tos) | MINIFLOW_MAP(nw_ttl);
1082         if (OVS_UNLIKELY(flow->nw_proto == IPPROTO_ICMPV6)) {
1083             map |= MINIFLOW_MAP(nd_target)
1084                 | MINIFLOW_MAP(arp_sha) | MINIFLOW_MAP(arp_tha);
1085         } else {
1086             map |= MINIFLOW_MAP(tcp_flags)
1087                 | MINIFLOW_MAP(tp_src) | MINIFLOW_MAP(tp_dst);
1088         }
1089     } else if (eth_type_mpls(flow->dl_type)) {
1090         map |= MINIFLOW_MAP(mpls_lse);
1091     } else if (flow->dl_type == htons(ETH_TYPE_ARP) ||
1092                flow->dl_type == htons(ETH_TYPE_RARP)) {
1093         map |= MINIFLOW_MAP(nw_src) | MINIFLOW_MAP(nw_dst)
1094             | MINIFLOW_MAP(nw_proto)
1095             | MINIFLOW_MAP(arp_sha) | MINIFLOW_MAP(arp_tha);
1096     }
1097
1098     return map;
1099 }
1100
1101 /* Clear the metadata and register wildcard masks. They are not packet
1102  * header fields. */
1103 void
1104 flow_wildcards_clear_non_packet_fields(struct flow_wildcards *wc)
1105 {
1106     /* Update this function whenever struct flow changes. */
1107     BUILD_ASSERT_DECL(FLOW_WC_SEQ == 32);
1108
1109     memset(&wc->masks.metadata, 0, sizeof wc->masks.metadata);
1110     memset(&wc->masks.regs, 0, sizeof wc->masks.regs);
1111     wc->masks.actset_output = 0;
1112     wc->masks.conj_id = 0;
1113 }
1114
1115 /* Returns true if 'wc' matches every packet, false if 'wc' fixes any bits or
1116  * fields. */
1117 bool
1118 flow_wildcards_is_catchall(const struct flow_wildcards *wc)
1119 {
1120     const uint64_t *wc_u64 = (const uint64_t *) &wc->masks;
1121     size_t i;
1122
1123     for (i = 0; i < FLOW_U64S; i++) {
1124         if (wc_u64[i]) {
1125             return false;
1126         }
1127     }
1128     return true;
1129 }
1130
1131 /* Sets 'dst' as the bitwise AND of wildcards in 'src1' and 'src2'.
1132  * That is, a bit or a field is wildcarded in 'dst' if it is wildcarded
1133  * in 'src1' or 'src2' or both.  */
1134 void
1135 flow_wildcards_and(struct flow_wildcards *dst,
1136                    const struct flow_wildcards *src1,
1137                    const struct flow_wildcards *src2)
1138 {
1139     uint64_t *dst_u64 = (uint64_t *) &dst->masks;
1140     const uint64_t *src1_u64 = (const uint64_t *) &src1->masks;
1141     const uint64_t *src2_u64 = (const uint64_t *) &src2->masks;
1142     size_t i;
1143
1144     for (i = 0; i < FLOW_U64S; i++) {
1145         dst_u64[i] = src1_u64[i] & src2_u64[i];
1146     }
1147 }
1148
1149 /* Sets 'dst' as the bitwise OR of wildcards in 'src1' and 'src2'.  That
1150  * is, a bit or a field is wildcarded in 'dst' if it is neither
1151  * wildcarded in 'src1' nor 'src2'. */
1152 void
1153 flow_wildcards_or(struct flow_wildcards *dst,
1154                   const struct flow_wildcards *src1,
1155                   const struct flow_wildcards *src2)
1156 {
1157     uint64_t *dst_u64 = (uint64_t *) &dst->masks;
1158     const uint64_t *src1_u64 = (const uint64_t *) &src1->masks;
1159     const uint64_t *src2_u64 = (const uint64_t *) &src2->masks;
1160     size_t i;
1161
1162     for (i = 0; i < FLOW_U64S; i++) {
1163         dst_u64[i] = src1_u64[i] | src2_u64[i];
1164     }
1165 }
1166
1167 /* Returns a hash of the wildcards in 'wc'. */
1168 uint32_t
1169 flow_wildcards_hash(const struct flow_wildcards *wc, uint32_t basis)
1170 {
1171     return flow_hash(&wc->masks, basis);
1172 }
1173
1174 /* Returns true if 'a' and 'b' represent the same wildcards, false if they are
1175  * different. */
1176 bool
1177 flow_wildcards_equal(const struct flow_wildcards *a,
1178                      const struct flow_wildcards *b)
1179 {
1180     return flow_equal(&a->masks, &b->masks);
1181 }
1182
1183 /* Returns true if at least one bit or field is wildcarded in 'a' but not in
1184  * 'b', false otherwise. */
1185 bool
1186 flow_wildcards_has_extra(const struct flow_wildcards *a,
1187                          const struct flow_wildcards *b)
1188 {
1189     const uint64_t *a_u64 = (const uint64_t *) &a->masks;
1190     const uint64_t *b_u64 = (const uint64_t *) &b->masks;
1191     size_t i;
1192
1193     for (i = 0; i < FLOW_U64S; i++) {
1194         if ((a_u64[i] & b_u64[i]) != b_u64[i]) {
1195             return true;
1196         }
1197     }
1198     return false;
1199 }
1200
1201 /* Returns true if 'a' and 'b' are equal, except that 0-bits (wildcarded bits)
1202  * in 'wc' do not need to be equal in 'a' and 'b'. */
1203 bool
1204 flow_equal_except(const struct flow *a, const struct flow *b,
1205                   const struct flow_wildcards *wc)
1206 {
1207     const uint64_t *a_u64 = (const uint64_t *) a;
1208     const uint64_t *b_u64 = (const uint64_t *) b;
1209     const uint64_t *wc_u64 = (const uint64_t *) &wc->masks;
1210     size_t i;
1211
1212     for (i = 0; i < FLOW_U64S; i++) {
1213         if ((a_u64[i] ^ b_u64[i]) & wc_u64[i]) {
1214             return false;
1215         }
1216     }
1217     return true;
1218 }
1219
1220 /* Sets the wildcard mask for register 'idx' in 'wc' to 'mask'.
1221  * (A 0-bit indicates a wildcard bit.) */
1222 void
1223 flow_wildcards_set_reg_mask(struct flow_wildcards *wc, int idx, uint32_t mask)
1224 {
1225     wc->masks.regs[idx] = mask;
1226 }
1227
1228 /* Sets the wildcard mask for register 'idx' in 'wc' to 'mask'.
1229  * (A 0-bit indicates a wildcard bit.) */
1230 void
1231 flow_wildcards_set_xreg_mask(struct flow_wildcards *wc, int idx, uint64_t mask)
1232 {
1233     flow_set_xreg(&wc->masks, idx, mask);
1234 }
1235
1236 /* Calculates the 5-tuple hash from the given miniflow.
1237  * This returns the same value as flow_hash_5tuple for the corresponding
1238  * flow. */
1239 uint32_t
1240 miniflow_hash_5tuple(const struct miniflow *flow, uint32_t basis)
1241 {
1242     uint32_t hash = basis;
1243
1244     if (flow) {
1245         ovs_be16 dl_type = MINIFLOW_GET_BE16(flow, dl_type);
1246
1247         hash = hash_add(hash, MINIFLOW_GET_U8(flow, nw_proto));
1248
1249         /* Separate loops for better optimization. */
1250         if (dl_type == htons(ETH_TYPE_IPV6)) {
1251             uint64_t map = MINIFLOW_MAP(ipv6_src) | MINIFLOW_MAP(ipv6_dst);
1252             uint64_t value;
1253
1254             MINIFLOW_FOR_EACH_IN_MAP(value, flow, map) {
1255                 hash = hash_add64(hash, value);
1256             }
1257         } else {
1258             hash = hash_add(hash, MINIFLOW_GET_U32(flow, nw_src));
1259             hash = hash_add(hash, MINIFLOW_GET_U32(flow, nw_dst));
1260         }
1261         /* Add both ports at once. */
1262         hash = hash_add(hash, MINIFLOW_GET_U32(flow, tp_src));
1263         hash = hash_finish(hash, 42); /* Arbitrary number. */
1264     }
1265     return hash;
1266 }
1267
1268 ASSERT_SEQUENTIAL_SAME_WORD(tp_src, tp_dst);
1269 ASSERT_SEQUENTIAL(ipv6_src, ipv6_dst);
1270
1271 /* Calculates the 5-tuple hash from the given flow. */
1272 uint32_t
1273 flow_hash_5tuple(const struct flow *flow, uint32_t basis)
1274 {
1275     uint32_t hash = basis;
1276
1277     if (flow) {
1278         hash = hash_add(hash, flow->nw_proto);
1279
1280         if (flow->dl_type == htons(ETH_TYPE_IPV6)) {
1281             const uint64_t *flow_u64 = (const uint64_t *)flow;
1282             int ofs = offsetof(struct flow, ipv6_src) / 8;
1283             int end = ofs + 2 * sizeof flow->ipv6_src / 8;
1284
1285             for (;ofs < end; ofs++) {
1286                 hash = hash_add64(hash, flow_u64[ofs]);
1287             }
1288         } else {
1289             hash = hash_add(hash, (OVS_FORCE uint32_t) flow->nw_src);
1290             hash = hash_add(hash, (OVS_FORCE uint32_t) flow->nw_dst);
1291         }
1292         /* Add both ports at once. */
1293         hash = hash_add(hash,
1294                         ((const uint32_t *)flow)[offsetof(struct flow, tp_src)
1295                                                  / sizeof(uint32_t)]);
1296         hash = hash_finish(hash, 42); /* Arbitrary number. */
1297     }
1298     return hash;
1299 }
1300
1301 /* Hashes 'flow' based on its L2 through L4 protocol information. */
1302 uint32_t
1303 flow_hash_symmetric_l4(const struct flow *flow, uint32_t basis)
1304 {
1305     struct {
1306         union {
1307             ovs_be32 ipv4_addr;
1308             struct in6_addr ipv6_addr;
1309         };
1310         ovs_be16 eth_type;
1311         ovs_be16 vlan_tci;
1312         ovs_be16 tp_port;
1313         uint8_t eth_addr[ETH_ADDR_LEN];
1314         uint8_t ip_proto;
1315     } fields;
1316
1317     int i;
1318
1319     memset(&fields, 0, sizeof fields);
1320     for (i = 0; i < ETH_ADDR_LEN; i++) {
1321         fields.eth_addr[i] = flow->dl_src[i] ^ flow->dl_dst[i];
1322     }
1323     fields.vlan_tci = flow->vlan_tci & htons(VLAN_VID_MASK);
1324     fields.eth_type = flow->dl_type;
1325
1326     /* UDP source and destination port are not taken into account because they
1327      * will not necessarily be symmetric in a bidirectional flow. */
1328     if (fields.eth_type == htons(ETH_TYPE_IP)) {
1329         fields.ipv4_addr = flow->nw_src ^ flow->nw_dst;
1330         fields.ip_proto = flow->nw_proto;
1331         if (fields.ip_proto == IPPROTO_TCP || fields.ip_proto == IPPROTO_SCTP) {
1332             fields.tp_port = flow->tp_src ^ flow->tp_dst;
1333         }
1334     } else if (fields.eth_type == htons(ETH_TYPE_IPV6)) {
1335         const uint8_t *a = &flow->ipv6_src.s6_addr[0];
1336         const uint8_t *b = &flow->ipv6_dst.s6_addr[0];
1337         uint8_t *ipv6_addr = &fields.ipv6_addr.s6_addr[0];
1338
1339         for (i=0; i<16; i++) {
1340             ipv6_addr[i] = a[i] ^ b[i];
1341         }
1342         fields.ip_proto = flow->nw_proto;
1343         if (fields.ip_proto == IPPROTO_TCP || fields.ip_proto == IPPROTO_SCTP) {
1344             fields.tp_port = flow->tp_src ^ flow->tp_dst;
1345         }
1346     }
1347     return jhash_bytes(&fields, sizeof fields, basis);
1348 }
1349
1350 /* Hashes 'flow' based on its L3 through L4 protocol information */
1351 uint32_t
1352 flow_hash_symmetric_l3l4(const struct flow *flow, uint32_t basis,
1353                          bool inc_udp_ports)
1354 {
1355     uint32_t hash = basis;
1356
1357     /* UDP source and destination port are also taken into account. */
1358     if (flow->dl_type == htons(ETH_TYPE_IP)) {
1359         hash = hash_add(hash,
1360                         (OVS_FORCE uint32_t) (flow->nw_src ^ flow->nw_dst));
1361     } else if (flow->dl_type == htons(ETH_TYPE_IPV6)) {
1362         /* IPv6 addresses are 64-bit aligned inside struct flow. */
1363         const uint64_t *a = ALIGNED_CAST(uint64_t *, flow->ipv6_src.s6_addr);
1364         const uint64_t *b = ALIGNED_CAST(uint64_t *, flow->ipv6_dst.s6_addr);
1365
1366         for (int i = 0; i < 4; i++) {
1367             hash = hash_add64(hash, a[i] ^ b[i]);
1368         }
1369     } else {
1370         /* Cannot hash non-IP flows */
1371         return 0;
1372     }
1373
1374     hash = hash_add(hash, flow->nw_proto);
1375     if (flow->nw_proto == IPPROTO_TCP || flow->nw_proto == IPPROTO_SCTP ||
1376          (inc_udp_ports && flow->nw_proto == IPPROTO_UDP)) {
1377         hash = hash_add(hash,
1378                         (OVS_FORCE uint16_t) (flow->tp_src ^ flow->tp_dst));
1379     }
1380
1381     return hash_finish(hash, basis);
1382 }
1383
1384 /* Initialize a flow with random fields that matter for nx_hash_fields. */
1385 void
1386 flow_random_hash_fields(struct flow *flow)
1387 {
1388     uint16_t rnd = random_uint16();
1389
1390     /* Initialize to all zeros. */
1391     memset(flow, 0, sizeof *flow);
1392
1393     eth_addr_random(flow->dl_src);
1394     eth_addr_random(flow->dl_dst);
1395
1396     flow->vlan_tci = (OVS_FORCE ovs_be16) (random_uint16() & VLAN_VID_MASK);
1397
1398     /* Make most of the random flows IPv4, some IPv6, and rest random. */
1399     flow->dl_type = rnd < 0x8000 ? htons(ETH_TYPE_IP) :
1400         rnd < 0xc000 ? htons(ETH_TYPE_IPV6) : (OVS_FORCE ovs_be16)rnd;
1401
1402     if (dl_type_is_ip_any(flow->dl_type)) {
1403         if (flow->dl_type == htons(ETH_TYPE_IP)) {
1404             flow->nw_src = (OVS_FORCE ovs_be32)random_uint32();
1405             flow->nw_dst = (OVS_FORCE ovs_be32)random_uint32();
1406         } else {
1407             random_bytes(&flow->ipv6_src, sizeof flow->ipv6_src);
1408             random_bytes(&flow->ipv6_dst, sizeof flow->ipv6_dst);
1409         }
1410         /* Make most of IP flows TCP, some UDP or SCTP, and rest random. */
1411         rnd = random_uint16();
1412         flow->nw_proto = rnd < 0x8000 ? IPPROTO_TCP :
1413             rnd < 0xc000 ? IPPROTO_UDP :
1414             rnd < 0xd000 ? IPPROTO_SCTP : (uint8_t)rnd;
1415         if (flow->nw_proto == IPPROTO_TCP ||
1416             flow->nw_proto == IPPROTO_UDP ||
1417             flow->nw_proto == IPPROTO_SCTP) {
1418             flow->tp_src = (OVS_FORCE ovs_be16)random_uint16();
1419             flow->tp_dst = (OVS_FORCE ovs_be16)random_uint16();
1420         }
1421     }
1422 }
1423
1424 /* Masks the fields in 'wc' that are used by the flow hash 'fields'. */
1425 void
1426 flow_mask_hash_fields(const struct flow *flow, struct flow_wildcards *wc,
1427                       enum nx_hash_fields fields)
1428 {
1429     switch (fields) {
1430     case NX_HASH_FIELDS_ETH_SRC:
1431         memset(&wc->masks.dl_src, 0xff, sizeof wc->masks.dl_src);
1432         break;
1433
1434     case NX_HASH_FIELDS_SYMMETRIC_L4:
1435         memset(&wc->masks.dl_src, 0xff, sizeof wc->masks.dl_src);
1436         memset(&wc->masks.dl_dst, 0xff, sizeof wc->masks.dl_dst);
1437         if (flow->dl_type == htons(ETH_TYPE_IP)) {
1438             memset(&wc->masks.nw_src, 0xff, sizeof wc->masks.nw_src);
1439             memset(&wc->masks.nw_dst, 0xff, sizeof wc->masks.nw_dst);
1440         } else if (flow->dl_type == htons(ETH_TYPE_IPV6)) {
1441             memset(&wc->masks.ipv6_src, 0xff, sizeof wc->masks.ipv6_src);
1442             memset(&wc->masks.ipv6_dst, 0xff, sizeof wc->masks.ipv6_dst);
1443         }
1444         if (is_ip_any(flow)) {
1445             memset(&wc->masks.nw_proto, 0xff, sizeof wc->masks.nw_proto);
1446             flow_unwildcard_tp_ports(flow, wc);
1447         }
1448         wc->masks.vlan_tci |= htons(VLAN_VID_MASK | VLAN_CFI);
1449         break;
1450
1451     case NX_HASH_FIELDS_SYMMETRIC_L3L4_UDP:
1452         if (is_ip_any(flow) && flow->nw_proto == IPPROTO_UDP) {
1453             memset(&wc->masks.tp_src, 0xff, sizeof wc->masks.tp_src);
1454             memset(&wc->masks.tp_dst, 0xff, sizeof wc->masks.tp_dst);
1455         }
1456         /* no break */
1457     case NX_HASH_FIELDS_SYMMETRIC_L3L4:
1458         if (flow->dl_type == htons(ETH_TYPE_IP)) {
1459             memset(&wc->masks.nw_src, 0xff, sizeof wc->masks.nw_src);
1460             memset(&wc->masks.nw_dst, 0xff, sizeof wc->masks.nw_dst);
1461         } else if (flow->dl_type == htons(ETH_TYPE_IPV6)) {
1462             memset(&wc->masks.ipv6_src, 0xff, sizeof wc->masks.ipv6_src);
1463             memset(&wc->masks.ipv6_dst, 0xff, sizeof wc->masks.ipv6_dst);
1464         } else {
1465             break; /* non-IP flow */
1466         }
1467
1468         memset(&wc->masks.nw_proto, 0xff, sizeof wc->masks.nw_proto);
1469         if (flow->nw_proto == IPPROTO_TCP || flow->nw_proto == IPPROTO_SCTP) {
1470             memset(&wc->masks.tp_src, 0xff, sizeof wc->masks.tp_src);
1471             memset(&wc->masks.tp_dst, 0xff, sizeof wc->masks.tp_dst);
1472         }
1473         break;
1474
1475     default:
1476         OVS_NOT_REACHED();
1477     }
1478 }
1479
1480 /* Hashes the portions of 'flow' designated by 'fields'. */
1481 uint32_t
1482 flow_hash_fields(const struct flow *flow, enum nx_hash_fields fields,
1483                  uint16_t basis)
1484 {
1485     switch (fields) {
1486
1487     case NX_HASH_FIELDS_ETH_SRC:
1488         return jhash_bytes(flow->dl_src, sizeof flow->dl_src, basis);
1489
1490     case NX_HASH_FIELDS_SYMMETRIC_L4:
1491         return flow_hash_symmetric_l4(flow, basis);
1492
1493     case NX_HASH_FIELDS_SYMMETRIC_L3L4:
1494         return flow_hash_symmetric_l3l4(flow, basis, false);
1495
1496     case NX_HASH_FIELDS_SYMMETRIC_L3L4_UDP:
1497         return flow_hash_symmetric_l3l4(flow, basis, true);
1498
1499     }
1500
1501     OVS_NOT_REACHED();
1502 }
1503
1504 /* Returns a string representation of 'fields'. */
1505 const char *
1506 flow_hash_fields_to_str(enum nx_hash_fields fields)
1507 {
1508     switch (fields) {
1509     case NX_HASH_FIELDS_ETH_SRC: return "eth_src";
1510     case NX_HASH_FIELDS_SYMMETRIC_L4: return "symmetric_l4";
1511     case NX_HASH_FIELDS_SYMMETRIC_L3L4: return "symmetric_l3l4";
1512     case NX_HASH_FIELDS_SYMMETRIC_L3L4_UDP: return "symmetric_l3l4+udp";
1513     default: return "<unknown>";
1514     }
1515 }
1516
1517 /* Returns true if the value of 'fields' is supported. Otherwise false. */
1518 bool
1519 flow_hash_fields_valid(enum nx_hash_fields fields)
1520 {
1521     return fields == NX_HASH_FIELDS_ETH_SRC
1522         || fields == NX_HASH_FIELDS_SYMMETRIC_L4
1523         || fields == NX_HASH_FIELDS_SYMMETRIC_L3L4
1524         || fields == NX_HASH_FIELDS_SYMMETRIC_L3L4_UDP;
1525 }
1526
1527 /* Returns a hash value for the bits of 'flow' that are active based on
1528  * 'wc', given 'basis'. */
1529 uint32_t
1530 flow_hash_in_wildcards(const struct flow *flow,
1531                        const struct flow_wildcards *wc, uint32_t basis)
1532 {
1533     const uint64_t *wc_u64 = (const uint64_t *) &wc->masks;
1534     const uint64_t *flow_u64 = (const uint64_t *) flow;
1535     uint32_t hash;
1536     size_t i;
1537
1538     hash = basis;
1539     for (i = 0; i < FLOW_U64S; i++) {
1540         hash = hash_add64(hash, flow_u64[i] & wc_u64[i]);
1541     }
1542     return hash_finish(hash, 8 * FLOW_U64S);
1543 }
1544
1545 /* Sets the VLAN VID that 'flow' matches to 'vid', which is interpreted as an
1546  * OpenFlow 1.0 "dl_vlan" value:
1547  *
1548  *      - If it is in the range 0...4095, 'flow->vlan_tci' is set to match
1549  *        that VLAN.  Any existing PCP match is unchanged (it becomes 0 if
1550  *        'flow' previously matched packets without a VLAN header).
1551  *
1552  *      - If it is OFP_VLAN_NONE, 'flow->vlan_tci' is set to match a packet
1553  *        without a VLAN tag.
1554  *
1555  *      - Other values of 'vid' should not be used. */
1556 void
1557 flow_set_dl_vlan(struct flow *flow, ovs_be16 vid)
1558 {
1559     if (vid == htons(OFP10_VLAN_NONE)) {
1560         flow->vlan_tci = htons(0);
1561     } else {
1562         vid &= htons(VLAN_VID_MASK);
1563         flow->vlan_tci &= ~htons(VLAN_VID_MASK);
1564         flow->vlan_tci |= htons(VLAN_CFI) | vid;
1565     }
1566 }
1567
1568 /* Sets the VLAN VID that 'flow' matches to 'vid', which is interpreted as an
1569  * OpenFlow 1.2 "vlan_vid" value, that is, the low 13 bits of 'vlan_tci' (VID
1570  * plus CFI). */
1571 void
1572 flow_set_vlan_vid(struct flow *flow, ovs_be16 vid)
1573 {
1574     ovs_be16 mask = htons(VLAN_VID_MASK | VLAN_CFI);
1575     flow->vlan_tci &= ~mask;
1576     flow->vlan_tci |= vid & mask;
1577 }
1578
1579 /* Sets the VLAN PCP that 'flow' matches to 'pcp', which should be in the
1580  * range 0...7.
1581  *
1582  * This function has no effect on the VLAN ID that 'flow' matches.
1583  *
1584  * After calling this function, 'flow' will not match packets without a VLAN
1585  * header. */
1586 void
1587 flow_set_vlan_pcp(struct flow *flow, uint8_t pcp)
1588 {
1589     pcp &= 0x07;
1590     flow->vlan_tci &= ~htons(VLAN_PCP_MASK);
1591     flow->vlan_tci |= htons((pcp << VLAN_PCP_SHIFT) | VLAN_CFI);
1592 }
1593
1594 /* Returns the number of MPLS LSEs present in 'flow'
1595  *
1596  * Returns 0 if the 'dl_type' of 'flow' is not an MPLS ethernet type.
1597  * Otherwise traverses 'flow''s MPLS label stack stopping at the
1598  * first entry that has the BoS bit set. If no such entry exists then
1599  * the maximum number of LSEs that can be stored in 'flow' is returned.
1600  */
1601 int
1602 flow_count_mpls_labels(const struct flow *flow, struct flow_wildcards *wc)
1603 {
1604     /* dl_type is always masked. */
1605     if (eth_type_mpls(flow->dl_type)) {
1606         int i;
1607         int cnt;
1608
1609         cnt = 0;
1610         for (i = 0; i < FLOW_MAX_MPLS_LABELS; i++) {
1611             if (wc) {
1612                 wc->masks.mpls_lse[i] |= htonl(MPLS_BOS_MASK);
1613             }
1614             if (flow->mpls_lse[i] & htonl(MPLS_BOS_MASK)) {
1615                 return i + 1;
1616             }
1617             if (flow->mpls_lse[i]) {
1618                 cnt++;
1619             }
1620         }
1621         return cnt;
1622     } else {
1623         return 0;
1624     }
1625 }
1626
1627 /* Returns the number consecutive of MPLS LSEs, starting at the
1628  * innermost LSE, that are common in 'a' and 'b'.
1629  *
1630  * 'an' must be flow_count_mpls_labels(a).
1631  * 'bn' must be flow_count_mpls_labels(b).
1632  */
1633 int
1634 flow_count_common_mpls_labels(const struct flow *a, int an,
1635                               const struct flow *b, int bn,
1636                               struct flow_wildcards *wc)
1637 {
1638     int min_n = MIN(an, bn);
1639     if (min_n == 0) {
1640         return 0;
1641     } else {
1642         int common_n = 0;
1643         int a_last = an - 1;
1644         int b_last = bn - 1;
1645         int i;
1646
1647         for (i = 0; i < min_n; i++) {
1648             if (wc) {
1649                 wc->masks.mpls_lse[a_last - i] = OVS_BE32_MAX;
1650                 wc->masks.mpls_lse[b_last - i] = OVS_BE32_MAX;
1651             }
1652             if (a->mpls_lse[a_last - i] != b->mpls_lse[b_last - i]) {
1653                 break;
1654             } else {
1655                 common_n++;
1656             }
1657         }
1658
1659         return common_n;
1660     }
1661 }
1662
1663 /* Adds a new outermost MPLS label to 'flow' and changes 'flow''s Ethernet type
1664  * to 'mpls_eth_type', which must be an MPLS Ethertype.
1665  *
1666  * If the new label is the first MPLS label in 'flow', it is generated as;
1667  *
1668  *     - label: 2, if 'flow' is IPv6, otherwise 0.
1669  *
1670  *     - TTL: IPv4 or IPv6 TTL, if present and nonzero, otherwise 64.
1671  *
1672  *     - TC: IPv4 or IPv6 TOS, if present, otherwise 0.
1673  *
1674  *     - BoS: 1.
1675  *
1676  * If the new label is the second or later label MPLS label in 'flow', it is
1677  * generated as;
1678  *
1679  *     - label: Copied from outer label.
1680  *
1681  *     - TTL: Copied from outer label.
1682  *
1683  *     - TC: Copied from outer label.
1684  *
1685  *     - BoS: 0.
1686  *
1687  * 'n' must be flow_count_mpls_labels(flow).  'n' must be less than
1688  * FLOW_MAX_MPLS_LABELS (because otherwise flow->mpls_lse[] would overflow).
1689  */
1690 void
1691 flow_push_mpls(struct flow *flow, int n, ovs_be16 mpls_eth_type,
1692                struct flow_wildcards *wc)
1693 {
1694     ovs_assert(eth_type_mpls(mpls_eth_type));
1695     ovs_assert(n < FLOW_MAX_MPLS_LABELS);
1696
1697     if (n) {
1698         int i;
1699
1700         if (wc) {
1701             memset(&wc->masks.mpls_lse, 0xff, sizeof *wc->masks.mpls_lse * n);
1702         }
1703         for (i = n; i >= 1; i--) {
1704             flow->mpls_lse[i] = flow->mpls_lse[i - 1];
1705         }
1706         flow->mpls_lse[0] = (flow->mpls_lse[1] & htonl(~MPLS_BOS_MASK));
1707     } else {
1708         int label = 0;          /* IPv4 Explicit Null. */
1709         int tc = 0;
1710         int ttl = 64;
1711
1712         if (flow->dl_type == htons(ETH_TYPE_IPV6)) {
1713             label = 2;
1714         }
1715
1716         if (is_ip_any(flow)) {
1717             tc = (flow->nw_tos & IP_DSCP_MASK) >> 2;
1718             if (wc) {
1719                 wc->masks.nw_tos |= IP_DSCP_MASK;
1720                 wc->masks.nw_ttl = 0xff;
1721             }
1722
1723             if (flow->nw_ttl) {
1724                 ttl = flow->nw_ttl;
1725             }
1726         }
1727
1728         flow->mpls_lse[0] = set_mpls_lse_values(ttl, tc, 1, htonl(label));
1729
1730         /* Clear all L3 and L4 fields and dp_hash. */
1731         BUILD_ASSERT(FLOW_WC_SEQ == 32);
1732         memset((char *) flow + FLOW_SEGMENT_2_ENDS_AT, 0,
1733                sizeof(struct flow) - FLOW_SEGMENT_2_ENDS_AT);
1734         flow->dp_hash = 0;
1735     }
1736     flow->dl_type = mpls_eth_type;
1737 }
1738
1739 /* Tries to remove the outermost MPLS label from 'flow'.  Returns true if
1740  * successful, false otherwise.  On success, sets 'flow''s Ethernet type to
1741  * 'eth_type'.
1742  *
1743  * 'n' must be flow_count_mpls_labels(flow). */
1744 bool
1745 flow_pop_mpls(struct flow *flow, int n, ovs_be16 eth_type,
1746               struct flow_wildcards *wc)
1747 {
1748     int i;
1749
1750     if (n == 0) {
1751         /* Nothing to pop. */
1752         return false;
1753     } else if (n == FLOW_MAX_MPLS_LABELS) {
1754         if (wc) {
1755             wc->masks.mpls_lse[n - 1] |= htonl(MPLS_BOS_MASK);
1756         }
1757         if (!(flow->mpls_lse[n - 1] & htonl(MPLS_BOS_MASK))) {
1758             /* Can't pop because don't know what to fill in mpls_lse[n - 1]. */
1759             return false;
1760         }
1761     }
1762
1763     if (wc) {
1764         memset(&wc->masks.mpls_lse[1], 0xff,
1765                sizeof *wc->masks.mpls_lse * (n - 1));
1766     }
1767     for (i = 1; i < n; i++) {
1768         flow->mpls_lse[i - 1] = flow->mpls_lse[i];
1769     }
1770     flow->mpls_lse[n - 1] = 0;
1771     flow->dl_type = eth_type;
1772     return true;
1773 }
1774
1775 /* Sets the MPLS Label that 'flow' matches to 'label', which is interpreted
1776  * as an OpenFlow 1.1 "mpls_label" value. */
1777 void
1778 flow_set_mpls_label(struct flow *flow, int idx, ovs_be32 label)
1779 {
1780     set_mpls_lse_label(&flow->mpls_lse[idx], label);
1781 }
1782
1783 /* Sets the MPLS TTL that 'flow' matches to 'ttl', which should be in the
1784  * range 0...255. */
1785 void
1786 flow_set_mpls_ttl(struct flow *flow, int idx, uint8_t ttl)
1787 {
1788     set_mpls_lse_ttl(&flow->mpls_lse[idx], ttl);
1789 }
1790
1791 /* Sets the MPLS TC that 'flow' matches to 'tc', which should be in the
1792  * range 0...7. */
1793 void
1794 flow_set_mpls_tc(struct flow *flow, int idx, uint8_t tc)
1795 {
1796     set_mpls_lse_tc(&flow->mpls_lse[idx], tc);
1797 }
1798
1799 /* Sets the MPLS BOS bit that 'flow' matches to which should be 0 or 1. */
1800 void
1801 flow_set_mpls_bos(struct flow *flow, int idx, uint8_t bos)
1802 {
1803     set_mpls_lse_bos(&flow->mpls_lse[idx], bos);
1804 }
1805
1806 /* Sets the entire MPLS LSE. */
1807 void
1808 flow_set_mpls_lse(struct flow *flow, int idx, ovs_be32 lse)
1809 {
1810     flow->mpls_lse[idx] = lse;
1811 }
1812
1813 static size_t
1814 flow_compose_l4(struct dp_packet *p, const struct flow *flow)
1815 {
1816     size_t l4_len = 0;
1817
1818     if (!(flow->nw_frag & FLOW_NW_FRAG_ANY)
1819         || !(flow->nw_frag & FLOW_NW_FRAG_LATER)) {
1820         if (flow->nw_proto == IPPROTO_TCP) {
1821             struct tcp_header *tcp;
1822
1823             l4_len = sizeof *tcp;
1824             tcp = dp_packet_put_zeros(p, l4_len);
1825             tcp->tcp_src = flow->tp_src;
1826             tcp->tcp_dst = flow->tp_dst;
1827             tcp->tcp_ctl = TCP_CTL(ntohs(flow->tcp_flags), 5);
1828         } else if (flow->nw_proto == IPPROTO_UDP) {
1829             struct udp_header *udp;
1830
1831             l4_len = sizeof *udp;
1832             udp = dp_packet_put_zeros(p, l4_len);
1833             udp->udp_src = flow->tp_src;
1834             udp->udp_dst = flow->tp_dst;
1835         } else if (flow->nw_proto == IPPROTO_SCTP) {
1836             struct sctp_header *sctp;
1837
1838             l4_len = sizeof *sctp;
1839             sctp = dp_packet_put_zeros(p, l4_len);
1840             sctp->sctp_src = flow->tp_src;
1841             sctp->sctp_dst = flow->tp_dst;
1842         } else if (flow->nw_proto == IPPROTO_ICMP) {
1843             struct icmp_header *icmp;
1844
1845             l4_len = sizeof *icmp;
1846             icmp = dp_packet_put_zeros(p, l4_len);
1847             icmp->icmp_type = ntohs(flow->tp_src);
1848             icmp->icmp_code = ntohs(flow->tp_dst);
1849             icmp->icmp_csum = csum(icmp, ICMP_HEADER_LEN);
1850         } else if (flow->nw_proto == IPPROTO_IGMP) {
1851             struct igmp_header *igmp;
1852
1853             l4_len = sizeof *igmp;
1854             igmp = dp_packet_put_zeros(p, l4_len);
1855             igmp->igmp_type = ntohs(flow->tp_src);
1856             igmp->igmp_code = ntohs(flow->tp_dst);
1857             put_16aligned_be32(&igmp->group, flow->igmp_group_ip4);
1858             igmp->igmp_csum = csum(igmp, IGMP_HEADER_LEN);
1859         } else if (flow->nw_proto == IPPROTO_ICMPV6) {
1860             struct icmp6_hdr *icmp;
1861
1862             l4_len = sizeof *icmp;
1863             icmp = dp_packet_put_zeros(p, l4_len);
1864             icmp->icmp6_type = ntohs(flow->tp_src);
1865             icmp->icmp6_code = ntohs(flow->tp_dst);
1866
1867             if (icmp->icmp6_code == 0 &&
1868                 (icmp->icmp6_type == ND_NEIGHBOR_SOLICIT ||
1869                  icmp->icmp6_type == ND_NEIGHBOR_ADVERT)) {
1870                 struct in6_addr *nd_target;
1871                 struct nd_opt_hdr *nd_opt;
1872
1873                 l4_len += sizeof *nd_target;
1874                 nd_target = dp_packet_put_zeros(p, sizeof *nd_target);
1875                 *nd_target = flow->nd_target;
1876
1877                 if (!eth_addr_is_zero(flow->arp_sha)) {
1878                     l4_len += 8;
1879                     nd_opt = dp_packet_put_zeros(p, 8);
1880                     nd_opt->nd_opt_len = 1;
1881                     nd_opt->nd_opt_type = ND_OPT_SOURCE_LINKADDR;
1882                     memcpy(nd_opt + 1, flow->arp_sha, ETH_ADDR_LEN);
1883                 }
1884                 if (!eth_addr_is_zero(flow->arp_tha)) {
1885                     l4_len += 8;
1886                     nd_opt = dp_packet_put_zeros(p, 8);
1887                     nd_opt->nd_opt_len = 1;
1888                     nd_opt->nd_opt_type = ND_OPT_TARGET_LINKADDR;
1889                     memcpy(nd_opt + 1, flow->arp_tha, ETH_ADDR_LEN);
1890                 }
1891             }
1892             icmp->icmp6_cksum = (OVS_FORCE uint16_t)
1893                 csum(icmp, (char *)dp_packet_tail(p) - (char *)icmp);
1894         }
1895     }
1896     return l4_len;
1897 }
1898
1899 /* Puts into 'b' a packet that flow_extract() would parse as having the given
1900  * 'flow'.
1901  *
1902  * (This is useful only for testing, obviously, and the packet isn't really
1903  * valid. It hasn't got some checksums filled in, for one, and lots of fields
1904  * are just zeroed.) */
1905 void
1906 flow_compose(struct dp_packet *p, const struct flow *flow)
1907 {
1908     size_t l4_len;
1909
1910     /* eth_compose() sets l3 pointer and makes sure it is 32-bit aligned. */
1911     eth_compose(p, flow->dl_dst, flow->dl_src, ntohs(flow->dl_type), 0);
1912     if (flow->dl_type == htons(FLOW_DL_TYPE_NONE)) {
1913         struct eth_header *eth = dp_packet_l2(p);
1914         eth->eth_type = htons(dp_packet_size(p));
1915         return;
1916     }
1917
1918     if (flow->vlan_tci & htons(VLAN_CFI)) {
1919         eth_push_vlan(p, htons(ETH_TYPE_VLAN), flow->vlan_tci);
1920     }
1921
1922     if (flow->dl_type == htons(ETH_TYPE_IP)) {
1923         struct ip_header *ip;
1924
1925         ip = dp_packet_put_zeros(p, sizeof *ip);
1926         ip->ip_ihl_ver = IP_IHL_VER(5, 4);
1927         ip->ip_tos = flow->nw_tos;
1928         ip->ip_ttl = flow->nw_ttl;
1929         ip->ip_proto = flow->nw_proto;
1930         put_16aligned_be32(&ip->ip_src, flow->nw_src);
1931         put_16aligned_be32(&ip->ip_dst, flow->nw_dst);
1932
1933         if (flow->nw_frag & FLOW_NW_FRAG_ANY) {
1934             ip->ip_frag_off |= htons(IP_MORE_FRAGMENTS);
1935             if (flow->nw_frag & FLOW_NW_FRAG_LATER) {
1936                 ip->ip_frag_off |= htons(100);
1937             }
1938         }
1939
1940         dp_packet_set_l4(p, dp_packet_tail(p));
1941
1942         l4_len = flow_compose_l4(p, flow);
1943
1944         ip = dp_packet_l3(p);
1945         ip->ip_tot_len = htons(p->l4_ofs - p->l3_ofs + l4_len);
1946         ip->ip_csum = csum(ip, sizeof *ip);
1947     } else if (flow->dl_type == htons(ETH_TYPE_IPV6)) {
1948         struct ovs_16aligned_ip6_hdr *nh;
1949
1950         nh = dp_packet_put_zeros(p, sizeof *nh);
1951         put_16aligned_be32(&nh->ip6_flow, htonl(6 << 28) |
1952                            htonl(flow->nw_tos << 20) | flow->ipv6_label);
1953         nh->ip6_hlim = flow->nw_ttl;
1954         nh->ip6_nxt = flow->nw_proto;
1955
1956         memcpy(&nh->ip6_src, &flow->ipv6_src, sizeof(nh->ip6_src));
1957         memcpy(&nh->ip6_dst, &flow->ipv6_dst, sizeof(nh->ip6_dst));
1958
1959         dp_packet_set_l4(p, dp_packet_tail(p));
1960
1961         l4_len = flow_compose_l4(p, flow);
1962
1963         nh = dp_packet_l3(p);
1964         nh->ip6_plen = htons(l4_len);
1965     } else if (flow->dl_type == htons(ETH_TYPE_ARP) ||
1966                flow->dl_type == htons(ETH_TYPE_RARP)) {
1967         struct arp_eth_header *arp;
1968
1969         arp = dp_packet_put_zeros(p, sizeof *arp);
1970         dp_packet_set_l3(p, arp);
1971         arp->ar_hrd = htons(1);
1972         arp->ar_pro = htons(ETH_TYPE_IP);
1973         arp->ar_hln = ETH_ADDR_LEN;
1974         arp->ar_pln = 4;
1975         arp->ar_op = htons(flow->nw_proto);
1976
1977         if (flow->nw_proto == ARP_OP_REQUEST ||
1978             flow->nw_proto == ARP_OP_REPLY) {
1979             put_16aligned_be32(&arp->ar_spa, flow->nw_src);
1980             put_16aligned_be32(&arp->ar_tpa, flow->nw_dst);
1981             memcpy(arp->ar_sha, flow->arp_sha, ETH_ADDR_LEN);
1982             memcpy(arp->ar_tha, flow->arp_tha, ETH_ADDR_LEN);
1983         }
1984     }
1985
1986     if (eth_type_mpls(flow->dl_type)) {
1987         int n;
1988
1989         p->l2_5_ofs = p->l3_ofs;
1990         for (n = 1; n < FLOW_MAX_MPLS_LABELS; n++) {
1991             if (flow->mpls_lse[n - 1] & htonl(MPLS_BOS_MASK)) {
1992                 break;
1993             }
1994         }
1995         while (n > 0) {
1996             push_mpls(p, flow->dl_type, flow->mpls_lse[--n]);
1997         }
1998     }
1999 }
2000 \f
2001 /* Compressed flow. */
2002
2003 static int
2004 miniflow_n_values(const struct miniflow *flow)
2005 {
2006     return count_1bits(flow->map);
2007 }
2008
2009 static uint64_t *
2010 miniflow_alloc_values(struct miniflow *flow, int n)
2011 {
2012     int size = MINIFLOW_VALUES_SIZE(n);
2013
2014     if (size <= sizeof flow->inline_values) {
2015         flow->values_inline = true;
2016         return flow->inline_values;
2017     } else {
2018         COVERAGE_INC(miniflow_malloc);
2019         flow->values_inline = false;
2020         flow->offline_values = xmalloc(size);
2021         return flow->offline_values;
2022     }
2023 }
2024
2025 /* Completes an initialization of 'dst' as a miniflow copy of 'src' begun by
2026  * the caller.  The caller must have already initialized 'dst->map' properly
2027  * to indicate the significant uint64_t elements of 'src'.  'n' must be the
2028  * number of 1-bits in 'dst->map'.
2029  *
2030  * Normally the significant elements are the ones that are non-zero.  However,
2031  * when a miniflow is initialized from a (mini)mask, the values can be zeroes,
2032  * so that the flow and mask always have the same maps.
2033  *
2034  * This function initializes values (either inline if possible or with
2035  * malloc() otherwise) and copies the uint64_t elements of 'src' indicated by
2036  * 'dst->map' into it. */
2037 static void
2038 miniflow_init__(struct miniflow *dst, const struct flow *src, int n)
2039 {
2040     const uint64_t *src_u64 = (const uint64_t *) src;
2041     uint64_t *dst_u64 = miniflow_alloc_values(dst, n);
2042     int idx;
2043
2044     MAP_FOR_EACH_INDEX(idx, dst->map) {
2045         *dst_u64++ = src_u64[idx];
2046     }
2047 }
2048
2049 /* Initializes 'dst' as a copy of 'src'.  The caller must eventually free 'dst'
2050  * with miniflow_destroy().
2051  * Always allocates offline storage. */
2052 void
2053 miniflow_init(struct miniflow *dst, const struct flow *src)
2054 {
2055     const uint64_t *src_u64 = (const uint64_t *) src;
2056     unsigned int i;
2057     int n;
2058
2059     /* Initialize dst->map, counting the number of nonzero elements. */
2060     n = 0;
2061     dst->map = 0;
2062
2063     for (i = 0; i < FLOW_U64S; i++) {
2064         if (src_u64[i]) {
2065             dst->map |= UINT64_C(1) << i;
2066             n++;
2067         }
2068     }
2069
2070     miniflow_init__(dst, src, n);
2071 }
2072
2073 /* Initializes 'dst' as a copy of 'src', using 'mask->map' as 'dst''s map.  The
2074  * caller must eventually free 'dst' with miniflow_destroy(). */
2075 void
2076 miniflow_init_with_minimask(struct miniflow *dst, const struct flow *src,
2077                             const struct minimask *mask)
2078 {
2079     dst->map = mask->masks.map;
2080     miniflow_init__(dst, src, miniflow_n_values(dst));
2081 }
2082
2083 /* Initializes 'dst' as a copy of 'src'.  The caller must eventually free 'dst'
2084  * with miniflow_destroy(). */
2085 void
2086 miniflow_clone(struct miniflow *dst, const struct miniflow *src)
2087 {
2088     int size = MINIFLOW_VALUES_SIZE(miniflow_n_values(src));
2089     uint64_t *values;
2090
2091     dst->map = src->map;
2092     if (size <= sizeof dst->inline_values) {
2093         dst->values_inline = true;
2094         values = dst->inline_values;
2095     } else {
2096         dst->values_inline = false;
2097         COVERAGE_INC(miniflow_malloc);
2098         dst->offline_values = xmalloc(size);
2099         values = dst->offline_values;
2100     }
2101     memcpy(values, miniflow_get_values(src), size);
2102 }
2103
2104 /* Initializes 'dst' as a copy of 'src'.  The caller must have allocated
2105  * 'dst' to have inline space all data in 'src'. */
2106 void
2107 miniflow_clone_inline(struct miniflow *dst, const struct miniflow *src,
2108                       size_t n_values)
2109 {
2110     dst->values_inline = true;
2111     dst->map = src->map;
2112     memcpy(dst->inline_values, miniflow_get_values(src),
2113            MINIFLOW_VALUES_SIZE(n_values));
2114 }
2115
2116 /* Initializes 'dst' with the data in 'src', destroying 'src'.
2117  * The caller must eventually free 'dst' with miniflow_destroy().
2118  * 'dst' must be regularly sized miniflow, but 'src' can have
2119  * storage for more than the default MINI_N_INLINE inline
2120  * values. */
2121 void
2122 miniflow_move(struct miniflow *dst, struct miniflow *src)
2123 {
2124     int size = MINIFLOW_VALUES_SIZE(miniflow_n_values(src));
2125
2126     dst->map = src->map;
2127     if (size <= sizeof dst->inline_values) {
2128         dst->values_inline = true;
2129         memcpy(dst->inline_values, miniflow_get_values(src), size);
2130         miniflow_destroy(src);
2131     } else if (src->values_inline) {
2132         dst->values_inline = false;
2133         COVERAGE_INC(miniflow_malloc);
2134         dst->offline_values = xmalloc(size);
2135         memcpy(dst->offline_values, src->inline_values, size);
2136     } else {
2137         dst->values_inline = false;
2138         dst->offline_values = src->offline_values;
2139     }
2140 }
2141
2142 /* Frees any memory owned by 'flow'.  Does not free the storage in which 'flow'
2143  * itself resides; the caller is responsible for that. */
2144 void
2145 miniflow_destroy(struct miniflow *flow)
2146 {
2147     if (!flow->values_inline) {
2148         free(flow->offline_values);
2149     }
2150 }
2151
2152 /* Initializes 'dst' as a copy of 'src'. */
2153 void
2154 miniflow_expand(const struct miniflow *src, struct flow *dst)
2155 {
2156     memset(dst, 0, sizeof *dst);
2157     flow_union_with_miniflow(dst, src);
2158 }
2159
2160 /* Returns true if 'a' and 'b' are the equal miniflow, false otherwise. */
2161 bool
2162 miniflow_equal(const struct miniflow *a, const struct miniflow *b)
2163 {
2164     const uint64_t *ap = miniflow_get_values(a);
2165     const uint64_t *bp = miniflow_get_values(b);
2166
2167     if (OVS_LIKELY(a->map == b->map)) {
2168         int count = miniflow_n_values(a);
2169
2170         return !memcmp(ap, bp, count * sizeof *ap);
2171     } else {
2172         uint64_t map;
2173
2174         for (map = a->map | b->map; map; map = zero_rightmost_1bit(map)) {
2175             uint64_t bit = rightmost_1bit(map);
2176
2177             if ((a->map & bit ? *ap++ : 0) != (b->map & bit ? *bp++ : 0)) {
2178                 return false;
2179             }
2180         }
2181     }
2182
2183     return true;
2184 }
2185
2186 /* Returns false if 'a' and 'b' differ at the places where there are 1-bits
2187  * in 'mask', true otherwise. */
2188 bool
2189 miniflow_equal_in_minimask(const struct miniflow *a, const struct miniflow *b,
2190                            const struct minimask *mask)
2191 {
2192     const uint64_t *p = miniflow_get_values(&mask->masks);
2193     int idx;
2194
2195     MAP_FOR_EACH_INDEX(idx, mask->masks.map) {
2196         if ((miniflow_get(a, idx) ^ miniflow_get(b, idx)) & *p++) {
2197             return false;
2198         }
2199     }
2200
2201     return true;
2202 }
2203
2204 /* Returns true if 'a' and 'b' are equal at the places where there are 1-bits
2205  * in 'mask', false if they differ. */
2206 bool
2207 miniflow_equal_flow_in_minimask(const struct miniflow *a, const struct flow *b,
2208                                 const struct minimask *mask)
2209 {
2210     const uint64_t *b_u64 = (const uint64_t *) b;
2211     const uint64_t *p = miniflow_get_values(&mask->masks);
2212     int idx;
2213
2214     MAP_FOR_EACH_INDEX(idx, mask->masks.map) {
2215         if ((miniflow_get(a, idx) ^ b_u64[idx]) & *p++) {
2216             return false;
2217         }
2218     }
2219
2220     return true;
2221 }
2222
2223 \f
2224 /* Initializes 'dst' as a copy of 'src'.  The caller must eventually free 'dst'
2225  * with minimask_destroy(). */
2226 void
2227 minimask_init(struct minimask *mask, const struct flow_wildcards *wc)
2228 {
2229     miniflow_init(&mask->masks, &wc->masks);
2230 }
2231
2232 /* Initializes 'dst' as a copy of 'src'.  The caller must eventually free 'dst'
2233  * with minimask_destroy(). */
2234 void
2235 minimask_clone(struct minimask *dst, const struct minimask *src)
2236 {
2237     miniflow_clone(&dst->masks, &src->masks);
2238 }
2239
2240 /* Initializes 'dst' with the data in 'src', destroying 'src'.
2241  * The caller must eventually free 'dst' with minimask_destroy(). */
2242 void
2243 minimask_move(struct minimask *dst, struct minimask *src)
2244 {
2245     miniflow_move(&dst->masks, &src->masks);
2246 }
2247
2248 /* Initializes 'dst_' as the bit-wise "and" of 'a_' and 'b_'.
2249  *
2250  * The caller must provide room for FLOW_U64S "uint64_t"s in 'storage', for use
2251  * by 'dst_'.  The caller must *not* free 'dst_' with minimask_destroy(). */
2252 void
2253 minimask_combine(struct minimask *dst_,
2254                  const struct minimask *a_, const struct minimask *b_,
2255                  uint64_t storage[FLOW_U64S])
2256 {
2257     struct miniflow *dst = &dst_->masks;
2258     uint64_t *dst_values = storage;
2259     const struct miniflow *a = &a_->masks;
2260     const struct miniflow *b = &b_->masks;
2261     int idx;
2262
2263     dst->values_inline = false;
2264     dst->offline_values = storage;
2265
2266     dst->map = 0;
2267     MAP_FOR_EACH_INDEX(idx, a->map & b->map) {
2268         /* Both 'a' and 'b' have non-zero data at 'idx'. */
2269         uint64_t mask = miniflow_get__(a, idx) & miniflow_get__(b, idx);
2270
2271         if (mask) {
2272             dst->map |= UINT64_C(1) << idx;
2273             *dst_values++ = mask;
2274         }
2275     }
2276 }
2277
2278 /* Frees any memory owned by 'mask'.  Does not free the storage in which 'mask'
2279  * itself resides; the caller is responsible for that. */
2280 void
2281 minimask_destroy(struct minimask *mask)
2282 {
2283     miniflow_destroy(&mask->masks);
2284 }
2285
2286 /* Initializes 'dst' as a copy of 'src'. */
2287 void
2288 minimask_expand(const struct minimask *mask, struct flow_wildcards *wc)
2289 {
2290     miniflow_expand(&mask->masks, &wc->masks);
2291 }
2292
2293 /* Returns true if 'a' and 'b' are the same flow mask, false otherwise.
2294  * Minimasks may not have zero data values, so for the minimasks to be the
2295  * same, they need to have the same map and the same data values. */
2296 bool
2297 minimask_equal(const struct minimask *a, const struct minimask *b)
2298 {
2299     return a->masks.map == b->masks.map &&
2300         !memcmp(miniflow_get_values(&a->masks),
2301                 miniflow_get_values(&b->masks),
2302                 count_1bits(a->masks.map) * sizeof *a->masks.inline_values);
2303 }
2304
2305 /* Returns true if at least one bit matched by 'b' is wildcarded by 'a',
2306  * false otherwise. */
2307 bool
2308 minimask_has_extra(const struct minimask *a, const struct minimask *b)
2309 {
2310     const uint64_t *ap = miniflow_get_values(&a->masks);
2311     const uint64_t *bp = miniflow_get_values(&b->masks);
2312     int idx;
2313
2314     MAP_FOR_EACH_INDEX(idx, b->masks.map) {
2315         uint64_t b_u64 = *bp++;
2316
2317         /* 'b_u64' is non-zero, check if the data in 'a' is either zero
2318          * or misses some of the bits in 'b_u64'. */
2319         if (!(a->masks.map & (UINT64_C(1) << idx))
2320             || ((miniflow_values_get__(ap, a->masks.map, idx) & b_u64)
2321                 != b_u64)) {
2322             return true; /* 'a' wildcards some bits 'b' doesn't. */
2323         }
2324     }
2325
2326     return false;
2327 }