packets: Use RARPs for learning packets.
[cascardo/ovs.git] / lib / packets.h
1 /*
2  * Copyright (c) 2008, 2009, 2010, 2011, 2012 Nicira, Inc.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at:
7  *
8  *     http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #ifndef PACKETS_H
18 #define PACKETS_H 1
19
20 #include <inttypes.h>
21 #include <sys/types.h>
22 #include <netinet/in.h>
23 #include <stdint.h>
24 #include <string.h>
25 #include "compiler.h"
26 #include "openvswitch/types.h"
27 #include "random.h"
28 #include "util.h"
29
30 struct ofpbuf;
31 struct ds;
32 struct flow;
33
34 bool dpid_from_string(const char *s, uint64_t *dpidp);
35
36 #define ETH_ADDR_LEN           6
37
38 static const uint8_t eth_addr_broadcast[ETH_ADDR_LEN] OVS_UNUSED
39     = { 0xff, 0xff, 0xff, 0xff, 0xff, 0xff };
40
41 static const uint8_t eth_addr_stp[ETH_ADDR_LEN] OVS_UNUSED
42     = { 0x01, 0x80, 0xC2, 0x00, 0x00, 0x00 };
43
44 static const uint8_t eth_addr_lacp[ETH_ADDR_LEN] OVS_UNUSED
45     = { 0x01, 0x80, 0xC2, 0x00, 0x00, 0x02 };
46
47 static inline bool eth_addr_is_broadcast(const uint8_t ea[6])
48 {
49     return (ea[0] & ea[1] & ea[2] & ea[3] & ea[4] & ea[5]) == 0xff;
50 }
51
52 static inline bool eth_addr_is_multicast(const uint8_t ea[6])
53 {
54     return ea[0] & 1;
55 }
56 static inline bool eth_addr_is_local(const uint8_t ea[6])
57 {
58     /* Local if it is either a locally administered address or a Nicira random
59      * address. */
60     return ea[0] & 2
61        || (ea[0] == 0x00 && ea[1] == 0x23 && ea[2] == 0x20 && ea[3] & 0x80);
62 }
63 static inline bool eth_addr_is_zero(const uint8_t ea[6])
64 {
65     return !(ea[0] | ea[1] | ea[2] | ea[3] | ea[4] | ea[5]);
66 }
67
68 static inline int eth_mask_is_exact(const uint8_t ea[ETH_ADDR_LEN])
69 {
70     return (ea[0] & ea[1] & ea[2] & ea[3] & ea[4] & ea[5]) == 0xff;
71 }
72
73 static inline int eth_addr_compare_3way(const uint8_t a[ETH_ADDR_LEN],
74                                         const uint8_t b[ETH_ADDR_LEN])
75 {
76     return memcmp(a, b, ETH_ADDR_LEN);
77 }
78 static inline bool eth_addr_equals(const uint8_t a[ETH_ADDR_LEN],
79                                    const uint8_t b[ETH_ADDR_LEN])
80 {
81     return !eth_addr_compare_3way(a, b);
82 }
83 static inline bool eth_addr_equal_except(const uint8_t a[ETH_ADDR_LEN],
84                                     const uint8_t b[ETH_ADDR_LEN],
85                                     const uint8_t mask[ETH_ADDR_LEN])
86 {
87     return !(((a[0] ^ b[0]) & mask[0])
88              || ((a[1] ^ b[1]) & mask[1])
89              || ((a[2] ^ b[2]) & mask[2])
90              || ((a[3] ^ b[3]) & mask[3])
91              || ((a[4] ^ b[4]) & mask[4])
92              || ((a[5] ^ b[5]) & mask[5]));
93 }
94 static inline uint64_t eth_addr_to_uint64(const uint8_t ea[ETH_ADDR_LEN])
95 {
96     return (((uint64_t) ea[0] << 40)
97             | ((uint64_t) ea[1] << 32)
98             | ((uint64_t) ea[2] << 24)
99             | ((uint64_t) ea[3] << 16)
100             | ((uint64_t) ea[4] << 8)
101             | ea[5]);
102 }
103 static inline void eth_addr_from_uint64(uint64_t x, uint8_t ea[ETH_ADDR_LEN])
104 {
105     ea[0] = x >> 40;
106     ea[1] = x >> 32;
107     ea[2] = x >> 24;
108     ea[3] = x >> 16;
109     ea[4] = x >> 8;
110     ea[5] = x;
111 }
112 static inline void eth_addr_mark_random(uint8_t ea[ETH_ADDR_LEN])
113 {
114     ea[0] &= ~1;                /* Unicast. */
115     ea[0] |= 2;                 /* Private. */
116 }
117 static inline void eth_addr_random(uint8_t ea[ETH_ADDR_LEN])
118 {
119     random_bytes(ea, ETH_ADDR_LEN);
120     eth_addr_mark_random(ea);
121 }
122 static inline void eth_addr_nicira_random(uint8_t ea[ETH_ADDR_LEN])
123 {
124     eth_addr_random(ea);
125
126     /* Set the OUI to the Nicira one. */
127     ea[0] = 0x00;
128     ea[1] = 0x23;
129     ea[2] = 0x20;
130
131     /* Set the top bit to indicate random Nicira address. */
132     ea[3] |= 0x80;
133 }
134
135 bool eth_addr_is_reserved(const uint8_t ea[ETH_ADDR_LEN]);
136 bool eth_addr_from_string(const char *, uint8_t ea[ETH_ADDR_LEN]);
137
138 void compose_benign_packet(struct ofpbuf *,
139                            const uint8_t eth_src[ETH_ADDR_LEN]);
140
141 void eth_push_vlan(struct ofpbuf *, ovs_be16 tci);
142 void eth_pop_vlan(struct ofpbuf *);
143
144 const char *eth_from_hex(const char *hex, struct ofpbuf **packetp);
145 void eth_format_masked(const uint8_t eth[ETH_ADDR_LEN],
146                        const uint8_t mask[ETH_ADDR_LEN], struct ds *s);
147 void eth_addr_bitand(const uint8_t src[ETH_ADDR_LEN],
148                      const uint8_t mask[ETH_ADDR_LEN],
149                      uint8_t dst[ETH_ADDR_LEN]);
150
151 /* Example:
152  *
153  * uint8_t mac[ETH_ADDR_LEN];
154  *    [...]
155  * printf("The Ethernet address is "ETH_ADDR_FMT"\n", ETH_ADDR_ARGS(mac));
156  *
157  */
158 #define ETH_ADDR_FMT                                                    \
159     "%02"PRIx8":%02"PRIx8":%02"PRIx8":%02"PRIx8":%02"PRIx8":%02"PRIx8
160 #define ETH_ADDR_ARGS(ea)                                   \
161     (ea)[0], (ea)[1], (ea)[2], (ea)[3], (ea)[4], (ea)[5]
162
163 /* Example:
164  *
165  * char *string = "1 00:11:22:33:44:55 2";
166  * uint8_t mac[ETH_ADDR_LEN];
167  * int a, b;
168  *
169  * if (sscanf(string, "%d"ETH_ADDR_SCAN_FMT"%d",
170  *     &a, ETH_ADDR_SCAN_ARGS(mac), &b) == 1 + ETH_ADDR_SCAN_COUNT + 1) {
171  *     ...
172  * }
173  */
174 #define ETH_ADDR_SCAN_FMT "%"SCNx8":%"SCNx8":%"SCNx8":%"SCNx8":%"SCNx8":%"SCNx8
175 #define ETH_ADDR_SCAN_ARGS(ea) \
176         &(ea)[0], &(ea)[1], &(ea)[2], &(ea)[3], &(ea)[4], &(ea)[5]
177 #define ETH_ADDR_SCAN_COUNT 6
178
179 #define ETH_TYPE_IP            0x0800
180 #define ETH_TYPE_ARP           0x0806
181 #define ETH_TYPE_VLAN          0x8100
182 #define ETH_TYPE_IPV6          0x86dd
183 #define ETH_TYPE_LACP          0x8809
184 #define ETH_TYPE_RARP          0x8035
185
186 /* Minimum value for an Ethernet type.  Values below this are IEEE 802.2 frame
187  * lengths. */
188 #define ETH_TYPE_MIN           0x600
189
190 #define ETH_HEADER_LEN 14
191 #define ETH_PAYLOAD_MIN 46
192 #define ETH_PAYLOAD_MAX 1500
193 #define ETH_TOTAL_MIN (ETH_HEADER_LEN + ETH_PAYLOAD_MIN)
194 #define ETH_TOTAL_MAX (ETH_HEADER_LEN + ETH_PAYLOAD_MAX)
195 #define ETH_VLAN_TOTAL_MAX (ETH_HEADER_LEN + VLAN_HEADER_LEN + ETH_PAYLOAD_MAX)
196 struct eth_header {
197     uint8_t eth_dst[ETH_ADDR_LEN];
198     uint8_t eth_src[ETH_ADDR_LEN];
199     ovs_be16 eth_type;
200 } __attribute__((packed));
201 BUILD_ASSERT_DECL(ETH_HEADER_LEN == sizeof(struct eth_header));
202
203 #define LLC_DSAP_SNAP 0xaa
204 #define LLC_SSAP_SNAP 0xaa
205 #define LLC_CNTL_SNAP 3
206
207 #define LLC_HEADER_LEN 3
208 struct llc_header {
209     uint8_t llc_dsap;
210     uint8_t llc_ssap;
211     uint8_t llc_cntl;
212 } __attribute__((packed));
213 BUILD_ASSERT_DECL(LLC_HEADER_LEN == sizeof(struct llc_header));
214
215 #define SNAP_ORG_ETHERNET "\0\0" /* The compiler adds a null byte, so
216                                     sizeof(SNAP_ORG_ETHERNET) == 3. */
217 #define SNAP_HEADER_LEN 5
218 struct snap_header {
219     uint8_t snap_org[3];
220     ovs_be16 snap_type;
221 } __attribute__((packed));
222 BUILD_ASSERT_DECL(SNAP_HEADER_LEN == sizeof(struct snap_header));
223
224 #define LLC_SNAP_HEADER_LEN (LLC_HEADER_LEN + SNAP_HEADER_LEN)
225 struct llc_snap_header {
226     struct llc_header llc;
227     struct snap_header snap;
228 } __attribute__((packed));
229 BUILD_ASSERT_DECL(LLC_SNAP_HEADER_LEN == sizeof(struct llc_snap_header));
230
231 #define ARP_HTYPE_ETH 0x0001
232 #define RARP_REQUEST_REVERSE 0x0003
233
234 #define RARP_HEADER_LEN 28
235 /* RARP header only for Ethernet-IP. */
236 struct rarp_header {
237     ovs_be16 hw_addr_space;        /* ARP_HTYPE_ETH. */
238     ovs_be16 proto_addr_space;     /* ETH_TYPE_IP. */
239     uint8_t hw_addr_length;        /* ETH_ADDR_LEN. */
240     uint8_t proto_addr_length;     /* IPV4_ADDR_LEN. */
241     ovs_be16 opcode;               /* RARP_REQUEST_REVERSE. */
242     uint8_t src_hw_addr[ETH_ADDR_LEN];
243     ovs_be32 src_proto_addr;
244     uint8_t target_hw_addr[ETH_ADDR_LEN];
245     ovs_be32 target_proto_addr;
246 } __attribute__((packed));
247 BUILD_ASSERT_DECL(RARP_HEADER_LEN == sizeof(struct rarp_header));
248
249
250 #define VLAN_VID_MASK 0x0fff
251 #define VLAN_VID_SHIFT 0
252
253 #define VLAN_PCP_MASK 0xe000
254 #define VLAN_PCP_SHIFT 13
255
256 #define VLAN_CFI 0x1000
257
258 /* Given the vlan_tci field from an 802.1Q header, in network byte order,
259  * returns the VLAN ID in host byte order. */
260 static inline uint16_t
261 vlan_tci_to_vid(ovs_be16 vlan_tci)
262 {
263     return (ntohs(vlan_tci) & VLAN_VID_MASK) >> VLAN_VID_SHIFT;
264 }
265
266 /* Given the vlan_tci field from an 802.1Q header, in network byte order,
267  * returns the priority code point (PCP) in host byte order. */
268 static inline int
269 vlan_tci_to_pcp(ovs_be16 vlan_tci)
270 {
271     return (ntohs(vlan_tci) & VLAN_PCP_MASK) >> VLAN_PCP_SHIFT;
272 }
273
274 #define VLAN_HEADER_LEN 4
275 struct vlan_header {
276     ovs_be16 vlan_tci;          /* Lowest 12 bits are VLAN ID. */
277     ovs_be16 vlan_next_type;
278 };
279 BUILD_ASSERT_DECL(VLAN_HEADER_LEN == sizeof(struct vlan_header));
280
281 #define VLAN_ETH_HEADER_LEN (ETH_HEADER_LEN + VLAN_HEADER_LEN)
282 struct vlan_eth_header {
283     uint8_t veth_dst[ETH_ADDR_LEN];
284     uint8_t veth_src[ETH_ADDR_LEN];
285     ovs_be16 veth_type;         /* Always htons(ETH_TYPE_VLAN). */
286     ovs_be16 veth_tci;          /* Lowest 12 bits are VLAN ID. */
287     ovs_be16 veth_next_type;
288 } __attribute__((packed));
289 BUILD_ASSERT_DECL(VLAN_ETH_HEADER_LEN == sizeof(struct vlan_eth_header));
290
291 /* The "(void) (ip)[0]" below has no effect on the value, since it's the first
292  * argument of a comma expression, but it makes sure that 'ip' is a pointer.
293  * This is useful since a common mistake is to pass an integer instead of a
294  * pointer to IP_ARGS. */
295 #define IP_FMT "%"PRIu8".%"PRIu8".%"PRIu8".%"PRIu8
296 #define IP_ARGS(ip)                             \
297         ((void) (ip)[0], ((uint8_t *) ip)[0]),  \
298         ((uint8_t *) ip)[1],                    \
299         ((uint8_t *) ip)[2],                    \
300         ((uint8_t *) ip)[3]
301
302 /* Example:
303  *
304  * char *string = "1 33.44.55.66 2";
305  * ovs_be32 ip;
306  * int a, b;
307  *
308  * if (sscanf(string, "%d"IP_SCAN_FMT"%d",
309  *     &a, IP_SCAN_ARGS(&ip), &b) == 1 + IP_SCAN_COUNT + 1) {
310  *     ...
311  * }
312  */
313 #define IP_SCAN_FMT "%"SCNu8".%"SCNu8".%"SCNu8".%"SCNu8
314 #define IP_SCAN_ARGS(ip)                                    \
315         ((void) (ovs_be32) *(ip), &((uint8_t *) ip)[0]),    \
316         &((uint8_t *) ip)[1],                               \
317         &((uint8_t *) ip)[2],                               \
318         &((uint8_t *) ip)[3]
319 #define IP_SCAN_COUNT 4
320
321 /* Returns true if 'netmask' is a CIDR netmask, that is, if it consists of N
322  * high-order 1-bits and 32-N low-order 0-bits. */
323 static inline bool
324 ip_is_cidr(ovs_be32 netmask)
325 {
326     uint32_t x = ~ntohl(netmask);
327     return !(x & (x + 1));
328 }
329 static inline bool
330 ip_is_multicast(ovs_be32 ip)
331 {
332     return (ip & htonl(0xf0000000)) == htonl(0xe0000000);
333 }
334 int ip_count_cidr_bits(ovs_be32 netmask);
335 void ip_format_masked(ovs_be32 ip, ovs_be32 mask, struct ds *);
336
337 #define IP_VER(ip_ihl_ver) ((ip_ihl_ver) >> 4)
338 #define IP_IHL(ip_ihl_ver) ((ip_ihl_ver) & 15)
339 #define IP_IHL_VER(ihl, ver) (((ver) << 4) | (ihl))
340
341 /* TOS fields. */
342 #define IP_ECN_MASK 0x03
343 #define IP_DSCP_MASK 0xfc
344
345 #define IP_VERSION 4
346
347 #define IP_DONT_FRAGMENT  0x4000 /* Don't fragment. */
348 #define IP_MORE_FRAGMENTS 0x2000 /* More fragments. */
349 #define IP_FRAG_OFF_MASK  0x1fff /* Fragment offset. */
350 #define IP_IS_FRAGMENT(ip_frag_off) \
351         ((ip_frag_off) & htons(IP_MORE_FRAGMENTS | IP_FRAG_OFF_MASK))
352
353 #define IP_HEADER_LEN 20
354 struct ip_header {
355     uint8_t ip_ihl_ver;
356     uint8_t ip_tos;
357     ovs_be16 ip_tot_len;
358     ovs_be16 ip_id;
359     ovs_be16 ip_frag_off;
360     uint8_t ip_ttl;
361     uint8_t ip_proto;
362     ovs_be16 ip_csum;
363     ovs_be32 ip_src;
364     ovs_be32 ip_dst;
365 };
366 BUILD_ASSERT_DECL(IP_HEADER_LEN == sizeof(struct ip_header));
367
368 #define ICMP_HEADER_LEN 8
369 struct icmp_header {
370     uint8_t icmp_type;
371     uint8_t icmp_code;
372     ovs_be16 icmp_csum;
373     union {
374         struct {
375             ovs_be16 id;
376             ovs_be16 seq;
377         } echo;
378         struct {
379             ovs_be16 empty;
380             ovs_be16 mtu;
381         } frag;
382         ovs_be32 gateway;
383     } icmp_fields;
384     uint8_t icmp_data[0];
385 };
386 BUILD_ASSERT_DECL(ICMP_HEADER_LEN == sizeof(struct icmp_header));
387
388 #define UDP_HEADER_LEN 8
389 struct udp_header {
390     ovs_be16 udp_src;
391     ovs_be16 udp_dst;
392     ovs_be16 udp_len;
393     ovs_be16 udp_csum;
394 };
395 BUILD_ASSERT_DECL(UDP_HEADER_LEN == sizeof(struct udp_header));
396
397 #define TCP_FIN 0x01
398 #define TCP_SYN 0x02
399 #define TCP_RST 0x04
400 #define TCP_PSH 0x08
401 #define TCP_ACK 0x10
402 #define TCP_URG 0x20
403
404 #define TCP_CTL(flags, offset) (htons((flags) | ((offset) << 12)))
405 #define TCP_FLAGS(tcp_ctl) (ntohs(tcp_ctl) & 0x003f)
406 #define TCP_OFFSET(tcp_ctl) (ntohs(tcp_ctl) >> 12)
407
408 #define TCP_HEADER_LEN 20
409 struct tcp_header {
410     ovs_be16 tcp_src;
411     ovs_be16 tcp_dst;
412     ovs_be32 tcp_seq;
413     ovs_be32 tcp_ack;
414     ovs_be16 tcp_ctl;
415     ovs_be16 tcp_winsz;
416     ovs_be16 tcp_csum;
417     ovs_be16 tcp_urg;
418 };
419 BUILD_ASSERT_DECL(TCP_HEADER_LEN == sizeof(struct tcp_header));
420
421 #define ARP_HRD_ETHERNET 1
422 #define ARP_PRO_IP 0x0800
423 #define ARP_OP_REQUEST 1
424 #define ARP_OP_REPLY 2
425
426 #define ARP_ETH_HEADER_LEN 28
427 struct arp_eth_header {
428     /* Generic members. */
429     ovs_be16 ar_hrd;           /* Hardware type. */
430     ovs_be16 ar_pro;           /* Protocol type. */
431     uint8_t ar_hln;            /* Hardware address length. */
432     uint8_t ar_pln;            /* Protocol address length. */
433     ovs_be16 ar_op;            /* Opcode. */
434
435     /* Ethernet+IPv4 specific members. */
436     uint8_t ar_sha[ETH_ADDR_LEN]; /* Sender hardware address. */
437     ovs_be32 ar_spa;           /* Sender protocol address. */
438     uint8_t ar_tha[ETH_ADDR_LEN]; /* Target hardware address. */
439     ovs_be32 ar_tpa;           /* Target protocol address. */
440 } __attribute__((packed));
441 BUILD_ASSERT_DECL(ARP_ETH_HEADER_LEN == sizeof(struct arp_eth_header));
442
443 /* The IPv6 flow label is in the lower 20 bits of the first 32-bit word. */
444 #define IPV6_LABEL_MASK 0x000fffff
445
446 /* Example:
447  *
448  * char *string = "1 ::1 2";
449  * char ipv6_s[IPV6_SCAN_LEN + 1];
450  * struct in6_addr ipv6;
451  *
452  * if (sscanf(string, "%d"IPV6_SCAN_FMT"%d", &a, ipv6_s, &b) == 3
453  *     && inet_pton(AF_INET6, ipv6_s, &ipv6) == 1) {
454  *     ...
455  * }
456  */
457 #define IPV6_SCAN_FMT "%46[0123456789abcdefABCDEF:.]"
458 #define IPV6_SCAN_LEN 46
459
460 extern const struct in6_addr in6addr_exact;
461 #define IN6ADDR_EXACT_INIT { { { 0xff,0xff,0xff,0xff,0xff,0xff,0xff,0xff, \
462                                  0xff,0xff,0xff,0xff,0xff,0xff,0xff,0xff } } }
463
464 static inline bool ipv6_addr_equals(const struct in6_addr *a,
465                                     const struct in6_addr *b)
466 {
467 #ifdef IN6_ARE_ADDR_EQUAL
468     return IN6_ARE_ADDR_EQUAL(a, b);
469 #else
470     return !memcmp(a, b, sizeof(*a));
471 #endif
472 }
473
474 static inline bool ipv6_mask_is_any(const struct in6_addr *mask) {
475     return ipv6_addr_equals(mask, &in6addr_any);
476 }
477
478 static inline bool ipv6_mask_is_exact(const struct in6_addr *mask) {
479     return ipv6_addr_equals(mask, &in6addr_exact);
480 }
481
482 void format_ipv6_addr(char *addr_str, const struct in6_addr *addr);
483 void print_ipv6_addr(struct ds *string, const struct in6_addr *addr);
484 void print_ipv6_masked(struct ds *string, const struct in6_addr *addr,
485                        const struct in6_addr *mask);
486 struct in6_addr ipv6_addr_bitand(const struct in6_addr *src,
487                                  const struct in6_addr *mask);
488 struct in6_addr ipv6_create_mask(int mask);
489 int ipv6_count_cidr_bits(const struct in6_addr *netmask);
490 bool ipv6_is_cidr(const struct in6_addr *netmask);
491
492 void *eth_compose(struct ofpbuf *, const uint8_t eth_dst[ETH_ADDR_LEN],
493                   const uint8_t eth_src[ETH_ADDR_LEN], uint16_t eth_type,
494                   size_t size);
495 void *snap_compose(struct ofpbuf *, const uint8_t eth_dst[ETH_ADDR_LEN],
496                    const uint8_t eth_src[ETH_ADDR_LEN],
497                    unsigned int oui, uint16_t snap_type, size_t size);
498 void packet_set_ipv4(struct ofpbuf *, ovs_be32 src, ovs_be32 dst, uint8_t tos,
499                      uint8_t ttl);
500 void packet_set_tcp_port(struct ofpbuf *, ovs_be16 src, ovs_be16 dst);
501 void packet_set_udp_port(struct ofpbuf *, ovs_be16 src, ovs_be16 dst);
502
503 uint8_t packet_get_tcp_flags(const struct ofpbuf *, const struct flow *);
504 void packet_format_tcp_flags(struct ds *, uint8_t);
505
506 #endif /* packets.h */