datapath: Sync vxlan tunneling code with upstream ovs-vxlan.
[cascardo/ovs.git] / datapath / vport-vxlan.c
1 /*
2  * Copyright (c) 2013 Nicira, Inc.
3  * Copyright (c) 2013 Cisco Systems, Inc.
4  *
5  * This program is free software; you can redistribute it and/or
6  * modify it under the terms of version 2 of the GNU General Public
7  * License as published by the Free Software Foundation.
8  *
9  * This program is distributed in the hope that it will be useful, but
10  * WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
12  * General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program; if not, write to the Free Software
16  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
17  * 02110-1301, USA
18  */
19
20 #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt
21
22 #include <linux/version.h>
23 #if LINUX_VERSION_CODE >= KERNEL_VERSION(2,6,26)
24
25 #include <linux/in.h>
26 #include <linux/ip.h>
27 #include <linux/net.h>
28 #include <linux/rculist.h>
29 #include <linux/udp.h>
30
31 #include <net/icmp.h>
32 #include <net/ip.h>
33 #include <net/udp.h>
34 #include <net/ip_tunnels.h>
35 #include <net/udp.h>
36 #include <net/rtnetlink.h>
37 #include <net/route.h>
38 #include <net/dsfield.h>
39 #include <net/inet_ecn.h>
40 #include <net/net_namespace.h>
41 #include <net/netns/generic.h>
42 #include <net/vxlan.h>
43
44 #include "datapath.h"
45 #include "vport.h"
46
47 /**
48  * struct vxlan_port - Keeps track of open UDP ports
49  * @vs: vxlan_sock created for the port.
50  * @name: vport name.
51  */
52 struct vxlan_port {
53         struct vxlan_sock *vs;
54         char name[IFNAMSIZ];
55 };
56
57 static inline struct vxlan_port *vxlan_vport(const struct vport *vport)
58 {
59         return vport_priv(vport);
60 }
61
62 /* Called with rcu_read_lock and BH disabled. */
63 static void vxlan_rcv(struct vxlan_sock *vs, struct sk_buff *skb, __be32 vx_vni)
64 {
65         struct ovs_key_ipv4_tunnel tun_key;
66         struct vport *vport = vs->data;
67         struct iphdr *iph;
68         __be64 key;
69
70         /* Save outer tunnel values */
71         iph = ip_hdr(skb);
72         key = cpu_to_be64(ntohl(vx_vni) >> 8);
73         ovs_flow_tun_key_init(&tun_key, iph, key, TUNNEL_KEY);
74
75         ovs_vport_receive(vport, skb, &tun_key);
76 }
77
78 static int vxlan_get_options(const struct vport *vport, struct sk_buff *skb)
79 {
80         struct vxlan_port *vxlan_port = vxlan_vport(vport);
81         __be16 dst_port = inet_sport(vxlan_port->vs->sock->sk);
82
83         if (nla_put_u16(skb, OVS_TUNNEL_ATTR_DST_PORT, ntohs(dst_port)))
84                 return -EMSGSIZE;
85         return 0;
86 }
87
88 static void vxlan_tnl_destroy(struct vport *vport)
89 {
90         struct vxlan_port *vxlan_port = vxlan_vport(vport);
91
92         vxlan_sock_release(vxlan_port->vs);
93
94         ovs_vport_deferred_free(vport);
95 }
96
97 static struct vport *vxlan_tnl_create(const struct vport_parms *parms)
98 {
99         struct net *net = ovs_dp_get_net(parms->dp);
100         struct nlattr *options = parms->options;
101         struct vxlan_port *vxlan_port;
102         struct vxlan_sock *vs;
103         struct vport *vport;
104         struct nlattr *a;
105         u16 dst_port;
106         int err;
107
108         if (!options) {
109                 err = -EINVAL;
110                 goto error;
111         }
112         a = nla_find_nested(options, OVS_TUNNEL_ATTR_DST_PORT);
113         if (a && nla_len(a) == sizeof(u16)) {
114                 dst_port = nla_get_u16(a);
115         } else {
116                 /* Require destination port from userspace. */
117                 err = -EINVAL;
118                 goto error;
119         }
120
121         vport = ovs_vport_alloc(sizeof(struct vxlan_port),
122                                 &ovs_vxlan_vport_ops, parms);
123         if (IS_ERR(vport))
124                 return vport;
125
126         vxlan_port = vxlan_vport(vport);
127         strncpy(vxlan_port->name, parms->name, IFNAMSIZ);
128
129         vs = vxlan_sock_add(net, htons(dst_port), vxlan_rcv, vport, true);
130         if (IS_ERR(vs)) {
131                 ovs_vport_free(vport);
132                 return (void *)vs;
133         }
134         vxlan_port->vs = vs;
135
136         return vport;
137
138 error:
139         return ERR_PTR(err);
140 }
141
142 static int vxlan_tnl_send(struct vport *vport, struct sk_buff *skb)
143 {
144         struct vxlan_port *vxlan_port = vxlan_vport(vport);
145         __be16 dst_port = inet_sport(vxlan_port->vs->sock->sk);
146         struct net *net = ovs_dp_get_net(vport->dp);
147         struct rtable *rt;
148         __be16 src_port;
149         __be32 saddr;
150         __be16 df;
151         int port_min;
152         int port_max;
153         int err;
154
155         if (unlikely(!OVS_CB(skb)->tun_key)) {
156                 err = -EINVAL;
157                 goto error;
158         }
159
160         forward_ip_summed(skb, true);
161
162         /* Route lookup */
163         saddr = OVS_CB(skb)->tun_key->ipv4_src;
164         rt = find_route(ovs_dp_get_net(vport->dp),
165                         &saddr,
166                         OVS_CB(skb)->tun_key->ipv4_dst,
167                         IPPROTO_UDP,
168                         OVS_CB(skb)->tun_key->ipv4_tos,
169                         skb_get_mark(skb));
170         if (IS_ERR(rt)) {
171                 err = PTR_ERR(rt);
172                 goto error;
173         }
174
175         df = OVS_CB(skb)->tun_key->tun_flags & TUNNEL_DONT_FRAGMENT ?
176                 htons(IP_DF) : 0;
177
178         skb->local_df = 1;
179
180         inet_get_local_port_range(&port_min, &port_max);
181         src_port = vxlan_src_port(port_min, port_max, skb);
182
183         err = vxlan_xmit_skb(net, vxlan_port->vs, rt, skb,
184                              saddr, OVS_CB(skb)->tun_key->ipv4_dst,
185                              OVS_CB(skb)->tun_key->ipv4_tos,
186                              OVS_CB(skb)->tun_key->ipv4_ttl, df,
187                              src_port, dst_port,
188                              htonl(be64_to_cpu(OVS_CB(skb)->tun_key->tun_id) << 8));
189         if (err < 0)
190                 ip_rt_put(rt);
191 error:
192         return err;
193 }
194
195 static const char *vxlan_get_name(const struct vport *vport)
196 {
197         struct vxlan_port *vxlan_port = vxlan_vport(vport);
198         return vxlan_port->name;
199 }
200
201 const struct vport_ops ovs_vxlan_vport_ops = {
202         .type           = OVS_VPORT_TYPE_VXLAN,
203         .create         = vxlan_tnl_create,
204         .destroy        = vxlan_tnl_destroy,
205         .get_name       = vxlan_get_name,
206         .get_options    = vxlan_get_options,
207         .send           = vxlan_tnl_send,
208 };
209 #else
210 #warning VXLAN tunneling will not be available on kernels before 2.6.26
211 #endif /* Linux kernel < 2.6.26 */