34dd919aeab8041e3ab2b3dcb0dad0a6d5378a78
[cascardo/ovs.git] / datapath / vport-vxlan.c
1 /*
2  * Copyright (c) 2013 Nicira, Inc.
3  * Copyright (c) 2013 Cisco Systems, Inc.
4  *
5  * This program is free software; you can redistribute it and/or
6  * modify it under the terms of version 2 of the GNU General Public
7  * License as published by the Free Software Foundation.
8  *
9  * This program is distributed in the hope that it will be useful, but
10  * WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
12  * General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program; if not, write to the Free Software
16  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
17  * 02110-1301, USA
18  */
19
20 #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt
21
22 #include <linux/version.h>
23
24 #include <linux/in.h>
25 #include <linux/ip.h>
26 #include <linux/net.h>
27 #include <linux/rculist.h>
28 #include <linux/udp.h>
29
30 #include <net/icmp.h>
31 #include <net/ip.h>
32 #include <net/udp.h>
33 #include <net/ip_tunnels.h>
34 #include <net/rtnetlink.h>
35 #include <net/route.h>
36 #include <net/dsfield.h>
37 #include <net/inet_ecn.h>
38 #include <net/net_namespace.h>
39 #include <net/netns/generic.h>
40 #include <net/vxlan.h>
41
42 #include "datapath.h"
43 #include "vport.h"
44
45 /**
46  * struct vxlan_port - Keeps track of open UDP ports
47  * @vs: vxlan_sock created for the port.
48  * @name: vport name.
49  */
50 struct vxlan_port {
51         struct vxlan_sock *vs;
52         char name[IFNAMSIZ];
53 };
54
55 static inline struct vxlan_port *vxlan_vport(const struct vport *vport)
56 {
57         return vport_priv(vport);
58 }
59
60 /* Called with rcu_read_lock and BH disabled. */
61 static void vxlan_rcv(struct vxlan_sock *vs, struct sk_buff *skb, __be32 vx_vni)
62 {
63         struct ovs_tunnel_info tun_info;
64         struct vport *vport = vs->data;
65         struct iphdr *iph;
66         __be64 key;
67
68         /* Save outer tunnel values */
69         iph = ip_hdr(skb);
70         key = cpu_to_be64(ntohl(vx_vni) >> 8);
71         ovs_flow_tun_info_init(&tun_info, iph,
72                                udp_hdr(skb)->source, udp_hdr(skb)->dest,
73                                key, TUNNEL_KEY, NULL, 0);
74
75         ovs_vport_receive(vport, skb, &tun_info);
76 }
77
78 static int vxlan_get_options(const struct vport *vport, struct sk_buff *skb)
79 {
80         struct vxlan_port *vxlan_port = vxlan_vport(vport);
81         __be16 dst_port = inet_sport(vxlan_port->vs->sock->sk);
82
83         if (nla_put_u16(skb, OVS_TUNNEL_ATTR_DST_PORT, ntohs(dst_port)))
84                 return -EMSGSIZE;
85         return 0;
86 }
87
88 static void vxlan_tnl_destroy(struct vport *vport)
89 {
90         struct vxlan_port *vxlan_port = vxlan_vport(vport);
91
92         vxlan_sock_release(vxlan_port->vs);
93
94         ovs_vport_deferred_free(vport);
95 }
96
97 static struct vport *vxlan_tnl_create(const struct vport_parms *parms)
98 {
99         struct net *net = ovs_dp_get_net(parms->dp);
100         struct nlattr *options = parms->options;
101         struct vxlan_port *vxlan_port;
102         struct vxlan_sock *vs;
103         struct vport *vport;
104         struct nlattr *a;
105         u16 dst_port;
106         int err;
107
108         if (!options) {
109                 err = -EINVAL;
110                 goto error;
111         }
112         a = nla_find_nested(options, OVS_TUNNEL_ATTR_DST_PORT);
113         if (a && nla_len(a) == sizeof(u16)) {
114                 dst_port = nla_get_u16(a);
115         } else {
116                 /* Require destination port from userspace. */
117                 err = -EINVAL;
118                 goto error;
119         }
120
121         vport = ovs_vport_alloc(sizeof(struct vxlan_port),
122                                 &ovs_vxlan_vport_ops, parms);
123         if (IS_ERR(vport))
124                 return vport;
125
126         vxlan_port = vxlan_vport(vport);
127         strncpy(vxlan_port->name, parms->name, IFNAMSIZ);
128
129         vs = vxlan_sock_add(net, htons(dst_port), vxlan_rcv, vport, true, false);
130         if (IS_ERR(vs)) {
131                 ovs_vport_free(vport);
132                 return (void *)vs;
133         }
134         vxlan_port->vs = vs;
135
136         return vport;
137
138 error:
139         return ERR_PTR(err);
140 }
141
142 static int vxlan_tnl_send(struct vport *vport, struct sk_buff *skb)
143 {
144         struct ovs_key_ipv4_tunnel *tun_key;
145         struct net *net = ovs_dp_get_net(vport->dp);
146         struct vxlan_port *vxlan_port = vxlan_vport(vport);
147         __be16 dst_port = inet_sport(vxlan_port->vs->sock->sk);
148         struct rtable *rt;
149         __be16 src_port;
150         __be32 saddr;
151         __be16 df;
152         int port_min;
153         int port_max;
154         int err;
155
156         if (unlikely(!OVS_CB(skb)->egress_tun_info)) {
157                 err = -EINVAL;
158                 goto error;
159         }
160
161         tun_key = &OVS_CB(skb)->egress_tun_info->tunnel;
162
163         /* Route lookup */
164         saddr = tun_key->ipv4_src;
165         rt = find_route(ovs_dp_get_net(vport->dp),
166                         &saddr, tun_key->ipv4_dst,
167                         IPPROTO_UDP, tun_key->ipv4_tos,
168                         skb->mark);
169         if (IS_ERR(rt)) {
170                 err = PTR_ERR(rt);
171                 goto error;
172         }
173
174         df = tun_key->tun_flags & TUNNEL_DONT_FRAGMENT ? htons(IP_DF) : 0;
175         skb->local_df = 1;
176
177         inet_get_local_port_range(net, &port_min, &port_max);
178         src_port = vxlan_src_port(port_min, port_max, skb);
179
180         err = vxlan_xmit_skb(vxlan_port->vs, rt, skb,
181                              saddr, tun_key->ipv4_dst,
182                              tun_key->ipv4_tos,
183                              tun_key->ipv4_ttl, df,
184                              src_port, dst_port,
185                              htonl(be64_to_cpu(tun_key->tun_id) << 8));
186         if (err < 0)
187                 ip_rt_put(rt);
188 error:
189         return err;
190 }
191
192 static int vxlan_get_egress_tun_info(struct vport *vport, struct sk_buff *skb,
193                                      struct ovs_tunnel_info *egress_tun_info)
194 {
195         struct net *net = ovs_dp_get_net(vport->dp);
196         struct vxlan_port *vxlan_port = vxlan_vport(vport);
197         __be16 dst_port = inet_sport(vxlan_port->vs->sock->sk);
198         __be16 src_port;
199         int port_min;
200         int port_max;
201
202         inet_get_local_port_range(net, &port_min, &port_max);
203         src_port = vxlan_src_port(port_min, port_max, skb);
204
205         return ovs_tunnel_get_egress_info(egress_tun_info, net,
206                                           OVS_CB(skb)->egress_tun_info,
207                                           IPPROTO_UDP, skb->mark,
208                                           src_port, dst_port);
209 }
210
211 static const char *vxlan_get_name(const struct vport *vport)
212 {
213         struct vxlan_port *vxlan_port = vxlan_vport(vport);
214         return vxlan_port->name;
215 }
216
217 const struct vport_ops ovs_vxlan_vport_ops = {
218         .type                   = OVS_VPORT_TYPE_VXLAN,
219         .create                 = vxlan_tnl_create,
220         .destroy                = vxlan_tnl_destroy,
221         .get_name               = vxlan_get_name,
222         .get_options            = vxlan_get_options,
223         .send                   = vxlan_tnl_send,
224         .get_egress_tun_info    = vxlan_get_egress_tun_info,
225 };