datapath: Account for "vxlan: Group Policy extension"
[cascardo/ovs.git] / datapath / vport-vxlan.c
1 /*
2  * Copyright (c) 2013 Nicira, Inc.
3  * Copyright (c) 2013 Cisco Systems, Inc.
4  *
5  * This program is free software; you can redistribute it and/or
6  * modify it under the terms of version 2 of the GNU General Public
7  * License as published by the Free Software Foundation.
8  *
9  * This program is distributed in the hope that it will be useful, but
10  * WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
12  * General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program; if not, write to the Free Software
16  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
17  * 02110-1301, USA
18  */
19
20 #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt
21
22 #include <linux/version.h>
23
24 #include <linux/in.h>
25 #include <linux/ip.h>
26 #include <linux/net.h>
27 #include <linux/rculist.h>
28 #include <linux/udp.h>
29
30 #include <net/icmp.h>
31 #include <net/ip.h>
32 #include <net/udp.h>
33 #include <net/ip_tunnels.h>
34 #include <net/rtnetlink.h>
35 #include <net/route.h>
36 #include <net/dsfield.h>
37 #include <net/inet_ecn.h>
38 #include <net/net_namespace.h>
39 #include <net/netns/generic.h>
40 #include <net/vxlan.h>
41
42 #include "datapath.h"
43 #include "vport.h"
44
45 /**
46  * struct vxlan_port - Keeps track of open UDP ports
47  * @vs: vxlan_sock created for the port.
48  * @name: vport name.
49  */
50 struct vxlan_port {
51         struct vxlan_sock *vs;
52         char name[IFNAMSIZ];
53 };
54
55 static inline struct vxlan_port *vxlan_vport(const struct vport *vport)
56 {
57         return vport_priv(vport);
58 }
59
60 static void vxlan_rcv(struct vxlan_sock *vs, struct sk_buff *skb,
61                       struct vxlan_metadata *md)
62 {
63         struct ovs_tunnel_info tun_info;
64         struct vport *vport = vs->data;
65         struct iphdr *iph;
66         __be64 key;
67
68         /* Save outer tunnel values */
69         iph = ip_hdr(skb);
70         key = cpu_to_be64(ntohl(md->vni) >> 8);
71         ovs_flow_tun_info_init(&tun_info, iph,
72                                udp_hdr(skb)->source, udp_hdr(skb)->dest,
73                                key, TUNNEL_KEY, NULL, 0);
74
75         ovs_vport_receive(vport, skb, &tun_info);
76 }
77
78 static int vxlan_get_options(const struct vport *vport, struct sk_buff *skb)
79 {
80         struct vxlan_port *vxlan_port = vxlan_vport(vport);
81         __be16 dst_port = inet_sport(vxlan_port->vs->sock->sk);
82
83         if (nla_put_u16(skb, OVS_TUNNEL_ATTR_DST_PORT, ntohs(dst_port)))
84                 return -EMSGSIZE;
85         return 0;
86 }
87
88 static void vxlan_tnl_destroy(struct vport *vport)
89 {
90         struct vxlan_port *vxlan_port = vxlan_vport(vport);
91
92         vxlan_sock_release(vxlan_port->vs);
93
94         ovs_vport_deferred_free(vport);
95 }
96
97 static struct vport *vxlan_tnl_create(const struct vport_parms *parms)
98 {
99         struct net *net = ovs_dp_get_net(parms->dp);
100         struct nlattr *options = parms->options;
101         struct vxlan_port *vxlan_port;
102         struct vxlan_sock *vs;
103         struct vport *vport;
104         struct nlattr *a;
105         u16 dst_port;
106         int err;
107
108         if (!options) {
109                 err = -EINVAL;
110                 goto error;
111         }
112         a = nla_find_nested(options, OVS_TUNNEL_ATTR_DST_PORT);
113         if (a && nla_len(a) == sizeof(u16)) {
114                 dst_port = nla_get_u16(a);
115         } else {
116                 /* Require destination port from userspace. */
117                 err = -EINVAL;
118                 goto error;
119         }
120
121         vport = ovs_vport_alloc(sizeof(struct vxlan_port),
122                                 &ovs_vxlan_vport_ops, parms);
123         if (IS_ERR(vport))
124                 return vport;
125
126         vxlan_port = vxlan_vport(vport);
127         strncpy(vxlan_port->name, parms->name, IFNAMSIZ);
128
129         vs = vxlan_sock_add(net, htons(dst_port), vxlan_rcv, vport, true, 0);
130         if (IS_ERR(vs)) {
131                 ovs_vport_free(vport);
132                 return (void *)vs;
133         }
134         vxlan_port->vs = vs;
135
136         return vport;
137
138 error:
139         return ERR_PTR(err);
140 }
141
142 static int vxlan_tnl_send(struct vport *vport, struct sk_buff *skb)
143 {
144         struct ovs_key_ipv4_tunnel *tun_key;
145         struct net *net = ovs_dp_get_net(vport->dp);
146         struct vxlan_port *vxlan_port = vxlan_vport(vport);
147         __be16 dst_port = inet_sport(vxlan_port->vs->sock->sk);
148         struct vxlan_metadata md = {0};
149         struct rtable *rt;
150         __be16 src_port;
151         __be32 saddr;
152         __be16 df;
153         int err;
154
155         if (unlikely(!OVS_CB(skb)->egress_tun_info)) {
156                 err = -EINVAL;
157                 goto error;
158         }
159
160         tun_key = &OVS_CB(skb)->egress_tun_info->tunnel;
161
162         /* Route lookup */
163         saddr = tun_key->ipv4_src;
164         rt = find_route(ovs_dp_get_net(vport->dp),
165                         &saddr, tun_key->ipv4_dst,
166                         IPPROTO_UDP, tun_key->ipv4_tos,
167                         skb->mark);
168         if (IS_ERR(rt)) {
169                 err = PTR_ERR(rt);
170                 goto error;
171         }
172
173         df = tun_key->tun_flags & TUNNEL_DONT_FRAGMENT ? htons(IP_DF) : 0;
174         skb->ignore_df = 1;
175
176         src_port = udp_flow_src_port(net, skb, 0, 0, true);
177         md.vni = htonl(be64_to_cpu(tun_key->tun_id) << 8);
178
179         err = vxlan_xmit_skb(vxlan_port->vs, rt, skb,
180                              saddr, tun_key->ipv4_dst,
181                              tun_key->ipv4_tos,
182                              tun_key->ipv4_ttl, df,
183                              src_port, dst_port,
184                              &md);
185         if (err < 0)
186                 ip_rt_put(rt);
187         return err;
188 error:
189         kfree_skb(skb);
190         return err;
191 }
192
193 static int vxlan_get_egress_tun_info(struct vport *vport, struct sk_buff *skb,
194                                      struct ovs_tunnel_info *egress_tun_info)
195 {
196         struct net *net = ovs_dp_get_net(vport->dp);
197         struct vxlan_port *vxlan_port = vxlan_vport(vport);
198         __be16 dst_port = inet_sport(vxlan_port->vs->sock->sk);
199         __be16 src_port;
200
201         src_port = udp_flow_src_port(net, skb, 0, 0, true);
202
203         return ovs_tunnel_get_egress_info(egress_tun_info, net,
204                                           OVS_CB(skb)->egress_tun_info,
205                                           IPPROTO_UDP, skb->mark,
206                                           src_port, dst_port);
207 }
208
209 static const char *vxlan_get_name(const struct vport *vport)
210 {
211         struct vxlan_port *vxlan_port = vxlan_vport(vport);
212         return vxlan_port->name;
213 }
214
215 const struct vport_ops ovs_vxlan_vport_ops = {
216         .type                   = OVS_VPORT_TYPE_VXLAN,
217         .create                 = vxlan_tnl_create,
218         .destroy                = vxlan_tnl_destroy,
219         .get_name               = vxlan_get_name,
220         .get_options            = vxlan_get_options,
221         .send                   = vxlan_tnl_send,
222         .get_egress_tun_info    = vxlan_get_egress_tun_info,
223 };