dpif-netlink: add GENEVE creation support
[cascardo/ovs.git] / lib / ovs-router.c
index 6b5ba00..90e2f82 100644 (file)
@@ -1,5 +1,5 @@
 /*
- * Copyright (c) 2014 Nicira, Inc.
+ * Copyright (c) 2014, 2015, 2016 Nicira, Inc.
  *
  * Licensed under the Apache License, Version 2.0 (the "License");
  * you may not use this file except in compliance with the License.
@@ -15,6 +15,9 @@
  */
 
 #include <config.h>
+
+#include "ovs-router.h"
+
 #include <arpa/inet.h>
 #include <errno.h>
 #include <inttypes.h>
 #include "command-line.h"
 #include "compiler.h"
 #include "dpif.h"
-#include "dynamic-string.h"
+#include "openvswitch/dynamic-string.h"
 #include "netdev.h"
 #include "packets.h"
 #include "seq.h"
-#include "ovs-router.h"
-#include "ovs-router-linux.h"
 #include "ovs-thread.h"
+#include "route-table.h"
+#include "tnl-ports.h"
+#include "unixctl.h"
+#include "util.h"
+#include "unaligned.h"
 #include "unixctl.h"
 #include "util.h"
 
@@ -46,8 +52,9 @@ static struct classifier cls;
 struct ovs_router_entry {
     struct cls_rule cr;
     char output_bridge[IFNAMSIZ];
-    ovs_be32 gw;
-    ovs_be32 nw_addr;
+    struct in6_addr gw;
+    struct in6_addr nw_addr;
+    struct in6_addr src_addr;
     uint8_t plen;
     uint8_t priority;
 };
@@ -62,21 +69,43 @@ ovs_router_entry_cast(const struct cls_rule *cr)
     }
 }
 
+static bool
+ovs_router_lookup_fallback(const struct in6_addr *ip6_dst, char output_bridge[],
+                           struct in6_addr *src6, struct in6_addr *gw6)
+{
+    ovs_be32 src;
+
+    if (!route_table_fallback_lookup(ip6_dst, output_bridge, gw6)) {
+        return false;
+    }
+    if (netdev_get_in4_by_name(output_bridge, (struct in_addr *)&src)) {
+        return false;
+    }
+    if (src6) {
+        in6_addr_set_mapped_ipv4(src6, src);
+    }
+    return true;
+}
+
 bool
-ovs_router_lookup(ovs_be32 ip_dst, char output_bridge[], ovs_be32 *gw)
+ovs_router_lookup(const struct in6_addr *ip6_dst, char output_bridge[],
+                  struct in6_addr *src, struct in6_addr *gw)
 {
     const struct cls_rule *cr;
-    struct flow flow = {.nw_dst = ip_dst};
+    struct flow flow = {.ipv6_dst = *ip6_dst};
 
-    cr = classifier_lookup(&cls, &flow, NULL);
+    cr = classifier_lookup(&cls, CLS_MAX_VERSION, &flow, NULL);
     if (cr) {
         struct ovs_router_entry *p = ovs_router_entry_cast(cr);
 
-        strncpy(output_bridge, p->output_bridge, IFNAMSIZ);
+        ovs_strlcpy(output_bridge, p->output_bridge, IFNAMSIZ);
         *gw = p->gw;
+        if (src) {
+            *src = p->src_addr;
+        }
         return true;
     }
-    return false;
+    return ovs_router_lookup_fallback(ip6_dst, output_bridge, src, gw);
 }
 
 static void
@@ -86,131 +115,203 @@ rt_entry_free(struct ovs_router_entry *p)
     free(p);
 }
 
-static void rt_init_match(struct match *match, ovs_be32 ip_dst, uint8_t plen)
+static void rt_init_match(struct match *match, const struct in6_addr *ip6_dst,
+                          uint8_t plen)
 {
-    ovs_be32 mask;
+    struct in6_addr dst;
+    struct in6_addr mask;
 
-    mask = be32_prefix_mask(plen);
+    mask = ipv6_create_mask(plen);
 
-    ip_dst &= mask; /* Clear out insignificant bits. */
+    dst = ipv6_addr_bitand(ip6_dst, &mask);
     memset(match, 0, sizeof *match);
-    match->flow.nw_dst = ip_dst;
-    match->wc.masks.nw_dst = mask;
+    match->flow.ipv6_dst = dst;
+    match->wc.masks.ipv6_dst = mask;
 }
 
-static void
-ovs_router_insert__(uint8_t priority, ovs_be32 ip_dst, uint8_t plen,
-                    const char output_bridge[],
-                    ovs_be32 gw)
+static int
+get_src_addr(const struct in6_addr *ip6_dst,
+             const char output_bridge[], struct in6_addr *psrc)
+{
+    struct in6_addr *mask, *addr6;
+    int err, n_in6, i, max_plen = -1;
+    struct netdev *dev;
+
+    err = netdev_open(output_bridge, NULL, &dev);
+    if (err) {
+        return err;
+    }
+
+    err = netdev_get_addr_list(dev, &addr6, &mask, &n_in6);
+    if (err) {
+        goto out;
+    }
+
+    for (i = 0; i < n_in6; i++) {
+        struct in6_addr a1, a2;
+        int mask_bits;
+
+        a1 = ipv6_addr_bitand(ip6_dst, &mask[i]);
+        a2 = ipv6_addr_bitand(&addr6[i], &mask[i]);
+        mask_bits = bitmap_count1(ALIGNED_CAST(const unsigned long *, &mask[i]), 128);
+
+        if (!memcmp(&a1, &a2, sizeof (a1)) && mask_bits > max_plen) {
+            *psrc = addr6[i];
+            max_plen = mask_bits;
+        }
+    }
+    if (max_plen == -1) {
+        err = ENOENT;
+    }
+out:
+    free(addr6);
+    free(mask);
+    netdev_close(dev);
+    return err;
+}
+
+static int
+ovs_router_insert__(uint8_t priority, const struct in6_addr *ip6_dst,
+                    uint8_t plen, const char output_bridge[],
+                    const struct in6_addr *gw)
 {
     const struct cls_rule *cr;
     struct ovs_router_entry *p;
     struct match match;
+    int err;
 
-    rt_init_match(&match, ip_dst, plen);
+    rt_init_match(&match, ip6_dst, plen);
 
     p = xzalloc(sizeof *p);
-    strncpy(p->output_bridge, output_bridge, IFNAMSIZ);
-    p->gw = gw;
-    p->nw_addr = match.flow.nw_dst;
+    ovs_strlcpy(p->output_bridge, output_bridge, sizeof p->output_bridge);
+    if (ipv6_addr_is_set(gw)) {
+        p->gw = *gw;
+    }
+    p->nw_addr = match.flow.ipv6_dst;
     p->plen = plen;
     p->priority = priority;
-    cls_rule_init(&p->cr, &match, priority); /* Longest prefix matches first. */
+    err = get_src_addr(ip6_dst, output_bridge, &p->src_addr);
+    if (err) {
+        free(p);
+        return err;
+    }
+    /* Longest prefix matches first. */
+    cls_rule_init(&p->cr, &match, priority);
 
     ovs_mutex_lock(&mutex);
-    cr = classifier_replace(&cls, &p->cr);
+    cr = classifier_replace(&cls, &p->cr, CLS_MIN_VERSION, NULL, 0);
     ovs_mutex_unlock(&mutex);
 
     if (cr) {
         /* An old rule with the same match was displaced. */
         ovsrcu_postpone(rt_entry_free, ovs_router_entry_cast(cr));
     }
+    tnl_port_map_insert_ipdev(output_bridge);
     seq_change(tnl_conf_seq);
+    return 0;
 }
 
 void
-ovs_router_insert(ovs_be32 ip_dst, uint8_t plen, const char output_bridge[],
-                  ovs_be32 gw)
+ovs_router_insert(const struct in6_addr *ip_dst, uint8_t plen,
+                  const char output_bridge[], const struct in6_addr *gw)
 {
     ovs_router_insert__(plen, ip_dst, plen, output_bridge, gw);
 }
 
+
+static bool
+__rt_entry_delete(const struct cls_rule *cr)
+{
+    struct ovs_router_entry *p = ovs_router_entry_cast(cr);
+
+    tnl_port_map_delete_ipdev(p->output_bridge);
+    /* Remove it. */
+    cr = classifier_remove(&cls, cr);
+    if (cr) {
+        ovsrcu_postpone(rt_entry_free, ovs_router_entry_cast(cr));
+        return true;
+    }
+    return false;
+}
+
 static bool
-rt_entry_delete(uint8_t priority, ovs_be32 ip_dst, uint8_t plen)
+rt_entry_delete(uint8_t priority, const struct in6_addr *ip6_dst, uint8_t plen)
 {
     const struct cls_rule *cr;
     struct cls_rule rule;
     struct match match;
+    bool res = false;
 
-    rt_init_match(&match, ip_dst, plen);
+    rt_init_match(&match, ip6_dst, plen);
 
     cls_rule_init(&rule, &match, priority);
 
     /* Find the exact rule. */
-    cr = classifier_find_rule_exactly(&cls, &rule);
+    cr = classifier_find_rule_exactly(&cls, &rule, CLS_MAX_VERSION);
     if (cr) {
-        /* Remove it. */
         ovs_mutex_lock(&mutex);
-        cr = classifier_remove(&cls, cr);
+        res = __rt_entry_delete(cr);
         ovs_mutex_unlock(&mutex);
+    }
+    return res;
+}
 
-        if (cr) {
-            ovsrcu_postpone(rt_entry_free, ovs_router_entry_cast(cr));
-            return true;
-        }
+static bool
+scan_ipv6_route(const char *s, struct in6_addr *addr, unsigned int *plen)
+{
+    char *error = ipv6_parse_cidr(s, addr, plen);
+    if (error) {
+        free(error);
+        return false;
     }
-    return false;
+    return true;
 }
 
 static bool
 scan_ipv4_route(const char *s, ovs_be32 *addr, unsigned int *plen)
 {
-    int len, max_plen, n;
-    int slen = strlen(s);
-    uint8_t *ip = (uint8_t *)addr;
-
-    *addr = htonl(0);
-    if (!ovs_scan(s, "%"SCNu8"%n", &ip[0], &n)) {
+    char *error = ip_parse_cidr(s, addr, plen);
+    if (error) {
+        free(error);
         return false;
     }
-    len = n;
-    max_plen = 8;
-    for (int i = 1; i < 4; i++) {
-        if (ovs_scan(s + len, ".%"SCNu8"%n", &ip[i], &n)) {
-            len += n;
-            max_plen += 8;
-        } else {
-            break;
-        }
-    }
-    if (len == slen && max_plen == 32) {
-        *plen = 32;
-        return true;
-    }
-    if (ovs_scan(s + len, "/%u%n", plen, &n)
-        && len + n == slen && *plen <= max_plen) {
-        return true;
-    }
-    return false;
+    return true;
 }
 
 static void
 ovs_router_add(struct unixctl_conn *conn, int argc,
               const char *argv[], void *aux OVS_UNUSED)
 {
-    ovs_be32 ip, gw;
+    ovs_be32 ip;
     unsigned int plen;
+    struct in6_addr ip6;
+    struct in6_addr gw6;
+    int err;
 
     if (scan_ipv4_route(argv[1], &ip, &plen)) {
-        if (argc > 3) {
-            inet_pton(AF_INET, argv[3], (struct in_addr *)&gw);
-        } else {
-            gw = 0;
+        ovs_be32 gw = 0;
+        if (argc > 3 && !ip_parse(argv[3], &gw)) {
+            unixctl_command_reply_error(conn, "Invalid gateway");
+            return;
         }
-        ovs_router_insert__(plen + 32, ip, plen, argv[2], gw);
-        unixctl_command_reply(conn, "OK");
+        in6_addr_set_mapped_ipv4(&ip6, ip);
+        in6_addr_set_mapped_ipv4(&gw6, gw);
+        plen += 96;
+    } else if (scan_ipv6_route(argv[1], &ip6, &plen)) {
+        gw6 = in6addr_any;
+        if (argc > 3 && !ipv6_parse(argv[3], &gw6)) {
+            unixctl_command_reply_error(conn, "Invalid IPv6 gateway");
+            return;
+        }
+    } else {
+        unixctl_command_reply_error(conn, "Invalid parameters");
+        return;
+    }
+    err = ovs_router_insert__(plen + 32, &ip6, plen, argv[2], &gw6);
+    if (err) {
+        unixctl_command_reply(conn, "Error while inserting route.");
     } else {
-        unixctl_command_reply(conn, "Invalid parameters");
+        unixctl_command_reply(conn, "OK");
     }
 }
 
@@ -220,17 +321,20 @@ ovs_router_del(struct unixctl_conn *conn, int argc OVS_UNUSED,
 {
     ovs_be32 ip;
     unsigned int plen;
+    struct in6_addr ip6;
 
     if (scan_ipv4_route(argv[1], &ip, &plen)) {
-
-        if (rt_entry_delete(plen + 32, ip, plen)) {
-            unixctl_command_reply(conn, "OK");
-            seq_change(tnl_conf_seq);
-        } else {
-            unixctl_command_reply(conn, "Not found");
-        }
+        in6_addr_set_mapped_ipv4(&ip6, ip);
+        plen += 96;
+    } else if (!scan_ipv6_route(argv[1], &ip6, &plen)) {
+        unixctl_command_reply_error(conn, "Invalid parameters");
+        return;
+    }
+    if (rt_entry_delete(plen + 32, &ip6, plen)) {
+        unixctl_command_reply(conn, "OK");
+        seq_change(tnl_conf_seq);
     } else {
-        unixctl_command_reply(conn, "Invalid parameters");
+        unixctl_command_reply_error(conn, "Not found");
     }
 }
 
@@ -243,23 +347,61 @@ ovs_router_show(struct unixctl_conn *conn, int argc OVS_UNUSED,
 
     ds_put_format(&ds, "Route Table:\n");
     CLS_FOR_EACH(rt, cr, &cls) {
+        uint8_t plen;
         if (rt->priority == rt->plen) {
             ds_put_format(&ds, "Cached: ");
         } else {
             ds_put_format(&ds, "User: ");
         }
-        ds_put_format(&ds, IP_FMT"/%"PRIu16" dev %s",
-                      IP_ARGS(rt->nw_addr), rt->plen,
-                      rt->output_bridge);
-        if (rt->gw) {
-            ds_put_format(&ds, " GW "IP_FMT, IP_ARGS(rt->gw));
+        ipv6_format_mapped(&rt->nw_addr, &ds);
+        plen = rt->plen;
+        if (IN6_IS_ADDR_V4MAPPED(&rt->nw_addr)) {
+            plen -= 96;
+        }
+        ds_put_format(&ds, "/%"PRIu16" dev %s", plen, rt->output_bridge);
+        if (ipv6_addr_is_set(&rt->gw)) {
+            ds_put_format(&ds, " GW ");
+            ipv6_format_mapped(&rt->gw, &ds);
         }
+        ds_put_format(&ds, " SRC ");
+        ipv6_format_mapped(&rt->src_addr, &ds);
         ds_put_format(&ds, "\n");
     }
     unixctl_command_reply(conn, ds_cstr(&ds));
     ds_destroy(&ds);
 }
 
+static void
+ovs_router_lookup_cmd(struct unixctl_conn *conn, int argc OVS_UNUSED,
+                      const char *argv[], void *aux OVS_UNUSED)
+{
+    ovs_be32 ip;
+    struct in6_addr ip6;
+    unsigned int plen;
+    char iface[IFNAMSIZ];
+    struct in6_addr gw, src;
+
+    if (scan_ipv4_route(argv[1], &ip, &plen) && plen == 32) {
+        in6_addr_set_mapped_ipv4(&ip6, ip);
+    } else if (!(scan_ipv6_route(argv[1], &ip6, &plen) && plen == 128)) {
+        unixctl_command_reply_error(conn, "Invalid parameters");
+        return;
+    }
+
+    if (ovs_router_lookup(&ip6, iface, &src, &gw)) {
+        struct ds ds = DS_EMPTY_INITIALIZER;
+        ds_put_format(&ds, "src ");
+        ipv6_format_mapped(&src, &ds);
+        ds_put_format(&ds, "gateway ");
+        ipv6_format_mapped(&gw, &ds);
+        ds_put_format(&ds, "\ndev %s\n", iface);
+        unixctl_command_reply(conn, ds_cstr(&ds));
+        ds_destroy(&ds);
+    } else {
+        unixctl_command_reply_error(conn, "Not found");
+    }
+}
+
 void
 ovs_router_flush(void)
 {
@@ -269,9 +411,7 @@ ovs_router_flush(void)
     classifier_defer(&cls);
     CLS_FOR_EACH(rt, cr, &cls) {
         if (rt->priority == rt->plen) {
-            if (classifier_remove(&cls, &rt->cr)) {
-                ovsrcu_postpone(rt_entry_free, rt);
-            }
+            __rt_entry_delete(&rt->cr);
         }
     }
     classifier_publish(&cls);
@@ -281,12 +421,14 @@ ovs_router_flush(void)
 
 /* May not be called more than once. */
 void
-ovs_router_unixctl_register(void)
+ovs_router_init(void)
 {
     classifier_init(&cls, NULL);
-    unixctl_command_register("ovs/route/add", "ipv4_addr/prefix_len out_br_name gw", 2, 3,
+    unixctl_command_register("ovs/route/add", "ip_addr/prefix_len out_br_name gw", 2, 3,
                              ovs_router_add, NULL);
     unixctl_command_register("ovs/route/show", "", 0, 0, ovs_router_show, NULL);
-    unixctl_command_register("ovs/route/del", "ipv4_addr/prefix_len", 1, 1, ovs_router_del,
+    unixctl_command_register("ovs/route/del", "ip_addr/prefix_len", 1, 1, ovs_router_del,
                              NULL);
+    unixctl_command_register("ovs/route/lookup", "ip_addr", 1, 1,
+                             ovs_router_lookup_cmd, NULL);
 }