1d79976a38b56ac12a2d317342225f56162582c6
[cascardo/ovs.git] / lib / ovs-rcu.h
1 /*
2  * Copyright (c) 2014 Nicira, Inc.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at:
7  *
8  *     http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #ifndef OVS_RCU_H
18 #define OVS_RCU_H 1
19
20 /* Read-Copy-Update (RCU)
21  * ======================
22  *
23  * Introduction
24  * ------------
25  *
26  * Atomic pointer access makes it pretty easy to implement lock-free
27  * algorithms.  There is one big problem, though: when a writer updates a
28  * pointer to point to a new data structure, some thread might be reading the
29  * old version, and there's no convenient way to free the old version when all
30  * threads are done with the old version.
31  *
32  * The function ovsrcu_postpone() solves that problem.  The function pointer
33  * passed in as its argument is called only after all threads are done with old
34  * versions of data structures.  The function callback frees an old version of
35  * data no longer in use.  This technique is called "read-copy-update", or RCU
36  * for short.
37  *
38  *
39  * Details
40  * -------
41  *
42  * A "quiescent state" is a time at which a thread holds no pointers to memory
43  * that is managed by RCU; that is, when the thread is known not to reference
44  * memory that might be an old version of some object freed via RCU.  For
45  * example, poll_block() includes a quiescent state, as does
46  * ovs_mutex_cond_wait().
47  *
48  * The following functions manage the recognition of quiescent states:
49  *
50  *     void ovsrcu_quiesce(void)
51  *
52  *         Recognizes a momentary quiescent state in the current thread.
53  *
54  *     void ovsrcu_quiesce_start(void)
55  *     void ovsrcu_quiesce_end(void)
56  *
57  *         Brackets a time period during which the current thread is quiescent.
58  *
59  * A newly created thread is initially active, not quiescent.
60  *
61  * When a quiescient state has occurred in every thread, we say that a "grace
62  * period" has occurred.  Following a grace period, all of the callbacks
63  * postponed before the start of the grace period may be invoked.  OVS takes
64  * care of this automatically through the RCU mechanism: while a process still
65  * has only a single thread, it invokes the postponed callbacks directly from
66  * ovsrcu_quiesce() and ovsrcu_quiesce_start(); after additional threads have
67  * been created, it creates an extra helper thread to invoke callbacks.
68  *
69  *
70  * Use
71  * ---
72  *
73  * Use OVSRCU_TYPE(TYPE) to declare a pointer to RCU-protected data, e.g. the
74  * following declares an RCU-protected "struct flow *" named flowp:
75  *
76  *     OVSRCU_TYPE(struct flow *) flowp;
77  *
78  * Use ovsrcu_get(TYPE, VAR) to read an RCU-protected pointer, e.g. to read the
79  * pointer variable declared above:
80  *
81  *     struct flow *flow = ovsrcu_get(struct flow *, &flowp);
82  *
83  * If the pointer variable is currently protected against change (because
84  * the current thread holds a mutex that protects it), ovsrcu_get_protected()
85  * may be used instead.  Only on the Alpha architecture is this likely to
86  * generate different code, but it may be useful documentation.
87  *
88  * (With GNU C or Clang, you get a compiler error if TYPE is wrong; other
89  * compilers will merrily carry along accepting the wrong type.)
90  *
91  * Use ovsrcu_set() to write an RCU-protected pointer and ovsrcu_postpone() to
92  * free the previous data.  ovsrcu_set_hidden() can be used on RCU protected
93  * data not visible to any readers yet, but will be made visible by a later
94  * ovsrcu_set().   ovsrcu_init() can be used to initialize RCU pointers when
95  * no readers are yet executing.  If more than one thread can write the
96  * pointer, then some form of external synchronization, e.g. a mutex, is
97  * needed to prevent writers from interfering with one another.  For example,
98  * to write the pointer variable declared above while safely freeing the old
99  * value:
100  *
101  *     static struct ovs_mutex mutex = OVS_MUTEX_INITIALIZER;
102  *
103  *     OVSRCU_TYPE(struct flow *) flowp;
104  *
105  *     void
106  *     change_flow(struct flow *new_flow)
107  *     {
108  *         ovs_mutex_lock(&mutex);
109  *         ovsrcu_postpone(free,
110  *                         ovsrcu_get_protected(struct flow *, &flowp));
111  *         ovsrcu_set(&flowp, new_flow);
112  *         ovs_mutex_unlock(&mutex);
113  *     }
114  *
115  */
116
117 #include "compiler.h"
118 #include "ovs-atomic.h"
119
120 #if __GNUC__
121 #define OVSRCU_TYPE(TYPE) struct { ATOMIC(TYPE) p; }
122 #define OVSRCU_INITIALIZER(VALUE) { ATOMIC_VAR_INIT(VALUE) }
123 #define ovsrcu_get__(TYPE, VAR, ORDER)                                  \
124     ({                                                                  \
125         TYPE value__;                                                   \
126         typeof(VAR) ovsrcu_var = (VAR);                                 \
127                                                                         \
128         atomic_read_explicit(CONST_CAST(ATOMIC(TYPE) *, &ovsrcu_var->p), \
129                              &value__, ORDER);                          \
130                                                                         \
131         value__;                                                        \
132     })
133 #define ovsrcu_get(TYPE, VAR) \
134     ovsrcu_get__(TYPE, VAR, memory_order_consume)
135 #define ovsrcu_get_protected(TYPE, VAR) \
136     ovsrcu_get__(TYPE, VAR, memory_order_relaxed)
137
138 /* 'VALUE' may be an atomic operation, which must be evaluated before
139  * any of the body of the atomic_store_explicit.  Since the type of
140  * 'VAR' is not fixed, we cannot use an inline function to get
141  * function semantics for this. */
142 #define ovsrcu_set__(VAR, VALUE, ORDER)                                 \
143     ({                                                                  \
144         typeof(VAR) ovsrcu_var = (VAR);                                 \
145         typeof(VALUE) ovsrcu_value = (VALUE);                           \
146         memory_order ovsrcu_order = (ORDER);                            \
147                                                                         \
148         atomic_store_explicit(&ovsrcu_var->p, ovsrcu_value, ovsrcu_order); \
149         (void *) 0;                                                     \
150     })
151 #else  /* not GNU C */
152 struct ovsrcu_pointer { ATOMIC(void *) p; };
153 #define OVSRCU_TYPE(TYPE) struct ovsrcu_pointer
154 #define OVSRCU_INITIALIZER(VALUE) { ATOMIC_VAR_INIT(VALUE) }
155 static inline void *
156 ovsrcu_get__(const struct ovsrcu_pointer *pointer, memory_order order)
157 {
158     void *value;
159     atomic_read_explicit(&CONST_CAST(struct ovsrcu_pointer *, pointer)->p,
160                          &value, order);
161     return value;
162 }
163 #define ovsrcu_get(TYPE, VAR) \
164     CONST_CAST(TYPE, ovsrcu_get__(VAR, memory_order_consume))
165 #define ovsrcu_get_protected(TYPE, VAR) \
166     CONST_CAST(TYPE, ovsrcu_get__(VAR, memory_order_relaxed))
167
168 static inline void ovsrcu_set__(struct ovsrcu_pointer *pointer,
169                                 const void *value,
170                                 memory_order order)
171 {
172     atomic_store_explicit(&pointer->p, CONST_CAST(void *, value), order);
173 }
174 #endif
175
176 /* Writes VALUE to the RCU-protected pointer whose address is VAR.
177  *
178  * Users require external synchronization (e.g. a mutex).  See "Usage" above
179  * for an example. */
180 #define ovsrcu_set(VAR, VALUE) \
181     ovsrcu_set__(VAR, VALUE, memory_order_release)
182
183 /* This can be used for initializing RCU pointers before any readers can
184  * see them.  A later ovsrcu_set() needs to make the bigger structure this
185  * is part of visible to the readers. */
186 #define ovsrcu_set_hidden(VAR, VALUE) \
187     ovsrcu_set__(VAR, VALUE, memory_order_relaxed)
188
189 /* This can be used for initializing RCU pointers before any readers are
190  * executing. */
191 #define ovsrcu_init(VAR, VALUE) atomic_init(&(VAR)->p, VALUE)
192
193 /* Calls FUNCTION passing ARG as its pointer-type argument following the next
194  * grace period.  See "Usage" above for example.  */
195 void ovsrcu_postpone__(void (*function)(void *aux), void *aux);
196 #define ovsrcu_postpone(FUNCTION, ARG)                          \
197     ((void) sizeof((FUNCTION)(ARG), 1),                         \
198      (void) sizeof(*(ARG)),                                     \
199      ovsrcu_postpone__((void (*)(void *))(FUNCTION), ARG))
200
201 /* Quiescent states. */
202 void ovsrcu_quiesce_start(void);
203 void ovsrcu_quiesce_end(void);
204 void ovsrcu_quiesce(void);
205 bool ovsrcu_is_quiescent(void);
206
207 /* Synchronization.  Waits for all non-quiescent threads to quiesce at least
208  * once.  This can block for a relatively long time. */
209 void ovsrcu_synchronize(void);
210
211 #endif /* ovs-rcu.h */