nfsd: call state init and shutdown twice
[cascardo/linux.git] / fs / nfsd / nfssvc.c
1 /*
2  * Central processing for nfsd.
3  *
4  * Authors:     Olaf Kirch (okir@monad.swb.de)
5  *
6  * Copyright (C) 1995, 1996, 1997 Olaf Kirch <okir@monad.swb.de>
7  */
8
9 #include <linux/sched.h>
10 #include <linux/freezer.h>
11 #include <linux/module.h>
12 #include <linux/fs_struct.h>
13 #include <linux/swap.h>
14 #include <linux/nsproxy.h>
15
16 #include <linux/sunrpc/stats.h>
17 #include <linux/sunrpc/svcsock.h>
18 #include <linux/lockd/bind.h>
19 #include <linux/nfsacl.h>
20 #include <linux/seq_file.h>
21 #include <net/net_namespace.h>
22 #include "nfsd.h"
23 #include "cache.h"
24 #include "vfs.h"
25
26 #define NFSDDBG_FACILITY        NFSDDBG_SVC
27
28 extern struct svc_program       nfsd_program;
29 static int                      nfsd(void *vrqstp);
30 struct timeval                  nfssvc_boot;
31
32 /*
33  * nfsd_mutex protects nfsd_serv -- both the pointer itself and the members
34  * of the svc_serv struct. In particular, ->sv_nrthreads but also to some
35  * extent ->sv_temp_socks and ->sv_permsocks. It also protects nfsdstats.th_cnt
36  *
37  * If (out side the lock) nfsd_serv is non-NULL, then it must point to a
38  * properly initialised 'struct svc_serv' with ->sv_nrthreads > 0. That number
39  * of nfsd threads must exist and each must listed in ->sp_all_threads in each
40  * entry of ->sv_pools[].
41  *
42  * Transitions of the thread count between zero and non-zero are of particular
43  * interest since the svc_serv needs to be created and initialized at that
44  * point, or freed.
45  *
46  * Finally, the nfsd_mutex also protects some of the global variables that are
47  * accessed when nfsd starts and that are settable via the write_* routines in
48  * nfsctl.c. In particular:
49  *
50  *      user_recovery_dirname
51  *      user_lease_time
52  *      nfsd_versions
53  */
54 DEFINE_MUTEX(nfsd_mutex);
55 struct svc_serv                 *nfsd_serv;
56
57 /*
58  * nfsd_drc_lock protects nfsd_drc_max_pages and nfsd_drc_pages_used.
59  * nfsd_drc_max_pages limits the total amount of memory available for
60  * version 4.1 DRC caches.
61  * nfsd_drc_pages_used tracks the current version 4.1 DRC memory usage.
62  */
63 spinlock_t      nfsd_drc_lock;
64 unsigned int    nfsd_drc_max_mem;
65 unsigned int    nfsd_drc_mem_used;
66
67 #if defined(CONFIG_NFSD_V2_ACL) || defined(CONFIG_NFSD_V3_ACL)
68 static struct svc_stat  nfsd_acl_svcstats;
69 static struct svc_version *     nfsd_acl_version[] = {
70         [2] = &nfsd_acl_version2,
71         [3] = &nfsd_acl_version3,
72 };
73
74 #define NFSD_ACL_MINVERS            2
75 #define NFSD_ACL_NRVERS         ARRAY_SIZE(nfsd_acl_version)
76 static struct svc_version *nfsd_acl_versions[NFSD_ACL_NRVERS];
77
78 static struct svc_program       nfsd_acl_program = {
79         .pg_prog                = NFS_ACL_PROGRAM,
80         .pg_nvers               = NFSD_ACL_NRVERS,
81         .pg_vers                = nfsd_acl_versions,
82         .pg_name                = "nfsacl",
83         .pg_class               = "nfsd",
84         .pg_stats               = &nfsd_acl_svcstats,
85         .pg_authenticate        = &svc_set_client,
86 };
87
88 static struct svc_stat  nfsd_acl_svcstats = {
89         .program        = &nfsd_acl_program,
90 };
91 #endif /* defined(CONFIG_NFSD_V2_ACL) || defined(CONFIG_NFSD_V3_ACL) */
92
93 static struct svc_version *     nfsd_version[] = {
94         [2] = &nfsd_version2,
95 #if defined(CONFIG_NFSD_V3)
96         [3] = &nfsd_version3,
97 #endif
98 #if defined(CONFIG_NFSD_V4)
99         [4] = &nfsd_version4,
100 #endif
101 };
102
103 #define NFSD_MINVERS            2
104 #define NFSD_NRVERS             ARRAY_SIZE(nfsd_version)
105 static struct svc_version *nfsd_versions[NFSD_NRVERS];
106
107 struct svc_program              nfsd_program = {
108 #if defined(CONFIG_NFSD_V2_ACL) || defined(CONFIG_NFSD_V3_ACL)
109         .pg_next                = &nfsd_acl_program,
110 #endif
111         .pg_prog                = NFS_PROGRAM,          /* program number */
112         .pg_nvers               = NFSD_NRVERS,          /* nr of entries in nfsd_version */
113         .pg_vers                = nfsd_versions,        /* version table */
114         .pg_name                = "nfsd",               /* program name */
115         .pg_class               = "nfsd",               /* authentication class */
116         .pg_stats               = &nfsd_svcstats,       /* version table */
117         .pg_authenticate        = &svc_set_client,      /* export authentication */
118
119 };
120
121 u32 nfsd_supported_minorversion;
122
123 int nfsd_vers(int vers, enum vers_op change)
124 {
125         if (vers < NFSD_MINVERS || vers >= NFSD_NRVERS)
126                 return 0;
127         switch(change) {
128         case NFSD_SET:
129                 nfsd_versions[vers] = nfsd_version[vers];
130 #if defined(CONFIG_NFSD_V2_ACL) || defined(CONFIG_NFSD_V3_ACL)
131                 if (vers < NFSD_ACL_NRVERS)
132                         nfsd_acl_versions[vers] = nfsd_acl_version[vers];
133 #endif
134                 break;
135         case NFSD_CLEAR:
136                 nfsd_versions[vers] = NULL;
137 #if defined(CONFIG_NFSD_V2_ACL) || defined(CONFIG_NFSD_V3_ACL)
138                 if (vers < NFSD_ACL_NRVERS)
139                         nfsd_acl_versions[vers] = NULL;
140 #endif
141                 break;
142         case NFSD_TEST:
143                 return nfsd_versions[vers] != NULL;
144         case NFSD_AVAIL:
145                 return nfsd_version[vers] != NULL;
146         }
147         return 0;
148 }
149
150 int nfsd_minorversion(u32 minorversion, enum vers_op change)
151 {
152         if (minorversion > NFSD_SUPPORTED_MINOR_VERSION)
153                 return -1;
154         switch(change) {
155         case NFSD_SET:
156                 nfsd_supported_minorversion = minorversion;
157                 break;
158         case NFSD_CLEAR:
159                 if (minorversion == 0)
160                         return -1;
161                 nfsd_supported_minorversion = minorversion - 1;
162                 break;
163         case NFSD_TEST:
164                 return minorversion <= nfsd_supported_minorversion;
165         case NFSD_AVAIL:
166                 return minorversion <= NFSD_SUPPORTED_MINOR_VERSION;
167         }
168         return 0;
169 }
170
171 /*
172  * Maximum number of nfsd processes
173  */
174 #define NFSD_MAXSERVS           8192
175
176 int nfsd_nrthreads(void)
177 {
178         int rv = 0;
179         mutex_lock(&nfsd_mutex);
180         if (nfsd_serv)
181                 rv = nfsd_serv->sv_nrthreads;
182         mutex_unlock(&nfsd_mutex);
183         return rv;
184 }
185
186 static int nfsd_init_socks(void)
187 {
188         int error;
189         if (!list_empty(&nfsd_serv->sv_permsocks))
190                 return 0;
191
192         error = svc_create_xprt(nfsd_serv, "udp", &init_net, PF_INET, NFS_PORT,
193                                         SVC_SOCK_DEFAULTS);
194         if (error < 0)
195                 return error;
196
197         error = svc_create_xprt(nfsd_serv, "tcp", &init_net, PF_INET, NFS_PORT,
198                                         SVC_SOCK_DEFAULTS);
199         if (error < 0)
200                 return error;
201
202         return 0;
203 }
204
205 static bool nfsd_up = false;
206
207 static int nfsd_startup(int nrservs)
208 {
209         int ret;
210         struct net *net = &init_net;
211
212         if (nfsd_up)
213                 return 0;
214         /*
215          * Readahead param cache - will no-op if it already exists.
216          * (Note therefore results will be suboptimal if number of
217          * threads is modified after nfsd start.)
218          */
219         ret = nfsd_racache_init(2*nrservs);
220         if (ret)
221                 return ret;
222         ret = nfsd_init_socks();
223         if (ret)
224                 goto out_racache;
225         ret = lockd_up(net);
226         if (ret)
227                 goto out_racache;
228         ret = nfs4_state_start();
229         if (ret)
230                 goto out_lockd;
231
232         ret = nfs4_state_start_net(net);
233         if (ret)
234                 goto out_net_state;
235
236         nfsd_up = true;
237         return 0;
238 out_net_state:
239         nfs4_state_shutdown();
240 out_lockd:
241         lockd_down(&init_net);
242 out_racache:
243         nfsd_racache_shutdown();
244         return ret;
245 }
246
247 static void nfsd_shutdown(void)
248 {
249         struct net *net = &init_net;
250
251         /*
252          * write_ports can create the server without actually starting
253          * any threads--if we get shut down before any threads are
254          * started, then nfsd_last_thread will be run before any of this
255          * other initialization has been done.
256          */
257         if (!nfsd_up)
258                 return;
259         nfs4_state_shutdown_net(net);
260         nfs4_state_shutdown();
261         lockd_down(net);
262         nfsd_racache_shutdown();
263         nfsd_up = false;
264 }
265
266 static void nfsd_last_thread(struct svc_serv *serv, struct net *net)
267 {
268         nfsd_shutdown();
269
270         svc_rpcb_cleanup(serv, net);
271
272         printk(KERN_WARNING "nfsd: last server has exited, flushing export "
273                             "cache\n");
274         nfsd_export_flush(net);
275 }
276
277 void nfsd_reset_versions(void)
278 {
279         int found_one = 0;
280         int i;
281
282         for (i = NFSD_MINVERS; i < NFSD_NRVERS; i++) {
283                 if (nfsd_program.pg_vers[i])
284                         found_one = 1;
285         }
286
287         if (!found_one) {
288                 for (i = NFSD_MINVERS; i < NFSD_NRVERS; i++)
289                         nfsd_program.pg_vers[i] = nfsd_version[i];
290 #if defined(CONFIG_NFSD_V2_ACL) || defined(CONFIG_NFSD_V3_ACL)
291                 for (i = NFSD_ACL_MINVERS; i < NFSD_ACL_NRVERS; i++)
292                         nfsd_acl_program.pg_vers[i] =
293                                 nfsd_acl_version[i];
294 #endif
295         }
296 }
297
298 /*
299  * Each session guarantees a negotiated per slot memory cache for replies
300  * which in turn consumes memory beyond the v2/v3/v4.0 server. A dedicated
301  * NFSv4.1 server might want to use more memory for a DRC than a machine
302  * with mutiple services.
303  *
304  * Impose a hard limit on the number of pages for the DRC which varies
305  * according to the machines free pages. This is of course only a default.
306  *
307  * For now this is a #defined shift which could be under admin control
308  * in the future.
309  */
310 static void set_max_drc(void)
311 {
312         #define NFSD_DRC_SIZE_SHIFT     10
313         nfsd_drc_max_mem = (nr_free_buffer_pages()
314                                         >> NFSD_DRC_SIZE_SHIFT) * PAGE_SIZE;
315         nfsd_drc_mem_used = 0;
316         spin_lock_init(&nfsd_drc_lock);
317         dprintk("%s nfsd_drc_max_mem %u \n", __func__, nfsd_drc_max_mem);
318 }
319
320 static int nfsd_get_default_max_blksize(void)
321 {
322         struct sysinfo i;
323         unsigned long long target;
324         unsigned long ret;
325
326         si_meminfo(&i);
327         target = (i.totalram - i.totalhigh) << PAGE_SHIFT;
328         /*
329          * Aim for 1/4096 of memory per thread This gives 1MB on 4Gig
330          * machines, but only uses 32K on 128M machines.  Bottom out at
331          * 8K on 32M and smaller.  Of course, this is only a default.
332          */
333         target >>= 12;
334
335         ret = NFSSVC_MAXBLKSIZE;
336         while (ret > target && ret >= 8*1024*2)
337                 ret /= 2;
338         return ret;
339 }
340
341 int nfsd_create_serv(void)
342 {
343         int error;
344         struct net *net = current->nsproxy->net_ns;
345
346         WARN_ON(!mutex_is_locked(&nfsd_mutex));
347         if (nfsd_serv) {
348                 svc_get(nfsd_serv);
349                 return 0;
350         }
351         if (nfsd_max_blksize == 0)
352                 nfsd_max_blksize = nfsd_get_default_max_blksize();
353         nfsd_reset_versions();
354         nfsd_serv = svc_create_pooled(&nfsd_program, nfsd_max_blksize,
355                                       nfsd_last_thread, nfsd, THIS_MODULE);
356         if (nfsd_serv == NULL)
357                 return -ENOMEM;
358
359         error = svc_bind(nfsd_serv, net);
360         if (error < 0) {
361                 svc_destroy(nfsd_serv);
362                 return error;
363         }
364
365         set_max_drc();
366         do_gettimeofday(&nfssvc_boot);          /* record boot time */
367         return 0;
368 }
369
370 int nfsd_nrpools(void)
371 {
372         if (nfsd_serv == NULL)
373                 return 0;
374         else
375                 return nfsd_serv->sv_nrpools;
376 }
377
378 int nfsd_get_nrthreads(int n, int *nthreads)
379 {
380         int i = 0;
381
382         if (nfsd_serv != NULL) {
383                 for (i = 0; i < nfsd_serv->sv_nrpools && i < n; i++)
384                         nthreads[i] = nfsd_serv->sv_pools[i].sp_nrthreads;
385         }
386
387         return 0;
388 }
389
390 int nfsd_set_nrthreads(int n, int *nthreads)
391 {
392         int i = 0;
393         int tot = 0;
394         int err = 0;
395         struct net *net = &init_net;
396
397         WARN_ON(!mutex_is_locked(&nfsd_mutex));
398
399         if (nfsd_serv == NULL || n <= 0)
400                 return 0;
401
402         if (n > nfsd_serv->sv_nrpools)
403                 n = nfsd_serv->sv_nrpools;
404
405         /* enforce a global maximum number of threads */
406         tot = 0;
407         for (i = 0; i < n; i++) {
408                 if (nthreads[i] > NFSD_MAXSERVS)
409                         nthreads[i] = NFSD_MAXSERVS;
410                 tot += nthreads[i];
411         }
412         if (tot > NFSD_MAXSERVS) {
413                 /* total too large: scale down requested numbers */
414                 for (i = 0; i < n && tot > 0; i++) {
415                         int new = nthreads[i] * NFSD_MAXSERVS / tot;
416                         tot -= (nthreads[i] - new);
417                         nthreads[i] = new;
418                 }
419                 for (i = 0; i < n && tot > 0; i++) {
420                         nthreads[i]--;
421                         tot--;
422                 }
423         }
424
425         /*
426          * There must always be a thread in pool 0; the admin
427          * can't shut down NFS completely using pool_threads.
428          */
429         if (nthreads[0] == 0)
430                 nthreads[0] = 1;
431
432         /* apply the new numbers */
433         svc_get(nfsd_serv);
434         for (i = 0; i < n; i++) {
435                 err = svc_set_num_threads(nfsd_serv, &nfsd_serv->sv_pools[i],
436                                           nthreads[i]);
437                 if (err)
438                         break;
439         }
440         nfsd_destroy(net);
441         return err;
442 }
443
444 /*
445  * Adjust the number of threads and return the new number of threads.
446  * This is also the function that starts the server if necessary, if
447  * this is the first time nrservs is nonzero.
448  */
449 int
450 nfsd_svc(int nrservs)
451 {
452         int     error;
453         bool    nfsd_up_before;
454         struct net *net = &init_net;
455
456         mutex_lock(&nfsd_mutex);
457         dprintk("nfsd: creating service\n");
458         if (nrservs <= 0)
459                 nrservs = 0;
460         if (nrservs > NFSD_MAXSERVS)
461                 nrservs = NFSD_MAXSERVS;
462         error = 0;
463         if (nrservs == 0 && nfsd_serv == NULL)
464                 goto out;
465
466         error = nfsd_create_serv();
467         if (error)
468                 goto out;
469
470         nfsd_up_before = nfsd_up;
471
472         error = nfsd_startup(nrservs);
473         if (error)
474                 goto out_destroy;
475         error = svc_set_num_threads(nfsd_serv, NULL, nrservs);
476         if (error)
477                 goto out_shutdown;
478         /* We are holding a reference to nfsd_serv which
479          * we don't want to count in the return value,
480          * so subtract 1
481          */
482         error = nfsd_serv->sv_nrthreads - 1;
483 out_shutdown:
484         if (error < 0 && !nfsd_up_before)
485                 nfsd_shutdown();
486 out_destroy:
487         nfsd_destroy(net);              /* Release server */
488 out:
489         mutex_unlock(&nfsd_mutex);
490         return error;
491 }
492
493
494 /*
495  * This is the NFS server kernel thread
496  */
497 static int
498 nfsd(void *vrqstp)
499 {
500         struct svc_rqst *rqstp = (struct svc_rqst *) vrqstp;
501         int err;
502
503         /* Lock module and set up kernel thread */
504         mutex_lock(&nfsd_mutex);
505
506         /* At this point, the thread shares current->fs
507          * with the init process. We need to create files with a
508          * umask of 0 instead of init's umask. */
509         if (unshare_fs_struct() < 0) {
510                 printk("Unable to start nfsd thread: out of memory\n");
511                 goto out;
512         }
513
514         current->fs->umask = 0;
515
516         /*
517          * thread is spawned with all signals set to SIG_IGN, re-enable
518          * the ones that will bring down the thread
519          */
520         allow_signal(SIGKILL);
521         allow_signal(SIGHUP);
522         allow_signal(SIGINT);
523         allow_signal(SIGQUIT);
524
525         nfsdstats.th_cnt++;
526         mutex_unlock(&nfsd_mutex);
527
528         /*
529          * We want less throttling in balance_dirty_pages() so that nfs to
530          * localhost doesn't cause nfsd to lock up due to all the client's
531          * dirty pages.
532          */
533         current->flags |= PF_LESS_THROTTLE;
534         set_freezable();
535
536         /*
537          * The main request loop
538          */
539         for (;;) {
540                 /*
541                  * Find a socket with data available and call its
542                  * recvfrom routine.
543                  */
544                 while ((err = svc_recv(rqstp, 60*60*HZ)) == -EAGAIN)
545                         ;
546                 if (err == -EINTR)
547                         break;
548                 validate_process_creds();
549                 svc_process(rqstp);
550                 validate_process_creds();
551         }
552
553         /* Clear signals before calling svc_exit_thread() */
554         flush_signals(current);
555
556         mutex_lock(&nfsd_mutex);
557         nfsdstats.th_cnt --;
558
559 out:
560         rqstp->rq_server = NULL;
561
562         /* Release the thread */
563         svc_exit_thread(rqstp);
564
565         nfsd_destroy(&init_net);
566
567         /* Release module */
568         mutex_unlock(&nfsd_mutex);
569         module_put_and_exit(0);
570         return 0;
571 }
572
573 static __be32 map_new_errors(u32 vers, __be32 nfserr)
574 {
575         if (nfserr == nfserr_jukebox && vers == 2)
576                 return nfserr_dropit;
577         if (nfserr == nfserr_wrongsec && vers < 4)
578                 return nfserr_acces;
579         return nfserr;
580 }
581
582 int
583 nfsd_dispatch(struct svc_rqst *rqstp, __be32 *statp)
584 {
585         struct svc_procedure    *proc;
586         kxdrproc_t              xdr;
587         __be32                  nfserr;
588         __be32                  *nfserrp;
589
590         dprintk("nfsd_dispatch: vers %d proc %d\n",
591                                 rqstp->rq_vers, rqstp->rq_proc);
592         proc = rqstp->rq_procinfo;
593
594         /*
595          * Give the xdr decoder a chance to change this if it wants
596          * (necessary in the NFSv4.0 compound case)
597          */
598         rqstp->rq_cachetype = proc->pc_cachetype;
599         /* Decode arguments */
600         xdr = proc->pc_decode;
601         if (xdr && !xdr(rqstp, (__be32*)rqstp->rq_arg.head[0].iov_base,
602                         rqstp->rq_argp)) {
603                 dprintk("nfsd: failed to decode arguments!\n");
604                 *statp = rpc_garbage_args;
605                 return 1;
606         }
607
608         /* Check whether we have this call in the cache. */
609         switch (nfsd_cache_lookup(rqstp)) {
610         case RC_INTR:
611         case RC_DROPIT:
612                 return 0;
613         case RC_REPLY:
614                 return 1;
615         case RC_DOIT:;
616                 /* do it */
617         }
618
619         /* need to grab the location to store the status, as
620          * nfsv4 does some encoding while processing 
621          */
622         nfserrp = rqstp->rq_res.head[0].iov_base
623                 + rqstp->rq_res.head[0].iov_len;
624         rqstp->rq_res.head[0].iov_len += sizeof(__be32);
625
626         /* Now call the procedure handler, and encode NFS status. */
627         nfserr = proc->pc_func(rqstp, rqstp->rq_argp, rqstp->rq_resp);
628         nfserr = map_new_errors(rqstp->rq_vers, nfserr);
629         if (nfserr == nfserr_dropit || rqstp->rq_dropme) {
630                 dprintk("nfsd: Dropping request; may be revisited later\n");
631                 nfsd_cache_update(rqstp, RC_NOCACHE, NULL);
632                 return 0;
633         }
634
635         if (rqstp->rq_proc != 0)
636                 *nfserrp++ = nfserr;
637
638         /* Encode result.
639          * For NFSv2, additional info is never returned in case of an error.
640          */
641         if (!(nfserr && rqstp->rq_vers == 2)) {
642                 xdr = proc->pc_encode;
643                 if (xdr && !xdr(rqstp, nfserrp,
644                                 rqstp->rq_resp)) {
645                         /* Failed to encode result. Release cache entry */
646                         dprintk("nfsd: failed to encode result!\n");
647                         nfsd_cache_update(rqstp, RC_NOCACHE, NULL);
648                         *statp = rpc_system_err;
649                         return 1;
650                 }
651         }
652
653         /* Store reply in cache. */
654         nfsd_cache_update(rqstp, rqstp->rq_cachetype, statp + 1);
655         return 1;
656 }
657
658 int nfsd_pool_stats_open(struct inode *inode, struct file *file)
659 {
660         int ret;
661         mutex_lock(&nfsd_mutex);
662         if (nfsd_serv == NULL) {
663                 mutex_unlock(&nfsd_mutex);
664                 return -ENODEV;
665         }
666         /* bump up the psudo refcount while traversing */
667         svc_get(nfsd_serv);
668         ret = svc_pool_stats_open(nfsd_serv, file);
669         mutex_unlock(&nfsd_mutex);
670         return ret;
671 }
672
673 int nfsd_pool_stats_release(struct inode *inode, struct file *file)
674 {
675         int ret = seq_release(inode, file);
676         struct net *net = &init_net;
677
678         mutex_lock(&nfsd_mutex);
679         /* this function really, really should have been called svc_put() */
680         nfsd_destroy(net);
681         mutex_unlock(&nfsd_mutex);
682         return ret;
683 }