ceph: using hash value to compose dentry offset

[cascardo/linux.git] / fs / ceph / inode.c
diff --git a/fs/ceph/inode.c b/fs/ceph/inode.c

index ed58b16..f51b6fd 100644 (file)
--- a/fs/ceph/inode.c
+++ b/fs/ceph/inode.c
@@ -1308,12 +1308,13 @@ static int readdir_prepopulate_inodes_only(struct ceph_mds_request *req,
         int i, err = 0;
  
         for (i = 0; i < rinfo->dir_nr; i++) {
+               struct ceph_mds_reply_dir_entry *rde = rinfo->dir_entries + i;
                 struct ceph_vino vino;
                 struct inode *in;
                 int rc;
  
-               vino.ino = le64_to_cpu(rinfo->dir_in[i].in->ino);
-               vino.snap = le64_to_cpu(rinfo->dir_in[i].in->snapid);
+               vino.ino = le64_to_cpu(rde->inode.in->ino);
+               vino.snap = le64_to_cpu(rde->inode.in->snapid);
  
                 in = ceph_get_inode(req->r_dentry->d_sb, vino);
                 if (IS_ERR(in)) {
@@ -1321,7 +1322,7 @@ static int readdir_prepopulate_inodes_only(struct ceph_mds_request *req,
                         dout("new_inode badness got %d\n", err);
                         continue;
                 }
-               rc = fill_inode(in, NULL, &rinfo->dir_in[i], NULL, session,
+               rc = fill_inode(in, NULL, &rde->inode, NULL, session,
                                 req->r_request_started, -1,
                                 &req->r_caps_reservation);
                 if (rc < 0) {
@@ -1338,7 +1339,7 @@ void ceph_readdir_cache_release(struct ceph_readdir_cache_control *ctl)
  {
         if (ctl->page) {
                 kunmap(ctl->page);
-               page_cache_release(ctl->page);
+               put_page(ctl->page);
                 ctl->page = NULL;
         }
  }
@@ -1348,7 +1349,7 @@ static int fill_readdir_cache(struct inode *dir, struct dentry *dn,
                               struct ceph_mds_request *req)
  {
         struct ceph_inode_info *ci = ceph_inode(dir);
-       unsigned nsize = PAGE_CACHE_SIZE / sizeof(struct dentry*);
+       unsigned nsize = PAGE_SIZE / sizeof(struct dentry*);
         unsigned idx = ctl->index % nsize;
         pgoff_t pgoff = ctl->index / nsize;
  
@@ -1367,7 +1368,7 @@ static int fill_readdir_cache(struct inode *dir, struct dentry *dn,
                 unlock_page(ctl->page);
                 ctl->dentries = kmap(ctl->page);
                 if (idx == 0)
-                       memset(ctl->dentries, 0, PAGE_CACHE_SIZE);
+                       memset(ctl->dentries, 0, PAGE_SIZE);
         }
  
         if (req->r_dir_release_cnt == atomic64_read(&ci->i_release_count) &&
@@ -1386,6 +1387,7 @@ int ceph_readdir_prepopulate(struct ceph_mds_request *req,
                              struct ceph_mds_session *session)
  {
         struct dentry *parent = req->r_dentry;
+       struct ceph_inode_info *ci = ceph_inode(d_inode(parent));
         struct ceph_mds_reply_info_parsed *rinfo = &req->r_reply_info;
         struct qstr dname;
         struct dentry *dn;
@@ -1393,22 +1395,27 @@ int ceph_readdir_prepopulate(struct ceph_mds_request *req,
         int err = 0, skipped = 0, ret, i;
         struct inode *snapdir = NULL;
         struct ceph_mds_request_head *rhead = req->r_request->front.iov_base;
-       struct ceph_dentry_info *di;
         u32 frag = le32_to_cpu(rhead->args.readdir.frag);
+       u32 last_hash = 0;
+       u32 fpos_offset;
         struct ceph_readdir_cache_control cache_ctl = {};
  
         if (req->r_aborted)
                 return readdir_prepopulate_inodes_only(req, session);
  
+       if (rinfo->hash_order && req->r_path2) {
+               last_hash = ceph_str_hash(ci->i_dir_layout.dl_dir_hash,
+                                         req->r_path2, strlen(req->r_path2));
+               last_hash = ceph_frag_value(last_hash);
+       }
+
         if (rinfo->dir_dir &&
             le32_to_cpu(rinfo->dir_dir->frag) != frag) {
                 dout("readdir_prepopulate got new frag %x -> %x\n",
                      frag, le32_to_cpu(rinfo->dir_dir->frag));
                 frag = le32_to_cpu(rinfo->dir_dir->frag);
-               if (ceph_frag_is_leftmost(frag))
+               if (!rinfo->hash_order)
                         req->r_readdir_offset = 2;
-               else
-                       req->r_readdir_offset = 0;
         }
  
         if (le32_to_cpu(rinfo->head->op) == CEPH_MDS_OP_LSSNAP) {
@@ -1426,24 +1433,37 @@ int ceph_readdir_prepopulate(struct ceph_mds_request *req,
         if (ceph_frag_is_leftmost(frag) && req->r_readdir_offset == 2) {
                 /* note dir version at start of readdir so we can tell
                  * if any dentries get dropped */
-               struct ceph_inode_info *ci = ceph_inode(d_inode(parent));
                 req->r_dir_release_cnt = atomic64_read(&ci->i_release_count);
                 req->r_dir_ordered_cnt = atomic64_read(&ci->i_ordered_count);
                 req->r_readdir_cache_idx = 0;
         }
  
         cache_ctl.index = req->r_readdir_cache_idx;
+       fpos_offset = req->r_readdir_offset;
  
         /* FIXME: release caps/leases if error occurs */
         for (i = 0; i < rinfo->dir_nr; i++) {
+               struct ceph_mds_reply_dir_entry *rde = rinfo->dir_entries + i;
                 struct ceph_vino vino;
  
-               dname.name = rinfo->dir_dname[i];
-               dname.len = rinfo->dir_dname_len[i];
+               dname.name = rde->name;
+               dname.len = rde->name_len;
                 dname.hash = full_name_hash(dname.name, dname.len);
  
-               vino.ino = le64_to_cpu(rinfo->dir_in[i].in->ino);
-               vino.snap = le64_to_cpu(rinfo->dir_in[i].in->snapid);
+               vino.ino = le64_to_cpu(rde->inode.in->ino);
+               vino.snap = le64_to_cpu(rde->inode.in->snapid);
+
+               if (rinfo->hash_order) {
+                       u32 hash = ceph_str_hash(ci->i_dir_layout.dl_dir_hash,
+                                                rde->name, rde->name_len);
+                       hash = ceph_frag_value(hash);
+                       if (hash != last_hash)
+                               fpos_offset = 2;
+                       last_hash = hash;
+                       rde->offset = ceph_make_fpos(hash, fpos_offset++, true);
+               } else {
+                       rde->offset = ceph_make_fpos(frag, fpos_offset++, false);
+               }
  
  retry_lookup:
                 dn = d_lookup(parent, &dname);
@@ -1489,7 +1509,7 @@ retry_lookup:
                         }
                 }
  
-               ret = fill_inode(in, NULL, &rinfo->dir_in[i], NULL, session,
+               ret = fill_inode(in, NULL, &rde->inode, NULL, session,
                                  req->r_request_started, -1,
                                  &req->r_caps_reservation);
                 if (ret < 0) {
@@ -1522,11 +1542,9 @@ retry_lookup:
                         dn = realdn;
                 }
  
-               di = dn->d_fsdata;
-               di->offset = ceph_make_fpos(frag, i + req->r_readdir_offset);
+               ceph_dentry(dn)->offset = rde->offset;
  
-               update_dentry_lease(dn, rinfo->dir_dlease[i],
-                                   req->r_session,
+               update_dentry_lease(dn, rde->lease, req->r_session,
                                     req->r_request_started);
  
                 if (err == 0 && skipped == 0 && cache_ctl.index >= 0) {
@@ -1623,10 +1641,21 @@ static void ceph_invalidate_work(struct work_struct *work)
         struct ceph_inode_info *ci = container_of(work, struct ceph_inode_info,
                                                   i_pg_inv_work);
         struct inode *inode = &ci->vfs_inode;
+       struct ceph_fs_client *fsc = ceph_inode_to_client(inode);
         u32 orig_gen;
         int check = 0;
  
         mutex_lock(&ci->i_truncate_mutex);
+
+       if (ACCESS_ONCE(fsc->mount_state) == CEPH_MOUNT_SHUTDOWN) {
+               pr_warn_ratelimited("invalidate_pages %p %lld forced umount\n",
+                                   inode, ceph_ino(inode));
+               mapping_set_error(inode->i_mapping, -EIO);
+               truncate_pagecache(inode, 0);
+               mutex_unlock(&ci->i_truncate_mutex);
+               goto out;
+       }
+
         spin_lock(&ci->i_ceph_lock);
         dout("invalidate_pages %p gen %d revoking %d\n", inode,
              ci->i_rdcache_gen, ci->i_rdcache_revoking);