Sorted out proc refcounting with ARCs
[akaros.git] / kern / src / kfs.c
index 7e0eab0..71fed7f 100644 (file)
@@ -24,6 +24,7 @@
 #include <error.h>
 #include <cpio.h>
 #include <pmap.h>
+#include <smp.h>
 
 #define KFS_MAX_FILE_SIZE 1024*1024*128
 #define KFS_MAGIC 0xdead0001
@@ -57,8 +58,8 @@ static void kfs_init(void)
                                         __alignof__(struct kfs_i_info), 0, 0, 0);
 }
 
-/* Creates the SB (normally would read in from disc and create).  Ups the refcnt
- * for whoever consumes this.  Returns 0 on failure.
+/* Creates the SB (normally would read in from disc and create).  Passes it's
+ * ref out to whoever consumes this.  Returns 0 on failure.
  * TODO: consider pulling out more of the FS-independent stuff, if possible.
  * There are only two things, but the pain in the ass is that you'd need to read
  * the disc to get that first inode, and it's a FS-specific thing. */
@@ -119,7 +120,8 @@ struct fs_type kfs_fs_type = {"KFS", 0, kfs_get_sb, kfs_kill_sb, {0, 0},
 int kfs_readpage(struct file *file, struct page *page)
 {
        size_t pg_idx_byte = page->pg_index * PGSIZE;
-       struct kfs_i_info *k_i_info = (struct kfs_i_info*)file->f_inode->i_fs_info;
+       struct kfs_i_info *k_i_info = (struct kfs_i_info*)
+                                     file->f_dentry->d_inode->i_fs_info;
        uintptr_t begin = (size_t)k_i_info->filestart + pg_idx_byte;
        /* If we're beyond the initial start point, we just need a zero page.  This
         * is for a hole or for extending a file (even though it won't be saved).
@@ -148,40 +150,21 @@ int kfs_readpage(struct file *file, struct page *page)
  * an inode that is already on disk, or it can be used when creating. */
 struct inode *kfs_alloc_inode(struct super_block *sb)
 {
-       /* arguably, we can avoid some of this init by using the slab/cache */
        struct inode *inode = kmem_cache_alloc(inode_kcache, 0);
        memset(inode, 0, sizeof(struct inode));
-       TAILQ_INSERT_HEAD(&sb->s_inodes, inode, i_sb_list);
-       TAILQ_INIT(&inode->i_dentry);
-       inode->i_ino = 0;                                       /* set by caller later */
-       atomic_set(&inode->i_refcnt, 1);
-       inode->i_blksize = 1;                           /* keep in sync with get_sb() */
-       spinlock_init(&inode->i_lock);
        inode->i_op = &kfs_i_op;
        inode->i_fop = &kfs_f_op;
-       inode->i_sb = sb;
-       inode->i_state = 0;                                     /* need real states, want I_NEW */
-       inode->dirtied_when = 0;
-       atomic_set(&inode->i_writecount, 0);
+       inode->i_pm.pm_op = &kfs_pm_op;
        inode->i_fs_info = kmem_cache_alloc(kfs_i_kcache, 0);
        TAILQ_INIT(&((struct kfs_i_info*)inode->i_fs_info)->children);
        ((struct kfs_i_info*)inode->i_fs_info)->filestart = 0;
-       /* Set up the page_map structures.  Default is to use the embedded one. */
-       inode->i_mapping = &inode->i_pm;
-       inode->i_mapping->pm_host = inode;
-       radix_tree_init(&inode->i_mapping->pm_tree);
-       spinlock_init(&inode->i_mapping->pm_tree_lock);
-       inode->i_mapping->pm_op = &kfs_pm_op;
-       inode->i_mapping->pm_flags = 0;
        return inode;
-       /* caller sets i_ino, i_list set when applicable */
 }
 
 /* deallocs and cleans up after an inode. */
 void kfs_destroy_inode(struct inode *inode)
 {
        kmem_cache_free(kfs_i_kcache, inode->i_fs_info);
-       kmem_cache_free(inode_kcache, inode);
 }
 
 /* reads the inode data on disk specified by inode->i_ino into the inode.
@@ -194,7 +177,7 @@ void kfs_read_inode(struct inode *inode)
        /* TODO: what does it mean to ask for an inode->i_ino that doesn't exist?
         *      possibly a bug, since these inos come from directories */
        if (inode->i_ino == 1) {
-               inode->i_mode = 0x777;                  /* TODO: use something appropriate */
+               inode->i_mode = S_IRWXU | S_IRWXG | S_IRWXO;
                inode->i_type = FS_I_DIR;
                inode->i_nlink = 1;                             /* assuming only one hardlink */
                inode->i_uid = 0;
@@ -281,48 +264,14 @@ void kfs_umount_begin(struct super_block *sb)
 
 /* inode_operations */
 
-/* Helper op, used when creating regular files (kfs_create()) and when making
- * directories (kfs_mkdir()).  References are a bit ugly.  We're passing out a
- * ref that is already stored/accounted for.  Might change that...  Also, this
- * needs to handle having nd == 0.  Note we make a distinction between the mode
- * and the file type (for now).  The caller of this should set the filetype. */
-struct inode *kfs_create_generic(struct inode *dir, struct dentry *dentry,
-                                 int mode, struct nameidata *nd)
-{
-       /* note it is the i_ino that uniquely identifies a file in the system.
-        * there's a diff between creating an inode (even for an in-use ino) and
-        * then filling it in, and vs creating a brand new one */
-       struct inode *inode = kfs_alloc_inode(dentry->d_sb);
-       dentry->d_inode = inode;                /* inode ref stored here */
-       TAILQ_INSERT_TAIL(&inode->i_dentry, dentry, d_alias); /* stored dentry ref*/
-       atomic_inc(&dentry->d_refcnt);  /* TODO: REF/KREF */
-       /* Need to finish the dentry */
-       dentry->d_op = &kfs_d_op;
-       dentry->d_fs_info = 0;
-       inode->i_mode = mode;
-       inode->i_ino = kfs_get_free_ino();
-       inode->i_nlink = 1;
-       inode->i_size = 0;
-       inode->i_blocks = 0;
-       inode->i_atime.tv_sec = 0;              /* TODO: now! */
-       inode->i_ctime.tv_sec = 0;              /* TODO: now! */
-       inode->i_mtime.tv_sec = 0;              /* TODO: now! */
-       inode->i_atime.tv_nsec = 0;             /* are these supposed to be the extra ns? */
-       inode->i_ctime.tv_nsec = 0;
-       inode->i_mtime.tv_nsec = 0;
-       inode->i_bdev = inode->i_sb->s_bdev;
-       return inode;
-}
-
-/* Create a new disk inode in dir associated with dentry, with the given mode.
- * called when creating a regular file.  dir is the directory/parent.  dentry is
- * the dentry of the inode we are creating. */
+/* Called when creating a new disk inode in dir associated with dentry.  We need
+ * to fill out the i_ino, set the type, and do whatever else we need */
 int kfs_create(struct inode *dir, struct dentry *dentry, int mode,
                struct nameidata *nd)
 {
-       struct inode *inode = kfs_create_generic(dir, dentry, mode, nd);        
-       if (!inode)
-               return -1;
+       struct inode *inode = dentry->d_inode;
+       kref_get(&dentry->d_kref, 1);   /* to pin the dentry in RAM, KFS-style... */
+       inode->i_ino = kfs_get_free_ino();
        inode->i_type = FS_I_FILE;
        /* our parent dentry's inode tracks our dentry info.  We do this
         * since it's all in memory and we aren't using the dcache yet.
@@ -358,12 +307,13 @@ struct dentry *kfs_lookup(struct inode *dir, struct dentry *dentry,
 
        assert(dir_dent && dir_dent == TAILQ_LAST(&dir->i_dentry, dentry_tailq));
        assert(dir->i_type & FS_I_DIR);
-
+       assert(kref_refcnt(&dentry->d_kref) == 1);
        TAILQ_FOREACH(d_i, &dir_dent->d_subdirs, d_subdirs_link) {
                if (!strcmp(d_i->d_name.name, dentry->d_name.name)) {
                        /* since this dentry is already in memory (that's how KFS works), we
                         * can free the one that came in and return the real one */
-                       kmem_cache_free(dentry_kcache, dentry);
+                       kref_put(&dentry->d_kref);
+                       kref_get(&d_i->d_kref, 1);
                        return d_i;
                }
        }
@@ -371,14 +321,15 @@ struct dentry *kfs_lookup(struct inode *dir, struct dentry *dentry,
                if (!strcmp(d_i->d_name.name, dentry->d_name.name)) {
                        /* since this dentry is already in memory (that's how KFS works), we
                         * can free the one that came in and return the real one */
-                       kmem_cache_free(dentry_kcache, dentry);
+                       kref_put(&dentry->d_kref);
+                       kref_get(&d_i->d_kref, 1);
                        return d_i;
                }
        }
        /* no match, consider caching the negative result, freeing the
         * dentry, etc */
        printd("Not Found %s!!\n", dentry->d_name.name);
-       free_dentry(dentry);
+       kref_put(&dentry->d_kref);
        return 0;
 }
 
@@ -403,21 +354,16 @@ int kfs_symlink(struct inode *dir, struct dentry *dentry, const char *symname)
        return -1;
 }
 
-/* Creates a new inode for a directory associated with dentry in dir with the
- * given mode.  Note, we might (later) need to track subdirs within the parent
- * inode, like we do with regular files.  I'd rather not, so we'll see if we
- * need it. */
+/* Called when creating a new inode for a directory associated with dentry in
+ * dir with the given mode.  Note, we might (later) need to track subdirs within
+ * the parent inode, like we do with regular files.  I'd rather not, so we'll
+ * see if we need it. */
 int kfs_mkdir(struct inode *dir, struct dentry *dentry, int mode)
 {
-       struct inode *inode = kfs_create_generic(dir, dentry, mode, 0); 
-       if (!inode)
-               return -1;
-       struct dentry *parent = TAILQ_FIRST(&dir->i_dentry);
-       assert(parent && parent == TAILQ_LAST(&dir->i_dentry, dentry_tailq));
-       inode->i_type = FS_I_DIR;
-       /* parent dentry tracks dentry as a subdir */
-       TAILQ_INSERT_TAIL(&parent->d_subdirs, dentry, d_subdirs_link);
-       atomic_inc(&dentry->d_refcnt);
+       struct inode *inode = dentry->d_inode;
+       kref_get(&dentry->d_kref, 1);   /* to pin the dentry in RAM, KFS-style... */
+       inode->i_ino = kfs_get_free_ino();
+       inode->i_type = FS_I_DIR;               /* this might be FS specific in the future */
        /* get ready to have our own kids */
        TAILQ_INIT(&((struct kfs_i_info*)inode->i_fs_info)->children);
        ((struct kfs_i_info*)inode->i_fs_info)->filestart = 0;
@@ -533,13 +479,16 @@ off_t kfs_llseek(struct file *file, off_t offset, int whence)
                        temp_off = file->f_pos + offset;
                        break;
                case SEEK_END:
-                       temp_off = file->f_inode->i_size + offset;
+                       temp_off = file->f_dentry->d_inode->i_size + offset;
                        break;
                default:
+                       set_errno(EINVAL);
                        warn("Unknown 'whence' in llseek()!\n");
+                       return -1;
        }
-       /* make sure the f_pos isn't outside the limits of the existing file */
-       temp_off = MAX(MIN(temp_off, file->f_inode->i_size), 0);
+       /* make sure the f_pos isn't outside the limits of the existing file.
+        * techincally, if they go too far, we should return EINVAL */
+       temp_off = MAX(MIN(temp_off, file->f_dentry->d_inode->i_size), 0);
        file->f_pos = temp_off;
        return temp_off;
 }
@@ -548,14 +497,14 @@ off_t kfs_llseek(struct file *file, off_t offset, int whence)
  * read and write, there will be issues with userspace and the *dirent buf.
  * TODO: we don't really do anything with userspace concerns here, in part
  * because memcpy_to doesn't work well.  When we fix how we want to handle the
- * userbuffers, we can write this accordingly.  */
+ * userbuffers, we can write this accordingly. (UMEM)  */
 int kfs_readdir(struct file *dir, struct dirent *dirent)
 {
        int count = 0;
        bool found = FALSE;
        struct dentry *subent;
-       struct dentry *dir_d = TAILQ_FIRST(&dir->f_inode->i_dentry);
-       struct kfs_i_info *k_i_info = (struct kfs_i_info*)dir->f_inode->i_fs_info;
+       struct dentry *dir_d = dir->f_dentry;
+       struct kfs_i_info *k_i_info = (struct kfs_i_info*)dir_d->d_inode->i_fs_info;
 
        /* how we check inside the for loops below.  moderately ghetto. */
        void check_entry(void)
@@ -571,8 +520,8 @@ int kfs_readdir(struct file *dir, struct dirent *dirent)
        }
        /* some of this error handling can be done by the VFS.  The syscall should
         * handle EBADF, EFAULT, and EINVAL (TODO, memory related). */
-       if (!(dir->f_inode->i_type & FS_I_DIR)) {
-               set_errno(current_tf, ENOTDIR);
+       if (!(dir_d->d_inode->i_type & FS_I_DIR)) {
+               set_errno(ENOTDIR);
                return -1;
        }
 
@@ -583,7 +532,7 @@ int kfs_readdir(struct file *dir, struct dirent *dirent)
                check_entry();
 
        if (!found) {
-               set_errno(current_tf, ENOENT);
+               set_errno(ENOENT);
                return -1;
        }
        if (count - 1 == dirent->d_off)         /* found the last dir in the list */
@@ -598,34 +547,15 @@ int kfs_readdir(struct file *dir, struct dirent *dirent)
  * the file was opened or the file type. */
 int kfs_mmap(struct file *file, struct vm_region *vmr)
 {
-       if (file->f_inode->i_type & FS_I_FILE)
+       if (file->f_dentry->d_inode->i_type & FS_I_FILE)
                return 0;
        return -1;
 }
 
-/* Opens the file specified by the inode, creating and filling in the file */
-/* TODO: fill out the other // entries, sort vmnt refcnting */
+/* Called by the VFS while opening the file, which corresponds to inode,  for
+ * the FS to do whatever it needs. */
 int kfs_open(struct inode *inode, struct file *file)
 {
-       /* This is mostly FS-agnostic, consider a helper */
-       //file = kmem_cache_alloc(file_kcache, 0); /* done in the VFS */
-       /* Add to the list of all files of this SB */
-       TAILQ_INSERT_TAIL(&inode->i_sb->s_files, file, f_list);
-       file->f_inode = inode;
-       atomic_inc(&inode->i_refcnt);
-       file->f_vfsmnt = inode->i_sb->s_mount;          /* saving a ref to the vmnt...*/
-       file->f_op = &kfs_f_op;
-       atomic_set(&file->f_refcnt, 1);                         /* ref passed out */
-       file->f_flags = inode->i_flags;                         /* just taking the inode vals */
-       file->f_mode = inode->i_mode;
-       file->f_pos = 0;
-       file->f_uid = inode->i_uid;
-       file->f_gid = inode->i_gid;
-       file->f_error = 0;
-//     struct event_poll_tailq         f_ep_links;
-       spinlock_init(&file->f_ep_lock);
-       file->f_fs_info = 0;
-       file->f_mapping = inode->i_mapping;
        return 0;
 }
 
@@ -635,15 +565,9 @@ int kfs_flush(struct file *file)
        return -1;
 }
 
-/* Called when the file refcnt == 0 */
+/* Called when the file is about to be closed (file obj freed) */
 int kfs_release(struct inode *inode, struct file *file)
 {
-       TAILQ_REMOVE(&inode->i_sb->s_files, file, f_list);
-       /* TODO: (REF) need to dealloc when this hits 0, atomic/concurrent/etc */
-       atomic_dec(&inode->i_refcnt);
-       /* TODO: clean up the inode if it was the last and we don't want it around
-        */
-       kmem_cache_free(file_kcache, file);
        return 0;
 }
 
@@ -805,11 +729,11 @@ static int __add_kfs_entry(struct dentry *parent, char *path,
                /* XXX: note we use an unrefcnt'd inode here (grabbing the dentry's) */
                if (!c_bhdr->c_filesize) {
                        /* we are a directory.  Note that fifos might look like dirs... */
-                       kfs_mkdir(parent->d_inode, dentry, c_bhdr->c_mode);
+                       create_dir(parent->d_inode, dentry, c_bhdr->c_mode);
                        inode = dentry->d_inode;
                } else {
                        /* we are a file */
-                       kfs_create(parent->d_inode, dentry, c_bhdr->c_mode, 0);
+                       create_file(parent->d_inode, dentry, c_bhdr->c_mode);
                        inode = dentry->d_inode;
                        ((struct kfs_i_info*)inode->i_fs_info)->filestart =
                                                                c_bhdr->c_filestart;
@@ -902,28 +826,3 @@ void parse_cpio_entries(struct super_block *sb, void *cpio_b)
        }
        kfree(c_bhdr);
 }
-
-/* Debugging */
-void print_dir_tree(struct dentry *dentry, int depth)
-{
-       struct inode *inode = dentry->d_inode;
-       struct kfs_i_info *k_i_info = (struct kfs_i_info*)inode->i_fs_info;
-       struct dentry *d_i;
-       assert(dentry && inode && inode->i_type & FS_I_DIR);
-       char buf[32] = {0};
-
-       for (int i = 0; i < depth; i++)
-               buf[i] = '\t';
-
-       TAILQ_FOREACH(d_i, &dentry->d_subdirs, d_subdirs_link) {
-               printk("%sDir %s has child dir: %s\n", buf, dentry->d_name.name,
-                      d_i->d_name.name);
-               print_dir_tree(d_i, depth + 1);
-       }
-       TAILQ_FOREACH(d_i, &k_i_info->children, d_subdirs_link) {
-               printk("%sDir %s has child file: %s ", buf, dentry->d_name.name,
-                      d_i->d_name.name);
-               printk("file starts at: %p\n",
-                      ((struct kfs_i_info*)d_i->d_inode->i_fs_info)->filestart);
-       }
-}