CPU state tracking
[akaros.git] / kern / src / kfs.c
index b97516d..3d9c457 100644 (file)
@@ -35,7 +35,9 @@ struct page_map_operations kfs_pm_op;
 struct super_operations kfs_s_op;
 struct inode_operations kfs_i_op;
 struct dentry_operations kfs_d_op;
-struct file_operations kfs_f_op;
+struct file_operations kfs_f_op_file;
+struct file_operations kfs_f_op_dir;
+struct file_operations kfs_f_op_sym;
 
 /* TODO: something more better.  Prob something like the vmem cache, for this,
  * pids, etc.  Good enough for now.  This also means we can only have one
@@ -117,11 +119,11 @@ struct fs_type kfs_fs_type = {"KFS", 0, kfs_get_sb, kfs_kill_sb, {0, 0},
 /* Fills page with its contents from its backing store file.  Note that we do
  * the zero padding here, instead of higher in the VFS.  Might change in the
  * future. */
-int kfs_readpage(struct file *file, struct page *page)
+int kfs_readpage(struct page_map *pm, struct page *page)
 {
        size_t pg_idx_byte = page->pg_index * PGSIZE;
        struct kfs_i_info *k_i_info = (struct kfs_i_info*)
-                                     file->f_dentry->d_inode->i_fs_info;
+                                     pm->pm_host->i_fs_info;
        uintptr_t begin = (size_t)k_i_info->filestart + pg_idx_byte;
        /* If we're beyond the initial start point, we just need a zero page.  This
         * is for a hole or for extending a file (even though it won't be saved).
@@ -134,36 +136,62 @@ int kfs_readpage(struct file *file, struct page *page)
                memcpy(page2kva(page), (void*)begin, copy_amt);
                memset(page2kva(page) + copy_amt, 0, PGSIZE - copy_amt);
        }
+       struct buffer_head *bh = kmem_cache_alloc(bh_kcache, 0);
+       if (!bh)
+               return -1;                      /* untested, un-thought-through */
+       atomic_or(&page->pg_flags, PG_BUFFER);
+       /* KFS does a 1:1 BH to page mapping */
+       bh->bh_page = page;                                                             /* weak ref */
+       bh->bh_buffer = page2kva(page);
+       bh->bh_flags = 0;                                                               /* whatever... */
+       bh->bh_next = 0;                                                                /* only one BH needed */
+       bh->bh_bdev = pm->pm_host->i_sb->s_bdev;                /* uncounted */
+       bh->bh_sector = page->pg_index;
+       bh->bh_nr_sector = 1;                                                   /* sector size = PGSIZE */
+       page->pg_private = bh;
        /* This is supposed to be done in the IO system when the operation is
         * complete.  Since we aren't doing a real IO request, and it is already
         * done, we can do it here. */
-       page->pg_flags |= PG_UPTODATE;
-       unlock_page(page);
+       atomic_or(&page->pg_flags, PG_UPTODATE);
        return 0;
 }
 
+int kfs_writepage(struct page_map *pm, struct page *page)
+{
+       warn_once("KFS writepage does not save file contents!\n");
+       return -1;
+}
+
 /* Super Operations */
 
-/* creates and initializes a new inode.  generic fields are filled in.  specific
- * fields are filled in in read_inode() based on what's on the disk for a given
- * i_no.  i_no is set by the caller.  Note that this means this inode can be for
- * an inode that is already on disk, or it can be used when creating. */
+/* Creates and initializes a new inode.  FS specific, yet inode-generic fields
+ * are filled in.  inode-specific fields are filled in in read_inode() based on
+ * what's on the disk for a given i_no.  i_no and i_fop are set by the caller.
+ *
+ * Note that this means this inode can be for an inode that is already on disk,
+ * or it can be used when creating.  The i_fop depends on the type of file
+ * (file, directory, symlink, etc). */
 struct inode *kfs_alloc_inode(struct super_block *sb)
 {
        struct inode *inode = kmem_cache_alloc(inode_kcache, 0);
        memset(inode, 0, sizeof(struct inode));
        inode->i_op = &kfs_i_op;
-       inode->i_fop = &kfs_f_op;
        inode->i_pm.pm_op = &kfs_pm_op;
        inode->i_fs_info = kmem_cache_alloc(kfs_i_kcache, 0);
        TAILQ_INIT(&((struct kfs_i_info*)inode->i_fs_info)->children);
        ((struct kfs_i_info*)inode->i_fs_info)->filestart = 0;
+       ((struct kfs_i_info*)inode->i_fs_info)->init_size = 0;
        return inode;
 }
 
-/* deallocs and cleans up after an inode. */
-void kfs_destroy_inode(struct inode *inode)
+/* FS-specific clean up when an inode is dealloced.  this is just cleaning up
+ * the in-memory version, and only the FS-specific parts.  whether or not the
+ * inode is still on disc is irrelevant. */
+void kfs_dealloc_inode(struct inode *inode)
 {
+       /* If we're a symlink, give up our storage for the symname */
+       if (S_ISLNK(inode->i_mode))
+               kfree(((struct kfs_i_info*)inode->i_fs_info)->filestart);
        kmem_cache_free(kfs_i_kcache, inode->i_fs_info);
 }
 
@@ -178,11 +206,11 @@ void kfs_read_inode(struct inode *inode)
         *      possibly a bug, since these inos come from directories */
        if (inode->i_ino == 1) {
                inode->i_mode = S_IRWXU | S_IRWXG | S_IRWXO;
-               inode->i_type = FS_I_DIR;
+               SET_FTYPE(inode->i_mode, __S_IFDIR);
+               inode->i_fop = &kfs_f_op_dir;
                inode->i_nlink = 1;                             /* assuming only one hardlink */
                inode->i_uid = 0;
                inode->i_gid = 0;
-               inode->i_rdev = 0;
                inode->i_size = 0;                              /* make sense for KFS? */
                inode->i_atime.tv_sec = 0;
                inode->i_atime.tv_nsec = 0;
@@ -191,7 +219,6 @@ void kfs_read_inode(struct inode *inode)
                inode->i_ctime.tv_sec = 0;
                inode->i_ctime.tv_nsec = 0;
                inode->i_blocks = 0;
-               inode->i_bdev = 0;                              /* assuming blockdev? */
                inode->i_flags = 0;
                inode->i_socket = FALSE;
        } else {
@@ -224,11 +251,11 @@ void kfs_drop_inode(struct inode *inode)
        // remove from lists
 }
 
-/* delete the inode from disk (all data) and deallocs the in memory inode */
+/* delete the inode from disk (all data) */
 void kfs_delete_inode(struct inode *inode)
 {
        // would remove from "disk" here
-       kfs_destroy_inode(inode);
+       /* TODO: give up our i_ino */
 }
 
 /* unmount and release the super block */
@@ -287,7 +314,8 @@ int kfs_create(struct inode *dir, struct dentry *dentry, int mode,
 {
        struct inode *inode = dentry->d_inode;
        kfs_init_inode(dir, dentry);
-       inode->i_type = FS_I_FILE;
+       SET_FTYPE(inode->i_mode, __S_IFREG);
+       inode->i_fop = &kfs_f_op_file;
        /* fs_info->filestart is set by the caller, or else when first written (for
         * new files.  it was set to 0 in alloc_inode(). */
        return 0;
@@ -295,9 +323,9 @@ int kfs_create(struct inode *dir, struct dentry *dentry, int mode,
 
 /* Searches the directory for the filename in the dentry, filling in the dentry
  * with the FS specific info of this file.  If it succeeds, it will pass back
- * the *dentry you should use.  If this fails, it will return 0 and will take
- * the ref to the dentry for you.  Either way, you shouldn't use the ref you
- * passed in anymore.  Still, there are issues with refcnting with this.
+ * the *dentry you should use.  If this fails, it will return 0.  It will NOT
+ * take your dentry ref (it used to).  It probably will not be the same dentry
+ * you passed in.  This is ugly.
  *
  * Callers, make sure you alloc and fill out the name parts of the dentry, and
  * an initialized nameidata. TODO: not sure why we need an ND.  Don't use it in
@@ -314,13 +342,14 @@ struct dentry *kfs_lookup(struct inode *dir, struct dentry *dentry,
        struct dentry *d_i;
 
        assert(dir_dent && dir_dent == TAILQ_LAST(&dir->i_dentry, dentry_tailq));
-       assert(dir->i_type & FS_I_DIR);
+       /* had this fail when kern/kfs has a symlink go -> ../../../go, though
+        * a symlink like lib2 -> lib work okay. */
+       assert(S_ISDIR(dir->i_mode));
        assert(kref_refcnt(&dentry->d_kref) == 1);
        TAILQ_FOREACH(d_i, &dir_dent->d_subdirs, d_subdirs_link) {
                if (!strcmp(d_i->d_name.name, dentry->d_name.name)) {
                        /* since this dentry is already in memory (that's how KFS works), we
-                        * can free the one that came in and return the real one */
-                       kref_put(&dentry->d_kref);
+                        * just return the real one (with another refcnt) */
                        kref_get(&d_i->d_kref, 1);
                        return d_i;
                }
@@ -328,31 +357,36 @@ struct dentry *kfs_lookup(struct inode *dir, struct dentry *dentry,
        TAILQ_FOREACH(d_i, &k_i_info->children, d_subdirs_link) {
                if (!strcmp(d_i->d_name.name, dentry->d_name.name)) {
                        /* since this dentry is already in memory (that's how KFS works), we
-                        * can free the one that came in and return the real one */
-                       kref_put(&dentry->d_kref);
+                        * just return the real one (with another refcnt) */
                        kref_get(&d_i->d_kref, 1);
                        return d_i;
                }
        }
-       /* no match, consider caching the negative result, freeing the
-        * dentry, etc */
        printd("Not Found %s!!\n", dentry->d_name.name);
-       kref_put(&dentry->d_kref);
        return 0;
 }
 
 /* Hard link to old_dentry in directory dir with a name specified by new_dentry.
- * TODO: should this also make the dentry linkage, or just discard everything?*/
+ * At the very least, set the new_dentry's FS-specific fields. */
 int kfs_link(struct dentry *old_dentry, struct inode *dir,
              struct dentry *new_dentry)
 {
-       return -1;
+       assert(new_dentry->d_op = &kfs_d_op);
+       kref_get(&new_dentry->d_kref, 1);               /* pin the dentry, KFS-style */
+       /* KFS-style directory-tracking-of-kids */
+       TAILQ_INSERT_TAIL(&((struct kfs_i_info*)dir->i_fs_info)->children,
+                         new_dentry, d_subdirs_link);
+       return 0;
 }
 
 /* Removes the link from the dentry in the directory */
 int kfs_unlink(struct inode *dir, struct dentry *dentry)
 {
-       return -1;
+       /* Stop tracking our child */
+       TAILQ_REMOVE(&((struct kfs_i_info*)dir->i_fs_info)->children, dentry,
+                    d_subdirs_link);
+       kref_put(&dentry->d_kref);                              /* unpin the dentry, KFS-style */
+       return 0;
 }
 
 /* Creates a new inode for a symlink dir, linking to / containing the name
@@ -365,7 +399,8 @@ int kfs_symlink(struct inode *dir, struct dentry *dentry, const char *symname)
        char *string = kmalloc(len + 1, 0);
 
        kfs_init_inode(dir, dentry);
-       inode->i_type = FS_I_SYMLINK;
+       SET_FTYPE(inode->i_mode, __S_IFLNK);
+       inode->i_fop = &kfs_f_op_sym;
        strncpy(string, symname, len);
        string[len] = '\0';             /* symname should be \0d anyway, but just in case */
        k_i_info->filestart = string;   /* reusing this void* to hold the char* */
@@ -381,20 +416,37 @@ int kfs_mkdir(struct inode *dir, struct dentry *dentry, int mode)
        struct inode *inode = dentry->d_inode;
        kref_get(&dentry->d_kref, 1);   /* to pin the dentry in RAM, KFS-style... */
        inode->i_ino = kfs_get_free_ino();
-       inode->i_type = FS_I_DIR;               /* this might be FS specific in the future */
+       SET_FTYPE(inode->i_mode, __S_IFDIR);
+       inode->i_fop = &kfs_f_op_dir;
        /* get ready to have our own kids */
        TAILQ_INIT(&((struct kfs_i_info*)inode->i_fs_info)->children);
        ((struct kfs_i_info*)inode->i_fs_info)->filestart = 0;
        return 0;
 }
 
-/* Removes from dir the directory specified by the name in dentry. */
-// TODO: note this isn't necessarily the same dentry, just using it for the
-// naming (which seems to be a common way of doing things, like in lookup() -
-// can work either way.
+/* Removes from dir the directory 'dentry.'  KFS doesn't store anything in the
+ * inode for which children it has.  It probably should, but since everything is
+ * pinned, it just relies on the dentry connections. */
 int kfs_rmdir(struct inode *dir, struct dentry *dentry)
 {
-       return -1;
+       struct kfs_i_info *d_info = (struct kfs_i_info*)dentry->d_inode->i_fs_info;
+       struct dentry *d_i;
+       bool empty = TRUE;
+       /* Check if we are empty.  If not, error out, need to check the sub-dirs as
+        * well as the sub-"files" */
+       TAILQ_FOREACH(d_i, &dentry->d_subdirs, d_subdirs_link) {
+               empty = FALSE;
+               break;
+       }
+       TAILQ_FOREACH(d_i, &d_info->children, d_subdirs_link) {
+               empty = FALSE;
+               break;
+       }
+       if (!empty)
+               return -ENOTEMPTY;
+       kref_put(&dentry->d_kref);                              /* unpin the dentry, KFS-style */
+       printd("DENTRY %s REFCNT %d\n", dentry->d_name.name, kref_refcnt(&dentry->d_kref));
+       return 0;
 }
 
 /* Used to make a generic file, based on the type and the major/minor numbers
@@ -405,11 +457,26 @@ int kfs_mknod(struct inode *dir, struct dentry *dentry, int mode, dev_t rdev)
        return -1;
 }
 
-/* Moves old_dentry from old_dir to new_dentry in new_dir */
-int kfs_rename(struct inode *old_dir, struct dentry *old_dentry,
-               struct inode *new_dir, struct dentry *new_dentry)
-{
-       return -1;
+/* Moves old_d from old_dir to new_d in new_dir.  TODO: super racy */
+int kfs_rename(struct inode *old_dir, struct dentry *old_d,
+               struct inode *new_dir, struct dentry *new_d)
+{
+       /* new_d is already gone, we just use it for its name.  kfs might not care
+        * about the name.  it might just use whatever the dentry says. */
+       struct kfs_i_info *old_info = (struct kfs_i_info*)old_dir->i_fs_info;
+       struct kfs_i_info *new_info = (struct kfs_i_info*)new_dir->i_fs_info;
+       printd("KFS rename: %s/%s -> %s/%s\n",
+              TAILQ_FIRST(&old_dir->i_dentry)->d_name.name, old_d->d_name.name,
+              TAILQ_FIRST(&new_dir->i_dentry)->d_name.name, new_d->d_name.name);
+       /* we want to remove from the old and add to the new.  for non-directories,
+        * we need to adjust parent's children lists (which reuses subdirs_link,
+        * yikes!).  directories aren't actually tracked by KFS; it just hopes the
+        * VFS's pinned dentry tree is enough (aka, "all paths pinned"). */
+       if (!S_ISDIR(old_d->d_inode->i_mode)) {
+               TAILQ_REMOVE(&old_info->children, old_d, d_subdirs_link);
+               TAILQ_INSERT_TAIL(&new_info->children, old_d, d_subdirs_link);
+       }
+       return 0;
 }
 
 /* Returns the char* for the symname for the given dentry.  The VFS code that
@@ -421,7 +488,7 @@ char *kfs_readlink(struct dentry *dentry)
 {
        struct inode *inode = dentry->d_inode;
        struct kfs_i_info *k_i_info = (struct kfs_i_info*)inode->i_fs_info;
-       if (inode->i_type != FS_I_SYMLINK)
+       if (!S_ISLNK(inode->i_mode))
                return 0;
        return k_i_info->filestart;
 }
@@ -429,6 +496,11 @@ char *kfs_readlink(struct dentry *dentry)
 /* Modifies the size of the file of inode to whatever its i_size is set to */
 void kfs_truncate(struct inode *inode)
 {
+       struct kfs_i_info *k_i_info = (struct kfs_i_info*)inode->i_fs_info;
+       /* init_size tracks how much of the file KFS has.  everything else is 0s.
+        * we only need to update it if we are dropping data.  as with other data
+        * beyond init_size, KFS will not save it during a write page! */
+       k_i_info->init_size = MIN(k_i_info->init_size, inode->i_size);
 }
 
 /* Checks whether the the access mode is allowed for the file belonging to the
@@ -447,12 +519,6 @@ int kfs_d_revalidate(struct dentry *dir, struct nameidata *nd)
        return -1;
 }
 
-/* Produces the hash to lookup this dentry from the dcache */
-int kfs_d_hash(struct dentry *dentry, struct qstr *name)
-{
-       return -1;
-}
-
 /* Compares name1 and name2.  name1 should be a member of dir. */
 int kfs_d_compare(struct dentry *dir, struct qstr *name1, struct qstr *name2)
 { // default, string comp (case sensitive)
@@ -479,11 +545,10 @@ void kfs_d_iput(struct dentry *dentry, struct inode *inode)
 
 /* file_operations */
 
-/* Updates the file pointer.  KFS doesn't let you go past the end of a file
- * yet, so it won't let you seek past either.  TODO: think about locking. */
-off_t kfs_llseek(struct file *file, off_t offset, int whence)
+/* Updates the file pointer.  TODO: think about locking. */
+int kfs_llseek(struct file *file, off64_t offset, off64_t *ret, int whence)
 {
-       off_t temp_off = 0;
+       off64_t temp_off = 0;
        switch (whence) {
                case SEEK_SET:
                        temp_off = offset;
@@ -499,21 +564,23 @@ off_t kfs_llseek(struct file *file, off_t offset, int whence)
                        warn("Unknown 'whence' in llseek()!\n");
                        return -1;
        }
-       /* make sure the f_pos isn't outside the limits of the existing file.
-        * techincally, if they go too far, we should return EINVAL */
-       temp_off = MAX(MIN(temp_off, file->f_dentry->d_inode->i_size), 0);
        file->f_pos = temp_off;
-       return temp_off;
+       *ret = temp_off;
+       return 0;
 }
 
-/* Fills in the next directory entry (dirent), starting with d_off.  Like with
- * read and write, there will be issues with userspace and the *dirent buf.
- * TODO: we don't really do anything with userspace concerns here, in part
+/* Fills in the next directory entry (dirent), starting with d_off.  KFS treats
+ * the size of each dirent as 1 byte, which we can get away with since the d_off
+ * is a way of communicating with future calls to readdir (FS-specific).
+ *
+ * Like with read and write, there will be issues with userspace and the *dirent
+ * buf.  TODO: we don't really do anything with userspace concerns here, in part
  * because memcpy_to doesn't work well.  When we fix how we want to handle the
  * userbuffers, we can write this accordingly. (UMEM)  */
 int kfs_readdir(struct file *dir, struct dirent *dirent)
 {
-       int count = 0;
+       int count = 2;  /* total num dirents, gets incremented in check_entry() */
+       int desired_file = dirent->d_off;
        bool found = FALSE;
        struct dentry *subent;
        struct dentry *dir_d = dir->f_dentry;
@@ -522,8 +589,9 @@ int kfs_readdir(struct file *dir, struct dirent *dirent)
        /* how we check inside the for loops below.  moderately ghetto. */
        void check_entry(void)
        {
-               if (count++ == dirent->d_off) {
+               if (count++ == desired_file) {
                        dirent->d_ino = subent->d_inode->i_ino;
+                       dirent->d_off = count;
                        dirent->d_reclen = subent->d_name.len;
                        /* d_name.name is null terminated, the byte after d_name.len */
                        assert(subent->d_name.len <= MAX_FILENAME_SZ);
@@ -531,24 +599,32 @@ int kfs_readdir(struct file *dir, struct dirent *dirent)
                        found = TRUE;
                }
        }
-       /* some of this error handling can be done by the VFS.  The syscall should
-        * handle EBADF, EFAULT, and EINVAL (TODO, memory related). */
-       if (!(dir_d->d_inode->i_type & FS_I_DIR)) {
-               set_errno(ENOTDIR);
-               return -1;
-       }
 
-       /* need to check the sub-dirs as well as the sub-"files" */
+       /* Handle . and .. (first two dirents) */
+       if (desired_file == 0) {
+               dirent->d_ino = dir_d->d_inode->i_ino;
+               dirent->d_off = 1;
+               dirent->d_reclen = 1;
+               strncpy(dirent->d_name, ".", 2);        /* the extra is for the null term */
+               found = TRUE;
+       } else if (desired_file == 1) {
+               dirent->d_ino = dir_d->d_parent->d_inode->i_ino;
+               dirent->d_off = 2;
+               dirent->d_reclen = 2;
+               strncpy(dirent->d_name, "..", 3);       /* the extra is for the null term */
+               found = TRUE;
+       }
+       /* need to check the sub-dirs as well as the sub-"files".  The main
+        * ghetto-ness with this is that we check even though we have our result,
+        * simply to figure out how big our directory is.  It's just not worth
+        * changing at this point. */
        TAILQ_FOREACH(subent, &dir_d->d_subdirs, d_subdirs_link)
                check_entry();
        TAILQ_FOREACH(subent, &k_i_info->children, d_subdirs_link)
                check_entry();
-
-       if (!found) {
-               set_errno(ENOENT);
-               return -1;
-       }
-       if (count - 1 == dirent->d_off)         /* found the last dir in the list */
+       if (!found)
+               return -ENOENT;
+       if (count - 1 == desired_file)          /* found the last dir in the list */
                return 0;
        return 1;                                                       /* normal success for readdir */
 }
@@ -560,7 +636,7 @@ int kfs_readdir(struct file *dir, struct dirent *dirent)
  * the file was opened or the file type. */
 int kfs_mmap(struct file *file, struct vm_region *vmr)
 {
-       if (file->f_dentry->d_inode->i_type & FS_I_FILE)
+       if (S_ISREG(file->f_dentry->d_inode->i_mode))
                return 0;
        return -1;
 }
@@ -600,7 +676,7 @@ unsigned int kfs_poll(struct file *file, struct poll_table_struct *poll_table)
 /* Reads count bytes from a file, starting from (and modifiying) offset, and
  * putting the bytes into buffers described by vector */
 ssize_t kfs_readv(struct file *file, const struct iovec *vector,
-                  unsigned long count, off_t *offset)
+                  unsigned long count, off64_t *offset)
 {
        return -1;
 }
@@ -608,14 +684,14 @@ ssize_t kfs_readv(struct file *file, const struct iovec *vector,
 /* Writes count bytes to a file, starting from (and modifiying) offset, and
  * taking the bytes from buffers described by vector */
 ssize_t kfs_writev(struct file *file, const struct iovec *vector,
-                  unsigned long count, off_t *offset)
+                  unsigned long count, off64_t *offset)
 {
        return -1;
 }
 
 /* Write the contents of file to the page.  Will sort the params later */
 ssize_t kfs_sendpage(struct file *file, struct page *page, int offset,
-                     size_t size, off_t pos, int more)
+                     size_t size, off64_t pos, int more)
 {
        return -1;
 }
@@ -629,11 +705,12 @@ int kfs_check_flags(int flags)
 /* Redeclaration and initialization of the FS ops structures */
 struct page_map_operations kfs_pm_op = {
        kfs_readpage,
+       kfs_writepage,
 };
 
 struct super_operations kfs_s_op = {
        kfs_alloc_inode,
-       kfs_destroy_inode,
+       kfs_dealloc_inode,
        kfs_read_inode,
        kfs_dirty_inode,
        kfs_write_inode,
@@ -664,14 +741,48 @@ struct inode_operations kfs_i_op = {
 
 struct dentry_operations kfs_d_op = {
        kfs_d_revalidate,
-       kfs_d_hash,
+       generic_dentry_hash,
        kfs_d_compare,
        kfs_d_delete,
        kfs_d_release,
        kfs_d_iput,
 };
 
-struct file_operations kfs_f_op = {
+struct file_operations kfs_f_op_file = {
+       kfs_llseek,
+       generic_file_read,
+       generic_file_write,
+       kfs_readdir,
+       kfs_mmap,
+       kfs_open,
+       kfs_flush,
+       kfs_release,
+       kfs_fsync,
+       kfs_poll,
+       kfs_readv,
+       kfs_writev,
+       kfs_sendpage,
+       kfs_check_flags,
+};
+
+struct file_operations kfs_f_op_dir = {
+       kfs_llseek,
+       generic_dir_read,
+       0,
+       kfs_readdir,
+       kfs_mmap,
+       kfs_open,
+       kfs_flush,
+       kfs_release,
+       kfs_fsync,
+       kfs_poll,
+       kfs_readv,
+       kfs_writev,
+       kfs_sendpage,
+       kfs_check_flags,
+};
+
+struct file_operations kfs_f_op_sym = {
        kfs_llseek,
        generic_file_read,
        generic_file_write,
@@ -701,8 +812,9 @@ static int __add_kfs_entry(struct dentry *parent, char *path,
        char dir[MAX_FILENAME_SZ + 1];  /* room for the \0 */
        size_t dirname_sz;                              /* not counting the \0 */
        struct dentry *dentry = 0;
-       struct nameidata nd = {0};
        struct inode *inode;
+       int err, retval;
+       char *symname, old_end;                 /* for symlink manipulation */
 
        if (first_slash) {
                /* get the first part, find that dentry, pass in the second part,
@@ -716,41 +828,57 @@ static int __add_kfs_entry(struct dentry *parent, char *path,
                       parent->d_name.name, c_bhdr->c_filestart, c_bhdr->c_filesize);
                /* Need to create a dentry for the lookup, and fill in the basic nd */
                dentry = get_dentry(parent->d_sb, parent, dir);
-               nd.dentry = dentry;
-               nd.mnt = dentry->d_sb->s_mount;
-               //nd.flags = 0;                 /* TODO: once we have lookup flags */
-               //nd.last_type = 0;             /* TODO: should be a DIR */
-               //nd.intent = 0;                /* TODO: RW, prob irrelevant*/
                /* TODO: use a VFS lookup instead, to use the dcache, thought its not a
                 * big deal since KFS currently pins all metadata. */
-               dentry = kfs_lookup(parent->d_inode, dentry, &nd);
+               dentry = kfs_lookup(parent->d_inode, dentry, 0);
                if (!dentry) {
                        printk("Missing dir in CPIO archive or something, aborting.\n");
                        return -1;
                }
-               return __add_kfs_entry(dentry, first_slash + 1, c_bhdr);
+               retval = __add_kfs_entry(dentry, first_slash + 1, c_bhdr);
+               kref_put(&dentry->d_kref);
+               return retval;
        } else {
                /* no directories left in the path.  add the 'file' to the dentry */
                printd("Adding file/dir %s to dentry %s (start: %p, size %d)\n", path,
                       parent->d_name.name, c_bhdr->c_filestart, c_bhdr->c_filesize);
                /* Init the dentry for this path */
                dentry = get_dentry(parent->d_sb, parent, path);
-               dcache_put(dentry);                     /* TODO: should set a d_flag too */
+               // want to test the regular/natural dentry caching paths
+               //dcache_put(dentry->d_sb, dentry);
                /* build the inode */
-               /* XXX: note we use an unrefcnt'd inode here (grabbing the dentry's) */
-               if (!c_bhdr->c_filesize) {
-                       /* we are a directory.  Note that fifos might look like dirs... */
-                       create_dir(parent->d_inode, dentry, c_bhdr->c_mode);
-                       inode = dentry->d_inode;
-               } else {
-                       /* we are a file */
-                       create_file(parent->d_inode, dentry, c_bhdr->c_mode);
-                       inode = dentry->d_inode;
-                       ((struct kfs_i_info*)inode->i_fs_info)->filestart =
-                                                               c_bhdr->c_filestart;
-                       ((struct kfs_i_info*)inode->i_fs_info)->init_size =
-                                                               c_bhdr->c_filesize;
+               switch (c_bhdr->c_mode & CPIO_FILE_MASK) {
+                       case (CPIO_DIRECTORY):
+                               err = create_dir(parent->d_inode, dentry, c_bhdr->c_mode);
+                               assert(!err);
+                               break;
+                       case (CPIO_SYMLINK):
+                               /* writing the '\0' is safe since the next entry is always still
+                                * in the CPIO (and we are processing sequentially). */
+                               symname = c_bhdr->c_filestart;
+                               old_end = symname[c_bhdr->c_filesize];
+                               symname[c_bhdr->c_filesize] = '\0';
+                               err = create_symlink(parent->d_inode, dentry, symname,
+                                                    c_bhdr->c_mode & CPIO_PERM_MASK);
+                               assert(!err);
+                               symname[c_bhdr->c_filesize] = old_end;
+                               break;
+                       case (CPIO_REG_FILE):
+                               err = create_file(parent->d_inode, dentry,
+                                                 c_bhdr->c_mode & CPIO_PERM_MASK);
+                               assert(!err);
+                               ((struct kfs_i_info*)dentry->d_inode->i_fs_info)->filestart =
+                                                                                                               c_bhdr->c_filestart;
+                               ((struct kfs_i_info*)dentry->d_inode->i_fs_info)->init_size =
+                                                                                                               c_bhdr->c_filesize;
+                               break;
+                       default:
+                               printk("Unknown file type %d in the CPIO!",
+                                      c_bhdr->c_mode & CPIO_FILE_MASK);
+                               kref_put(&dentry->d_kref);
+                               return -1;
                }
+               inode = dentry->d_inode;
                /* Set other info from the CPIO entry */
                inode->i_uid = c_bhdr->c_uid;
                inode->i_gid = c_bhdr->c_gid;
@@ -762,6 +890,7 @@ static int __add_kfs_entry(struct dentry *parent, char *path,
                inode->i_bdev = 0;                                              /* assuming blockdev? */
                inode->i_socket = FALSE;
                inode->i_blocks = c_bhdr->c_filesize;   /* blocksize == 1 */
+               kref_put(&dentry->d_kref);
        }
        return 0;
 }
@@ -806,7 +935,7 @@ void parse_cpio_entries(struct super_block *sb, void *cpio_b)
                }
                c_bhdr->c_filename = (char*)c_hdr + sizeof(*c_hdr);
                namesize = cpio_strntol(buf, c_hdr->c_namesize, 8);
-               printd("Namesize: %d\n", size);
+               printd("Namesize: %d\n", namesize);
                if (!strcmp(c_bhdr->c_filename, "TRAILER!!!"))
                        break;
                c_bhdr->c_ino = cpio_strntol(buf, c_hdr->c_ino, 8);