Rip out the old network stack. It's in the way.
[akaros.git] / kern / src / kfs.c
index 61ca4c9..8324323 100644 (file)
@@ -119,11 +119,11 @@ struct fs_type kfs_fs_type = {"KFS", 0, kfs_get_sb, kfs_kill_sb, {0, 0},
 /* Fills page with its contents from its backing store file.  Note that we do
  * the zero padding here, instead of higher in the VFS.  Might change in the
  * future. */
-int kfs_readpage(struct file *file, struct page *page)
+int kfs_readpage(struct page_map *pm, struct page *page)
 {
        size_t pg_idx_byte = page->pg_index * PGSIZE;
        struct kfs_i_info *k_i_info = (struct kfs_i_info*)
-                                     file->f_dentry->d_inode->i_fs_info;
+                                     pm->pm_host->i_fs_info;
        uintptr_t begin = (size_t)k_i_info->filestart + pg_idx_byte;
        /* If we're beyond the initial start point, we just need a zero page.  This
         * is for a hole or for extending a file (even though it won't be saved).
@@ -136,11 +136,22 @@ int kfs_readpage(struct file *file, struct page *page)
                memcpy(page2kva(page), (void*)begin, copy_amt);
                memset(page2kva(page) + copy_amt, 0, PGSIZE - copy_amt);
        }
+       struct buffer_head *bh = kmem_cache_alloc(bh_kcache, 0);
+       if (!bh)
+               return -1;                      /* untested, un-thought-through */
+       /* KFS does a 1:1 BH to page mapping */
+       bh->bh_page = page;                                                             /* weak ref */
+       bh->bh_buffer = page2kva(page);
+       bh->bh_flags = 0;                                                               /* whatever... */
+       bh->bh_next = 0;                                                                /* only one BH needed */
+       bh->bh_bdev = pm->pm_host->i_sb->s_bdev;                /* uncounted */
+       bh->bh_sector = page->pg_index;
+       bh->bh_nr_sector = 1;                                                   /* sector size = PGSIZE */
+       page->pg_private = bh;
        /* This is supposed to be done in the IO system when the operation is
         * complete.  Since we aren't doing a real IO request, and it is already
         * done, we can do it here. */
        page->pg_flags |= PG_UPTODATE;
-       unlock_page(page);
        return 0;
 }
 
@@ -162,10 +173,13 @@ struct inode *kfs_alloc_inode(struct super_block *sb)
        inode->i_fs_info = kmem_cache_alloc(kfs_i_kcache, 0);
        TAILQ_INIT(&((struct kfs_i_info*)inode->i_fs_info)->children);
        ((struct kfs_i_info*)inode->i_fs_info)->filestart = 0;
+       ((struct kfs_i_info*)inode->i_fs_info)->init_size = 0;
        return inode;
 }
 
-/* deallocs and cleans up after an inode. */
+/* FS-specific clean up when an inode is dealloced.  this is just cleaning up
+ * the in-memory version, and only the FS-specific parts.  whether or not the
+ * inode is still on disc is irrelevant. */
 void kfs_dealloc_inode(struct inode *inode)
 {
        /* If we're a symlink, give up our storage for the symname */
@@ -230,11 +244,10 @@ void kfs_drop_inode(struct inode *inode)
        // remove from lists
 }
 
-/* delete the inode from disk (all data) and deallocs the in memory inode */
+/* delete the inode from disk (all data) */
 void kfs_delete_inode(struct inode *inode)
 {
        // would remove from "disk" here
-       kfs_dealloc_inode(inode);
        /* TODO: give up our i_ino */
 }
 
@@ -303,9 +316,9 @@ int kfs_create(struct inode *dir, struct dentry *dentry, int mode,
 
 /* Searches the directory for the filename in the dentry, filling in the dentry
  * with the FS specific info of this file.  If it succeeds, it will pass back
- * the *dentry you should use.  If this fails, it will return 0 and will take
- * the ref to the dentry for you.  Either way, you shouldn't use the ref you
- * passed in anymore.  Still, there are issues with refcnting with this.
+ * the *dentry you should use.  If this fails, it will return 0.  It will NOT
+ * take your dentry ref (it used to).  It probably will not be the same dentry
+ * you passed in.  This is ugly.
  *
  * Callers, make sure you alloc and fill out the name parts of the dentry, and
  * an initialized nameidata. TODO: not sure why we need an ND.  Don't use it in
@@ -322,13 +335,14 @@ struct dentry *kfs_lookup(struct inode *dir, struct dentry *dentry,
        struct dentry *d_i;
 
        assert(dir_dent && dir_dent == TAILQ_LAST(&dir->i_dentry, dentry_tailq));
+       /* had this fail when kern/kfs has a symlink go -> ../../../go, though
+        * a symlink like lib2 -> lib work okay. */
        assert(S_ISDIR(dir->i_mode));
        assert(kref_refcnt(&dentry->d_kref) == 1);
        TAILQ_FOREACH(d_i, &dir_dent->d_subdirs, d_subdirs_link) {
                if (!strcmp(d_i->d_name.name, dentry->d_name.name)) {
                        /* since this dentry is already in memory (that's how KFS works), we
-                        * can free the one that came in and return the real one */
-                       kref_put(&dentry->d_kref);
+                        * just return the real one (with another refcnt) */
                        kref_get(&d_i->d_kref, 1);
                        return d_i;
                }
@@ -336,16 +350,12 @@ struct dentry *kfs_lookup(struct inode *dir, struct dentry *dentry,
        TAILQ_FOREACH(d_i, &k_i_info->children, d_subdirs_link) {
                if (!strcmp(d_i->d_name.name, dentry->d_name.name)) {
                        /* since this dentry is already in memory (that's how KFS works), we
-                        * can free the one that came in and return the real one */
-                       kref_put(&dentry->d_kref);
+                        * just return the real one (with another refcnt) */
                        kref_get(&d_i->d_kref, 1);
                        return d_i;
                }
        }
-       /* no match, consider caching the negative result, freeing the
-        * dentry, etc */
        printd("Not Found %s!!\n", dentry->d_name.name);
-       kref_put(&dentry->d_kref);
        return 0;
 }
 
@@ -368,6 +378,7 @@ int kfs_unlink(struct inode *dir, struct dentry *dentry)
        /* Stop tracking our child */
        TAILQ_REMOVE(&((struct kfs_i_info*)dir->i_fs_info)->children, dentry,
                     d_subdirs_link);
+       kref_put(&dentry->d_kref);                              /* unpin the dentry, KFS-style */
        return 0;
 }
 
@@ -426,6 +437,8 @@ int kfs_rmdir(struct inode *dir, struct dentry *dentry)
        }
        if (!empty)
                return -ENOTEMPTY;
+       kref_put(&dentry->d_kref);                              /* unpin the dentry, KFS-style */
+       printk("DENTRY %s REFCNT %d\n", dentry->d_name.name, kref_refcnt(&dentry->d_kref));
        return 0;
 }
 
@@ -513,9 +526,9 @@ void kfs_d_iput(struct dentry *dentry, struct inode *inode)
 
 /* Updates the file pointer.  KFS doesn't let you go past the end of a file
  * yet, so it won't let you seek past either.  TODO: think about locking. */
-off_t kfs_llseek(struct file *file, off_t offset, int whence)
+int kfs_llseek(struct file *file, off64_t offset, off64_t *ret, int whence)
 {
-       off_t temp_off = 0;
+       off64_t temp_off = 0;
        switch (whence) {
                case SEEK_SET:
                        temp_off = offset;
@@ -535,11 +548,13 @@ off_t kfs_llseek(struct file *file, off_t offset, int whence)
         * techincally, if they go too far, we should return EINVAL */
        temp_off = MAX(MIN(temp_off, file->f_dentry->d_inode->i_size), 0);
        file->f_pos = temp_off;
-       return temp_off;
+       *ret = temp_off;
+       return 0;
 }
 
 /* Fills in the next directory entry (dirent), starting with d_off.  KFS treats
- * the size of each dirent as one byte.
+ * the size of each dirent as 1 byte, which we can get away with since the d_off
+ * is a way of communicating with future calls to readdir (FS-specific).
  *
  * Like with read and write, there will be issues with userspace and the *dirent
  * buf.  TODO: we don't really do anything with userspace concerns here, in part
@@ -548,7 +563,7 @@ off_t kfs_llseek(struct file *file, off_t offset, int whence)
 int kfs_readdir(struct file *dir, struct dirent *dirent)
 {
        int count = 2;  /* total num dirents, gets incremented in check_entry() */
-       off_t desired_off = dirent->d_off;
+       int desired_file = dirent->d_off;
        bool found = FALSE;
        struct dentry *subent;
        struct dentry *dir_d = dir->f_dentry;
@@ -557,7 +572,7 @@ int kfs_readdir(struct file *dir, struct dirent *dirent)
        /* how we check inside the for loops below.  moderately ghetto. */
        void check_entry(void)
        {
-               if (count++ == desired_off) {
+               if (count++ == desired_file) {
                        dirent->d_ino = subent->d_inode->i_ino;
                        dirent->d_off = count;
                        dirent->d_reclen = subent->d_name.len;
@@ -567,38 +582,32 @@ int kfs_readdir(struct file *dir, struct dirent *dirent)
                        found = TRUE;
                }
        }
-       /* some of this error handling can be done by the VFS.  The syscall should
-        * handle EBADF, EFAULT, and EINVAL (TODO, memory related). */
-       if (!S_ISDIR(dir_d->d_inode->i_mode)) {
-               set_errno(ENOTDIR);
-               return -1;
-       }
 
        /* Handle . and .. (first two dirents) */
-       if (dirent->d_off == 0) {
+       if (desired_file == 0) {
                dirent->d_ino = dir_d->d_inode->i_ino;
                dirent->d_off = 1;
                dirent->d_reclen = 1;
-               strncpy(dirent->d_name, ".", 1);
+               strncpy(dirent->d_name, ".", 2);        /* the extra is for the null term */
                found = TRUE;
-       } else if (dirent->d_off == 1) {
+       } else if (desired_file == 1) {
                dirent->d_ino = dir_d->d_parent->d_inode->i_ino;
                dirent->d_off = 2;
                dirent->d_reclen = 2;
-               strncpy(dirent->d_name, "..", 2);
+               strncpy(dirent->d_name, "..", 3);       /* the extra is for the null term */
                found = TRUE;
-       } else {
-               /* need to check the sub-dirs as well as the sub-"files" */
-               TAILQ_FOREACH(subent, &dir_d->d_subdirs, d_subdirs_link)
-                       check_entry();
-               TAILQ_FOREACH(subent, &k_i_info->children, d_subdirs_link)
-                       check_entry();
-       }
-       if (!found) {
-               set_errno(ENOENT);
-               return -1;
        }
-       if (count == dirent->d_off)             /* found the last dir in the list */
+       /* need to check the sub-dirs as well as the sub-"files".  The main
+        * ghetto-ness with this is that we check even though we have our result,
+        * simply to figure out how big our directory is.  It's just not worth
+        * changing at this point. */
+       TAILQ_FOREACH(subent, &dir_d->d_subdirs, d_subdirs_link)
+               check_entry();
+       TAILQ_FOREACH(subent, &k_i_info->children, d_subdirs_link)
+               check_entry();
+       if (!found)
+               return -ENOENT;
+       if (count - 1 == desired_file)          /* found the last dir in the list */
                return 0;
        return 1;                                                       /* normal success for readdir */
 }
@@ -650,7 +659,7 @@ unsigned int kfs_poll(struct file *file, struct poll_table_struct *poll_table)
 /* Reads count bytes from a file, starting from (and modifiying) offset, and
  * putting the bytes into buffers described by vector */
 ssize_t kfs_readv(struct file *file, const struct iovec *vector,
-                  unsigned long count, off_t *offset)
+                  unsigned long count, off64_t *offset)
 {
        return -1;
 }
@@ -658,14 +667,14 @@ ssize_t kfs_readv(struct file *file, const struct iovec *vector,
 /* Writes count bytes to a file, starting from (and modifiying) offset, and
  * taking the bytes from buffers described by vector */
 ssize_t kfs_writev(struct file *file, const struct iovec *vector,
-                  unsigned long count, off_t *offset)
+                  unsigned long count, off64_t *offset)
 {
        return -1;
 }
 
 /* Write the contents of file to the page.  Will sort the params later */
 ssize_t kfs_sendpage(struct file *file, struct page *page, int offset,
-                     size_t size, off_t pos, int more)
+                     size_t size, off64_t pos, int more)
 {
        return -1;
 }
@@ -786,7 +795,7 @@ static int __add_kfs_entry(struct dentry *parent, char *path,
        size_t dirname_sz;                              /* not counting the \0 */
        struct dentry *dentry = 0;
        struct inode *inode;
-       int err;
+       int err, retval;
        char *symname, old_end;                 /* for symlink manipulation */
 
        if (first_slash) {
@@ -808,14 +817,17 @@ static int __add_kfs_entry(struct dentry *parent, char *path,
                        printk("Missing dir in CPIO archive or something, aborting.\n");
                        return -1;
                }
-               return __add_kfs_entry(dentry, first_slash + 1, c_bhdr);
+               retval = __add_kfs_entry(dentry, first_slash + 1, c_bhdr);
+               kref_put(&dentry->d_kref);
+               return retval;
        } else {
                /* no directories left in the path.  add the 'file' to the dentry */
                printd("Adding file/dir %s to dentry %s (start: %p, size %d)\n", path,
                       parent->d_name.name, c_bhdr->c_filestart, c_bhdr->c_filesize);
                /* Init the dentry for this path */
                dentry = get_dentry(parent->d_sb, parent, path);
-               dcache_put(dentry);                     /* TODO: should set a d_flag too */
+               // want to test the regular/natural dentry caching paths
+               //dcache_put(dentry->d_sb, dentry);
                /* build the inode */
                switch (c_bhdr->c_mode & CPIO_FILE_MASK) {
                        case (CPIO_DIRECTORY):
@@ -845,6 +857,7 @@ static int __add_kfs_entry(struct dentry *parent, char *path,
                        default:
                                printk("Unknown file type %d in the CPIO!",
                                       c_bhdr->c_mode & CPIO_FILE_MASK);
+                               kref_put(&dentry->d_kref);
                                return -1;
                }
                inode = dentry->d_inode;
@@ -859,6 +872,7 @@ static int __add_kfs_entry(struct dentry *parent, char *path,
                inode->i_bdev = 0;                                              /* assuming blockdev? */
                inode->i_socket = FALSE;
                inode->i_blocks = c_bhdr->c_filesize;   /* blocksize == 1 */
+               kref_put(&dentry->d_kref);
        }
        return 0;
 }
@@ -903,7 +917,7 @@ void parse_cpio_entries(struct super_block *sb, void *cpio_b)
                }
                c_bhdr->c_filename = (char*)c_hdr + sizeof(*c_hdr);
                namesize = cpio_strntol(buf, c_hdr->c_namesize, 8);
-               printd("Namesize: %d\n", size);
+               printd("Namesize: %d\n", namesize);
                if (!strcmp(c_bhdr->c_filename, "TRAILER!!!"))
                        break;
                c_bhdr->c_ino = cpio_strntol(buf, c_hdr->c_ino, 8);