Hard-links, via sys_link()
[akaros.git] / kern / src / kfs.c
1 /* Copyright (c) 2009, 2010 The Regents of the University of California
2  * Barret Rhoden <brho@cs.berkeley.edu>
3  * See LICENSE for details.
4  *
5  * Implementation of the KFS file system.  It is a RAM based, read-only FS
6  * consisting of files that are added to the kernel binary image.  Might turn
7  * this into a read/write FS with directories someday. */
8
9 #ifdef __SHARC__
10 #pragma nosharc
11 #endif
12
13 #ifdef __DEPUTY__
14 #pragma nodeputy
15 #endif
16
17 #include <vfs.h>
18 #include <kfs.h>
19 #include <slab.h>
20 #include <kmalloc.h>
21 #include <string.h>
22 #include <stdio.h>
23 #include <assert.h>
24 #include <error.h>
25 #include <cpio.h>
26 #include <pmap.h>
27 #include <smp.h>
28
29 #define KFS_MAX_FILE_SIZE 1024*1024*128
30 #define KFS_MAGIC 0xdead0001
31
32 /* VFS required Functions */
33 /* These structs are declared again and initialized farther down */
34 struct page_map_operations kfs_pm_op;
35 struct super_operations kfs_s_op;
36 struct inode_operations kfs_i_op;
37 struct dentry_operations kfs_d_op;
38 struct file_operations kfs_f_op_file;
39 struct file_operations kfs_f_op_dir;
40 struct file_operations kfs_f_op_sym;
41
42 /* TODO: something more better.  Prob something like the vmem cache, for this,
43  * pids, etc.  Good enough for now.  This also means we can only have one
44  * KFS instance, and we also aren't synchronizing access. */
45 static unsigned long kfs_get_free_ino(void)
46 {
47         static unsigned long last_ino = 1;       /* 1 is reserved for the root */
48         last_ino++;
49         if (!last_ino)
50                 panic("Out of inos in KFS!");
51         return last_ino;
52 }
53
54 /* Slabs for KFS specific info chunks */
55 struct kmem_cache *kfs_i_kcache;
56
57 static void kfs_init(void)
58 {
59         kfs_i_kcache = kmem_cache_create("kfs_ino_info", sizeof(struct kfs_i_info),
60                                          __alignof__(struct kfs_i_info), 0, 0, 0);
61 }
62
63 /* Creates the SB (normally would read in from disc and create).  Passes it's
64  * ref out to whoever consumes this.  Returns 0 on failure.
65  * TODO: consider pulling out more of the FS-independent stuff, if possible.
66  * There are only two things, but the pain in the ass is that you'd need to read
67  * the disc to get that first inode, and it's a FS-specific thing. */
68 struct super_block *kfs_get_sb(struct fs_type *fs, int flags,
69                                char *dev_name, struct vfsmount *vmnt)
70 {
71         /* Ought to check that dev_name has our FS on it.  in this case, it's
72          * irrelevant. */
73         //if (something_bad)
74         //      return 0;
75         static bool ran_once = FALSE;
76         if (!ran_once) {
77                 ran_once = TRUE;
78                 kfs_init();
79         }
80
81         /* Build and init the SB.  No need to read off disc. */
82         struct super_block *sb = get_sb();
83         sb->s_dev = 0;
84         sb->s_blocksize = 1;
85         sb->s_maxbytes = KFS_MAX_FILE_SIZE;
86         sb->s_type = &kfs_fs_type;
87         sb->s_op = &kfs_s_op;
88         sb->s_flags = flags;
89         sb->s_magic = KFS_MAGIC;
90         sb->s_mount = vmnt;
91         sb->s_syncing = FALSE;
92         sb->s_bdev = 0;
93         strlcpy(sb->s_name, "KFS", 32);
94         /* store the location of the CPIO archive.  make this more generic later. */
95         extern uint8_t _binary_obj_kern_initramfs_cpio_size[];
96         extern uint8_t _binary_obj_kern_initramfs_cpio_start[];
97         sb->s_fs_info = (void*)_binary_obj_kern_initramfs_cpio_start;
98
99         /* Final stages of initializing the sb, mostly FS-independent */
100         /* 1 is the KFS root ino (inode number) */
101         init_sb(sb, vmnt, &kfs_d_op, 1, 0);
102         /* Parses the CPIO entries and builds the in-memory KFS tree. */
103         parse_cpio_entries(sb, sb->s_fs_info);
104         printk("KFS superblock loaded\n");
105         return sb;
106 }
107
108 void kfs_kill_sb(struct super_block *sb)
109 {
110         panic("Killing KFS is not supported!");
111 }
112
113 /* Every FS must have a static FS Type, with which the VFS code can bootstrap */
114 struct fs_type kfs_fs_type = {"KFS", 0, kfs_get_sb, kfs_kill_sb, {0, 0},
115                TAILQ_HEAD_INITIALIZER(kfs_fs_type.fs_supers)};
116
117 /* Page Map Operations */
118
119 /* Fills page with its contents from its backing store file.  Note that we do
120  * the zero padding here, instead of higher in the VFS.  Might change in the
121  * future. */
122 int kfs_readpage(struct file *file, struct page *page)
123 {
124         size_t pg_idx_byte = page->pg_index * PGSIZE;
125         struct kfs_i_info *k_i_info = (struct kfs_i_info*)
126                                       file->f_dentry->d_inode->i_fs_info;
127         uintptr_t begin = (size_t)k_i_info->filestart + pg_idx_byte;
128         /* If we're beyond the initial start point, we just need a zero page.  This
129          * is for a hole or for extending a file (even though it won't be saved).
130          * Otherwise, we want the data from KFS, being careful to not copy from
131          * beyond the original EOF (and zero padding anything extra). */
132         if (pg_idx_byte >= k_i_info->init_size) {
133                 memset(page2kva(page), 0, PGSIZE);
134         } else {
135                 size_t copy_amt = MIN(PGSIZE, k_i_info->init_size - pg_idx_byte);
136                 memcpy(page2kva(page), (void*)begin, copy_amt);
137                 memset(page2kva(page) + copy_amt, 0, PGSIZE - copy_amt);
138         }
139         /* This is supposed to be done in the IO system when the operation is
140          * complete.  Since we aren't doing a real IO request, and it is already
141          * done, we can do it here. */
142         page->pg_flags |= PG_UPTODATE;
143         unlock_page(page);
144         return 0;
145 }
146
147 /* Super Operations */
148
149 /* creates and initializes a new inode.  generic fields are filled in.  specific
150  * fields are filled in in read_inode() based on what's on the disk for a given
151  * i_no.  i_no and i_fop are set by the caller.  Note that this means this inode
152  * can be for an inode that is already on disk, or it can be used when creating.
153  * The i_fop depends on the type of file (file, directory, symlink, etc). */
154 struct inode *kfs_alloc_inode(struct super_block *sb)
155 {
156         struct inode *inode = kmem_cache_alloc(inode_kcache, 0);
157         memset(inode, 0, sizeof(struct inode));
158         inode->i_op = &kfs_i_op;
159         inode->i_pm.pm_op = &kfs_pm_op;
160         inode->i_fs_info = kmem_cache_alloc(kfs_i_kcache, 0);
161         TAILQ_INIT(&((struct kfs_i_info*)inode->i_fs_info)->children);
162         ((struct kfs_i_info*)inode->i_fs_info)->filestart = 0;
163         return inode;
164 }
165
166 /* deallocs and cleans up after an inode. */
167 void kfs_destroy_inode(struct inode *inode)
168 {
169         kmem_cache_free(kfs_i_kcache, inode->i_fs_info);
170 }
171
172 /* reads the inode data on disk specified by inode->i_ino into the inode.
173  * basically, it's a "make this inode the one for i_ino (i number)" */
174 void kfs_read_inode(struct inode *inode)
175 {
176         /* need to do something to link this inode/file to the actual "blocks" on
177          * "disk". */
178
179         /* TODO: what does it mean to ask for an inode->i_ino that doesn't exist?
180          *      possibly a bug, since these inos come from directories */
181         if (inode->i_ino == 1) {
182                 inode->i_mode = S_IRWXU | S_IRWXG | S_IRWXO;
183                 inode->i_type = FS_I_DIR;
184                 inode->i_fop = &kfs_f_op_dir;
185                 inode->i_nlink = 1;                             /* assuming only one hardlink */
186                 inode->i_uid = 0;
187                 inode->i_gid = 0;
188                 inode->i_rdev = 0;
189                 inode->i_size = 0;                              /* make sense for KFS? */
190                 inode->i_atime.tv_sec = 0;
191                 inode->i_atime.tv_nsec = 0;
192                 inode->i_mtime.tv_sec = 0;
193                 inode->i_mtime.tv_nsec = 0;
194                 inode->i_ctime.tv_sec = 0;
195                 inode->i_ctime.tv_nsec = 0;
196                 inode->i_blocks = 0;
197                 inode->i_bdev = 0;                              /* assuming blockdev? */
198                 inode->i_flags = 0;
199                 inode->i_socket = FALSE;
200         } else {
201                 panic("Not implemented");
202         }
203         /* TODO: unused: inode->i_hash add to hash (saves on disc reading) */
204 }
205
206 /* called when an inode in memory is modified (journalling FS's care) */
207 void kfs_dirty_inode(struct inode *inode)
208 {       // KFS doesn't care
209 }
210
211 /* write the inode to disk (specifically, to inode inode->i_ino), synchronously
212  * if we're asked to wait */
213 void kfs_write_inode(struct inode *inode, bool wait)
214 {       // KFS doesn't care
215 }
216
217 /* called when an inode is decref'd, to do any FS specific work */
218 void kfs_put_inode(struct inode *inode)
219 {       // KFS doesn't care
220 }
221
222 /* called when an inode is about to be destroyed.  the generic version ought to
223  * remove every reference to the inode from the VFS, and if the inode isn't in
224  * any directory, calls delete_inode */
225 void kfs_drop_inode(struct inode *inode)
226 { // TODO: should call a generic one instead.  or at least do something...
227         // remove from lists
228 }
229
230 /* delete the inode from disk (all data) and deallocs the in memory inode */
231 void kfs_delete_inode(struct inode *inode)
232 {
233         // would remove from "disk" here
234         kfs_destroy_inode(inode);
235 }
236
237 /* unmount and release the super block */
238 void kfs_put_super(struct super_block *sb)
239 {
240         panic("Shazbot! KFS can't be unmounted yet!");
241 }
242
243 /* updates the on-disk SB with the in-memory SB */
244 void kfs_write_super(struct super_block *sb)
245 {       // KFS doesn't care
246 }
247
248 /* syncs FS metadata with the disc, synchronously if we're waiting.  this info
249  * also includes anything pointed to by s_fs_info. */
250 int kfs_sync_fs(struct super_block *sb, bool wait)
251 {
252         return 0;
253 }
254
255 /* remount the FS with the new flags */
256 int kfs_remount_fs(struct super_block *sb, int flags, char *data)
257 {
258         warn("KFS will not remount.");
259         return -1; // can't remount
260 }
261
262 /* interrupts a mount operation - used by NFS and friends */
263 void kfs_umount_begin(struct super_block *sb)
264 {
265         panic("Cannot abort a KFS mount, and why would you?");
266 }
267
268 /* inode_operations */
269
270 /* Little helper, used for initializing new inodes for file-like objects (files,
271  * symlinks, etc).  We pass the dentry, since we need to up it. */
272 static void kfs_init_inode(struct inode *dir, struct dentry *dentry)
273 {
274         struct inode *inode = dentry->d_inode;
275         kref_get(&dentry->d_kref, 1);   /* to pin the dentry in RAM, KFS-style... */
276         inode->i_ino = kfs_get_free_ino();
277         /* our parent dentry's inode tracks our dentry info.  We do this
278          * since it's all in memory and we aren't using the dcache yet.
279          * We're reusing the subdirs link, which is used by the VFS when
280          * we're a directory.  But since we're a file, it's okay to reuse
281          * it. */
282         TAILQ_INSERT_TAIL(&((struct kfs_i_info*)dir->i_fs_info)->children,
283                           dentry, d_subdirs_link);
284 }
285
286 /* Called when creating a new disk inode in dir associated with dentry.  We need
287  * to fill out the i_ino, set the type, and do whatever else we need */
288 int kfs_create(struct inode *dir, struct dentry *dentry, int mode,
289                struct nameidata *nd)
290 {
291         struct inode *inode = dentry->d_inode;
292         kfs_init_inode(dir, dentry);
293         inode->i_type = FS_I_FILE;
294         inode->i_fop = &kfs_f_op_file;
295         /* fs_info->filestart is set by the caller, or else when first written (for
296          * new files.  it was set to 0 in alloc_inode(). */
297         return 0;
298 }
299
300 /* Searches the directory for the filename in the dentry, filling in the dentry
301  * with the FS specific info of this file.  If it succeeds, it will pass back
302  * the *dentry you should use.  If this fails, it will return 0 and will take
303  * the ref to the dentry for you.  Either way, you shouldn't use the ref you
304  * passed in anymore.  Still, there are issues with refcnting with this.
305  *
306  * Callers, make sure you alloc and fill out the name parts of the dentry, and
307  * an initialized nameidata. TODO: not sure why we need an ND.  Don't use it in
308  * a fs_lookup for now!
309  *
310  * Because of the way KFS currently works, if there is ever a dentry, it's
311  * already in memory, along with its inode (all path's pinned).  So we just find
312  * it and return it, freeing the one that came in. */
313 struct dentry *kfs_lookup(struct inode *dir, struct dentry *dentry,
314                           struct nameidata *nd)
315 {
316         struct kfs_i_info *k_i_info = (struct kfs_i_info*)dir->i_fs_info;
317         struct dentry *dir_dent = TAILQ_FIRST(&dir->i_dentry);
318         struct dentry *d_i;
319
320         assert(dir_dent && dir_dent == TAILQ_LAST(&dir->i_dentry, dentry_tailq));
321         assert(dir->i_type & FS_I_DIR);
322         assert(kref_refcnt(&dentry->d_kref) == 1);
323         TAILQ_FOREACH(d_i, &dir_dent->d_subdirs, d_subdirs_link) {
324                 if (!strcmp(d_i->d_name.name, dentry->d_name.name)) {
325                         /* since this dentry is already in memory (that's how KFS works), we
326                          * can free the one that came in and return the real one */
327                         kref_put(&dentry->d_kref);
328                         kref_get(&d_i->d_kref, 1);
329                         return d_i;
330                 }
331         }
332         TAILQ_FOREACH(d_i, &k_i_info->children, d_subdirs_link) {
333                 if (!strcmp(d_i->d_name.name, dentry->d_name.name)) {
334                         /* since this dentry is already in memory (that's how KFS works), we
335                          * can free the one that came in and return the real one */
336                         kref_put(&dentry->d_kref);
337                         kref_get(&d_i->d_kref, 1);
338                         return d_i;
339                 }
340         }
341         /* no match, consider caching the negative result, freeing the
342          * dentry, etc */
343         printd("Not Found %s!!\n", dentry->d_name.name);
344         kref_put(&dentry->d_kref);
345         return 0;
346 }
347
348 /* Hard link to old_dentry in directory dir with a name specified by new_dentry.
349  * At the very least, set the new_dentry's FS-specific fields. */
350 int kfs_link(struct dentry *old_dentry, struct inode *dir,
351              struct dentry *new_dentry)
352 {
353         assert(new_dentry->d_op = &kfs_d_op);
354         kref_get(&new_dentry->d_kref, 1);               /* pin the dentry, KFS-style */
355         /* KFS-style directory-tracking-of-kids */
356         TAILQ_INSERT_TAIL(&((struct kfs_i_info*)dir->i_fs_info)->children,
357                           new_dentry, d_subdirs_link);
358         return 0;
359 }
360
361 /* Removes the link from the dentry in the directory */
362 int kfs_unlink(struct inode *dir, struct dentry *dentry)
363 {
364         return -1;
365 }
366
367 /* Creates a new inode for a symlink dir, linking to / containing the name
368  * symname.  dentry is the controlling dentry of the inode. */
369 int kfs_symlink(struct inode *dir, struct dentry *dentry, const char *symname)
370 {
371         struct inode *inode = dentry->d_inode;
372         struct kfs_i_info *k_i_info = (struct kfs_i_info*)inode->i_fs_info;
373         size_t len = strlen(symname);
374         char *string = kmalloc(len + 1, 0);
375
376         kfs_init_inode(dir, dentry);
377         inode->i_type = FS_I_SYMLINK;
378         inode->i_fop = &kfs_f_op_sym;
379         strncpy(string, symname, len);
380         string[len] = '\0';             /* symname should be \0d anyway, but just in case */
381         k_i_info->filestart = string;   /* reusing this void* to hold the char* */
382         return 0;
383 }
384
385 /* Called when creating a new inode for a directory associated with dentry in
386  * dir with the given mode.  Note, we might (later) need to track subdirs within
387  * the parent inode, like we do with regular files.  I'd rather not, so we'll
388  * see if we need it. */
389 int kfs_mkdir(struct inode *dir, struct dentry *dentry, int mode)
390 {
391         struct inode *inode = dentry->d_inode;
392         kref_get(&dentry->d_kref, 1);   /* to pin the dentry in RAM, KFS-style... */
393         inode->i_ino = kfs_get_free_ino();
394         inode->i_type = FS_I_DIR;
395         inode->i_fop = &kfs_f_op_dir;
396         /* get ready to have our own kids */
397         TAILQ_INIT(&((struct kfs_i_info*)inode->i_fs_info)->children);
398         ((struct kfs_i_info*)inode->i_fs_info)->filestart = 0;
399         return 0;
400 }
401
402 /* Removes from dir the directory specified by the name in dentry. */
403 // TODO: note this isn't necessarily the same dentry, just using it for the
404 // naming (which seems to be a common way of doing things, like in lookup() -
405 // can work either way.
406 int kfs_rmdir(struct inode *dir, struct dentry *dentry)
407 {
408         return -1;
409 }
410
411 /* Used to make a generic file, based on the type and the major/minor numbers
412  * (in rdev), with the given mode.  As with others, this creates a new disk
413  * inode for the file */
414 int kfs_mknod(struct inode *dir, struct dentry *dentry, int mode, dev_t rdev)
415 {
416         return -1;
417 }
418
419 /* Moves old_dentry from old_dir to new_dentry in new_dir */
420 int kfs_rename(struct inode *old_dir, struct dentry *old_dentry,
421                struct inode *new_dir, struct dentry *new_dentry)
422 {
423         return -1;
424 }
425
426 /* Returns the char* for the symname for the given dentry.  The VFS code that
427  * calls this for real FS's might assume it's already read in, so if the char *
428  * isn't already in memory, we'd need to read it in here.  Regarding the char*
429  * storage, the char* only will last as long as the dentry and inode are in
430  * memory. */
431 char *kfs_readlink(struct dentry *dentry)
432 {
433         struct inode *inode = dentry->d_inode;
434         struct kfs_i_info *k_i_info = (struct kfs_i_info*)inode->i_fs_info;
435         if (inode->i_type != FS_I_SYMLINK)
436                 return 0;
437         return k_i_info->filestart;
438 }
439
440 /* Modifies the size of the file of inode to whatever its i_size is set to */
441 void kfs_truncate(struct inode *inode)
442 {
443 }
444
445 /* Checks whether the the access mode is allowed for the file belonging to the
446  * inode.  Implies that the permissions are on the file, and not the hardlink */
447 int kfs_permission(struct inode *inode, int mode, struct nameidata *nd)
448 {
449         return -1;
450 }
451
452
453 /* dentry_operations */
454 /* Determines if the dentry is still valid before using it to translate a path.
455  * Network FS's need to deal with this. */
456 int kfs_d_revalidate(struct dentry *dir, struct nameidata *nd)
457 { // default, nothing
458         return -1;
459 }
460
461 /* Produces the hash to lookup this dentry from the dcache */
462 int kfs_d_hash(struct dentry *dentry, struct qstr *name)
463 {
464         return -1;
465 }
466
467 /* Compares name1 and name2.  name1 should be a member of dir. */
468 int kfs_d_compare(struct dentry *dir, struct qstr *name1, struct qstr *name2)
469 { // default, string comp (case sensitive)
470         return -1;
471 }
472
473 /* Called when the last ref is deleted (refcnt == 0) */
474 int kfs_d_delete(struct dentry *dentry)
475 { // default, nothin
476         return -1;
477 }
478
479 /* Called when it's about to be slab-freed */
480 int kfs_d_release(struct dentry *dentry)
481 {
482         return -1;
483 }
484
485 /* Called when the dentry loses it's inode (becomes "negative") */
486 void kfs_d_iput(struct dentry *dentry, struct inode *inode)
487 { // default, call i_put to release the inode object
488 }
489
490
491 /* file_operations */
492
493 /* Updates the file pointer.  KFS doesn't let you go past the end of a file
494  * yet, so it won't let you seek past either.  TODO: think about locking. */
495 off_t kfs_llseek(struct file *file, off_t offset, int whence)
496 {
497         off_t temp_off = 0;
498         switch (whence) {
499                 case SEEK_SET:
500                         temp_off = offset;
501                         break;
502                 case SEEK_CUR:
503                         temp_off = file->f_pos + offset;
504                         break;
505                 case SEEK_END:
506                         temp_off = file->f_dentry->d_inode->i_size + offset;
507                         break;
508                 default:
509                         set_errno(EINVAL);
510                         warn("Unknown 'whence' in llseek()!\n");
511                         return -1;
512         }
513         /* make sure the f_pos isn't outside the limits of the existing file.
514          * techincally, if they go too far, we should return EINVAL */
515         temp_off = MAX(MIN(temp_off, file->f_dentry->d_inode->i_size), 0);
516         file->f_pos = temp_off;
517         return temp_off;
518 }
519
520 /* Fills in the next directory entry (dirent), starting with d_off.  Like with
521  * read and write, there will be issues with userspace and the *dirent buf.
522  * TODO: we don't really do anything with userspace concerns here, in part
523  * because memcpy_to doesn't work well.  When we fix how we want to handle the
524  * userbuffers, we can write this accordingly. (UMEM)  */
525 int kfs_readdir(struct file *dir, struct dirent *dirent)
526 {
527         int count = 0;
528         bool found = FALSE;
529         struct dentry *subent;
530         struct dentry *dir_d = dir->f_dentry;
531         struct kfs_i_info *k_i_info = (struct kfs_i_info*)dir_d->d_inode->i_fs_info;
532
533         /* how we check inside the for loops below.  moderately ghetto. */
534         void check_entry(void)
535         {
536                 if (count++ == dirent->d_off) {
537                         dirent->d_ino = subent->d_inode->i_ino;
538                         dirent->d_reclen = subent->d_name.len;
539                         /* d_name.name is null terminated, the byte after d_name.len */
540                         assert(subent->d_name.len <= MAX_FILENAME_SZ);
541                         strncpy(dirent->d_name, subent->d_name.name, subent->d_name.len +1);
542                         found = TRUE;
543                 }
544         }
545         /* some of this error handling can be done by the VFS.  The syscall should
546          * handle EBADF, EFAULT, and EINVAL (TODO, memory related). */
547         if (!(dir_d->d_inode->i_type & FS_I_DIR)) {
548                 set_errno(ENOTDIR);
549                 return -1;
550         }
551
552         /* need to check the sub-dirs as well as the sub-"files" */
553         TAILQ_FOREACH(subent, &dir_d->d_subdirs, d_subdirs_link)
554                 check_entry();
555         TAILQ_FOREACH(subent, &k_i_info->children, d_subdirs_link)
556                 check_entry();
557
558         if (!found) {
559                 set_errno(ENOENT);
560                 return -1;
561         }
562         if (count - 1 == dirent->d_off)         /* found the last dir in the list */
563                 return 0;
564         return 1;                                                       /* normal success for readdir */
565 }
566
567 /* This is called when a VMR is mapping a particular file.  The FS needs to do
568  * whatever it needs so that faults can be handled by read_page(), and handle all
569  * of the cases of MAP_SHARED, MAP_PRIVATE, whatever.  It also needs to ensure
570  * the file is not being mmaped in a way that conflicts with the manner in which
571  * the file was opened or the file type. */
572 int kfs_mmap(struct file *file, struct vm_region *vmr)
573 {
574         if (file->f_dentry->d_inode->i_type & FS_I_FILE)
575                 return 0;
576         return -1;
577 }
578
579 /* Called by the VFS while opening the file, which corresponds to inode,  for
580  * the FS to do whatever it needs. */
581 int kfs_open(struct inode *inode, struct file *file)
582 {
583         return 0;
584 }
585
586 /* Called when a file descriptor is closed. */
587 int kfs_flush(struct file *file)
588 {
589         return -1;
590 }
591
592 /* Called when the file is about to be closed (file obj freed) */
593 int kfs_release(struct inode *inode, struct file *file)
594 {
595         return 0;
596 }
597
598 /* Flushes the file's dirty contents to disc */
599 int kfs_fsync(struct file *file, struct dentry *dentry, int datasync)
600 {
601         return -1;
602 }
603
604 /* Traditionally, sleeps until there is file activity.  We probably won't
605  * support this, or we'll handle it differently. */
606 unsigned int kfs_poll(struct file *file, struct poll_table_struct *poll_table)
607 {
608         return -1;
609 }
610
611 /* Reads count bytes from a file, starting from (and modifiying) offset, and
612  * putting the bytes into buffers described by vector */
613 ssize_t kfs_readv(struct file *file, const struct iovec *vector,
614                   unsigned long count, off_t *offset)
615 {
616         return -1;
617 }
618
619 /* Writes count bytes to a file, starting from (and modifiying) offset, and
620  * taking the bytes from buffers described by vector */
621 ssize_t kfs_writev(struct file *file, const struct iovec *vector,
622                   unsigned long count, off_t *offset)
623 {
624         return -1;
625 }
626
627 /* Write the contents of file to the page.  Will sort the params later */
628 ssize_t kfs_sendpage(struct file *file, struct page *page, int offset,
629                      size_t size, off_t pos, int more)
630 {
631         return -1;
632 }
633
634 /* Checks random FS flags.  Used by NFS. */
635 int kfs_check_flags(int flags)
636 { // default, nothing
637         return -1;
638 }
639
640 /* Redeclaration and initialization of the FS ops structures */
641 struct page_map_operations kfs_pm_op = {
642         kfs_readpage,
643 };
644
645 struct super_operations kfs_s_op = {
646         kfs_alloc_inode,
647         kfs_destroy_inode,
648         kfs_read_inode,
649         kfs_dirty_inode,
650         kfs_write_inode,
651         kfs_put_inode,
652         kfs_drop_inode,
653         kfs_delete_inode,
654         kfs_put_super,
655         kfs_write_super,
656         kfs_sync_fs,
657         kfs_remount_fs,
658         kfs_umount_begin,
659 };
660
661 struct inode_operations kfs_i_op = {
662         kfs_create,
663         kfs_lookup,
664         kfs_link,
665         kfs_unlink,
666         kfs_symlink,
667         kfs_mkdir,
668         kfs_rmdir,
669         kfs_mknod,
670         kfs_rename,
671         kfs_readlink,
672         kfs_truncate,
673         kfs_permission,
674 };
675
676 struct dentry_operations kfs_d_op = {
677         kfs_d_revalidate,
678         kfs_d_hash,
679         kfs_d_compare,
680         kfs_d_delete,
681         kfs_d_release,
682         kfs_d_iput,
683 };
684
685 struct file_operations kfs_f_op_file = {
686         kfs_llseek,
687         generic_file_read,
688         generic_file_write,
689         kfs_readdir,
690         kfs_mmap,
691         kfs_open,
692         kfs_flush,
693         kfs_release,
694         kfs_fsync,
695         kfs_poll,
696         kfs_readv,
697         kfs_writev,
698         kfs_sendpage,
699         kfs_check_flags,
700 };
701
702 struct file_operations kfs_f_op_dir = {
703         kfs_llseek,
704         generic_dir_read,
705         0,
706         kfs_readdir,
707         kfs_mmap,
708         kfs_open,
709         kfs_flush,
710         kfs_release,
711         kfs_fsync,
712         kfs_poll,
713         kfs_readv,
714         kfs_writev,
715         kfs_sendpage,
716         kfs_check_flags,
717 };
718
719 struct file_operations kfs_f_op_sym = {
720         kfs_llseek,
721         generic_file_read,
722         generic_file_write,
723         kfs_readdir,
724         kfs_mmap,
725         kfs_open,
726         kfs_flush,
727         kfs_release,
728         kfs_fsync,
729         kfs_poll,
730         kfs_readv,
731         kfs_writev,
732         kfs_sendpage,
733         kfs_check_flags,
734 };
735
736 /* KFS Specific Internal Functions */
737
738 /* Need to pass path separately, since we'll recurse on it.  TODO: this recurses,
739  * and takes up a lot of stack space (~270 bytes).  Core 0's KSTACK is 8 pages,
740  * which can handle about 120 levels deep...  Other cores are not so fortunate.
741  * Can rework this if it becomes an issue. */
742 static int __add_kfs_entry(struct dentry *parent, char *path,
743                            struct cpio_bin_hdr *c_bhdr)
744 {
745         char *first_slash = strchr(path, '/');  
746         char dir[MAX_FILENAME_SZ + 1];  /* room for the \0 */
747         size_t dirname_sz;                              /* not counting the \0 */
748         struct dentry *dentry = 0;
749         struct inode *inode;
750         int err;
751         char *symname, old_end;                 /* for symlink manipulation */
752
753         if (first_slash) {
754                 /* get the first part, find that dentry, pass in the second part,
755                  * recurse.  this isn't being smart about extra slashes, dots, or
756                  * anything like that. */
757                 dirname_sz = first_slash - path;
758                 assert(dirname_sz <= MAX_FILENAME_SZ);
759                 strncpy(dir, path, dirname_sz);
760                 dir[dirname_sz] = '\0';
761                 printd("Finding DIR %s in dentry %s (start: %p, size %d)\n", dir,
762                        parent->d_name.name, c_bhdr->c_filestart, c_bhdr->c_filesize);
763                 /* Need to create a dentry for the lookup, and fill in the basic nd */
764                 dentry = get_dentry(parent->d_sb, parent, dir);
765                 /* TODO: use a VFS lookup instead, to use the dcache, thought its not a
766                  * big deal since KFS currently pins all metadata. */
767                 dentry = kfs_lookup(parent->d_inode, dentry, 0);
768                 if (!dentry) {
769                         printk("Missing dir in CPIO archive or something, aborting.\n");
770                         return -1;
771                 }
772                 return __add_kfs_entry(dentry, first_slash + 1, c_bhdr);
773         } else {
774                 /* no directories left in the path.  add the 'file' to the dentry */
775                 printd("Adding file/dir %s to dentry %s (start: %p, size %d)\n", path,
776                        parent->d_name.name, c_bhdr->c_filestart, c_bhdr->c_filesize);
777                 /* Init the dentry for this path */
778                 dentry = get_dentry(parent->d_sb, parent, path);
779                 dcache_put(dentry);                     /* TODO: should set a d_flag too */
780                 /* build the inode */
781                 switch (c_bhdr->c_mode & CPIO_FILE_MASK) {
782                         case (CPIO_DIRECTORY):
783                                 err = create_dir(parent->d_inode, dentry, c_bhdr->c_mode);
784                                 assert(!err);
785                                 break;
786                         case (CPIO_SYMLINK):
787                                 /* writing the '\0' is safe since the next entry is always still
788                                  * in the CPIO (and we are processing sequentially). */
789                                 symname = c_bhdr->c_filestart;
790                                 old_end = symname[c_bhdr->c_filesize];
791                                 symname[c_bhdr->c_filesize] = '\0';
792                                 err = create_symlink(parent->d_inode, dentry, symname,
793                                                      c_bhdr->c_mode & CPIO_PERM_MASK);
794                                 assert(!err);
795                                 symname[c_bhdr->c_filesize] = old_end;
796                                 break;
797                         case (CPIO_REG_FILE):
798                                 err = create_file(parent->d_inode, dentry,
799                                                   c_bhdr->c_mode & CPIO_PERM_MASK);
800                                 assert(!err);
801                                 ((struct kfs_i_info*)dentry->d_inode->i_fs_info)->filestart =
802                                                                                                                 c_bhdr->c_filestart;
803                                 ((struct kfs_i_info*)dentry->d_inode->i_fs_info)->init_size =
804                                                                                                                 c_bhdr->c_filesize;
805                                 break;
806                         default:
807                                 printk("Unknown file type %d in the CPIO!",
808                                        c_bhdr->c_mode & CPIO_FILE_MASK);
809                                 return -1;
810                 }
811                 inode = dentry->d_inode;
812                 /* Set other info from the CPIO entry */
813                 inode->i_uid = c_bhdr->c_uid;
814                 inode->i_gid = c_bhdr->c_gid;
815                 inode->i_atime.tv_sec = c_bhdr->c_mtime;
816                 inode->i_ctime.tv_sec = c_bhdr->c_mtime;
817                 inode->i_mtime.tv_sec = c_bhdr->c_mtime;
818                 inode->i_size = c_bhdr->c_filesize;
819                 //inode->i_XXX = c_bhdr->c_dev;                 /* and friends */
820                 inode->i_bdev = 0;                                              /* assuming blockdev? */
821                 inode->i_socket = FALSE;
822                 inode->i_blocks = c_bhdr->c_filesize;   /* blocksize == 1 */
823         }
824         return 0;
825 }
826
827 /* Adds an entry (from a CPIO archive) to KFS.  This will put all the FS
828  * metadata in memory, instead of having to reparse the entire archive each time
829  * we need to traverse.
830  *
831  * The other option is to just maintain a LL of {FN, FS}, and O(n) scan it.
832  *
833  * The path is a complete path, interpreted from the root of the mount point.
834  * Directories have a size of 0.  so do symlinks, but we don't handle those yet.
835  *
836  * If a directory does not exist for a file, this will return an error.  Don't
837  * use the -depth flag to find when building the CPIO archive, and this won't be
838  * a problem.  (Maybe) */
839 static int add_kfs_entry(struct super_block *sb, struct cpio_bin_hdr *c_bhdr)
840 {
841         char *path = c_bhdr->c_filename;
842         /* Root of the FS, already part of KFS */
843         if (!strcmp(path, "."))
844                 return 0;
845         return __add_kfs_entry(sb->s_mount->mnt_root, path, c_bhdr);
846 }
847
848 void parse_cpio_entries(struct super_block *sb, void *cpio_b)
849 {
850         struct cpio_newc_header *c_hdr = (struct cpio_newc_header*)cpio_b;
851
852         char buf[9] = {0};      /* temp space for strol conversions */
853         size_t namesize = 0;
854         int offset = 0;         /* offset in the cpio archive */
855         struct cpio_bin_hdr *c_bhdr = kmalloc(sizeof(*c_bhdr), 0);
856         memset(c_bhdr, 0, sizeof(*c_bhdr));
857
858         /* read all files and paths */
859         for (; ; c_hdr = (struct cpio_newc_header*)(cpio_b + offset)) {
860                 offset += sizeof(*c_hdr);
861                 if (strncmp(c_hdr->c_magic, "070701", 6)) {
862                         printk("Invalid magic number in CPIO header, aborting.\n");
863                         return;
864                 }
865                 c_bhdr->c_filename = (char*)c_hdr + sizeof(*c_hdr);
866                 namesize = cpio_strntol(buf, c_hdr->c_namesize, 8);
867                 printd("Namesize: %d\n", size);
868                 if (!strcmp(c_bhdr->c_filename, "TRAILER!!!"))
869                         break;
870                 c_bhdr->c_ino = cpio_strntol(buf, c_hdr->c_ino, 8);
871                 c_bhdr->c_mode = (int)cpio_strntol(buf, c_hdr->c_mode, 8);
872                 c_bhdr->c_uid = cpio_strntol(buf, c_hdr->c_uid, 8);
873                 c_bhdr->c_gid = cpio_strntol(buf, c_hdr->c_gid, 8);
874                 c_bhdr->c_nlink = (unsigned int)cpio_strntol(buf, c_hdr->c_nlink, 8);
875                 c_bhdr->c_mtime = cpio_strntol(buf, c_hdr->c_mtime, 8);
876                 c_bhdr->c_filesize = cpio_strntol(buf, c_hdr->c_filesize, 8);
877                 c_bhdr->c_dev_maj = cpio_strntol(buf, c_hdr->c_dev_maj, 8);
878                 c_bhdr->c_dev_min = cpio_strntol(buf, c_hdr->c_dev_min, 8);
879                 c_bhdr->c_rdev_maj = cpio_strntol(buf, c_hdr->c_rdev_maj, 8);
880                 c_bhdr->c_rdev_min = cpio_strntol(buf, c_hdr->c_rdev_min, 8);
881                 printd("File: %s: %d Bytes\n", c_bhdr->c_filename, c_bhdr->c_filesize);
882                 offset += namesize;
883                 /* header + name will be padded out to 4-byte alignment */
884                 offset = ROUNDUP(offset, 4);
885                 c_bhdr->c_filestart = cpio_b + offset;
886                 /* make this a function pointer or something */
887                 if (add_kfs_entry(sb, c_bhdr)) {
888                         printk("Failed to add an entry to KFS!\n");
889                         break;
890                 }
891                 offset += c_bhdr->c_filesize;
892                 offset = ROUNDUP(offset, 4);
893                 //printk("offset is %d bytes\n", offset);
894                 c_hdr = (struct cpio_newc_header*)(cpio_b + offset);
895         }
896         kfree(c_bhdr);
897 }