Make errno and return value work for async syscalls.
[akaros.git] / kern / src / kfs.c
1 /* Copyright (c) 2009, 2010 The Regents of the University of California
2  * Barret Rhoden <brho@cs.berkeley.edu>
3  * See LICENSE for details.
4  *
5  * Implementation of the KFS file system.  It is a RAM based, read-only FS
6  * consisting of files that are added to the kernel binary image.  Might turn
7  * this into a read/write FS with directories someday. */
8
9 #ifdef __SHARC__
10 #pragma nosharc
11 #endif
12
13 #ifdef __DEPUTY__
14 #pragma nodeputy
15 #endif
16
17 #include <vfs.h>
18 #include <kfs.h>
19 #include <slab.h>
20 #include <kmalloc.h>
21 #include <string.h>
22 #include <stdio.h>
23 #include <assert.h>
24 #include <error.h>
25 #include <cpio.h>
26 #include <pmap.h>
27 #include <smp.h>
28
29 #define KFS_MAX_FILE_SIZE 1024*1024*128
30 #define KFS_MAGIC 0xdead0001
31
32 /* VFS required Functions */
33 /* These structs are declared again and initialized farther down */
34 struct page_map_operations kfs_pm_op;
35 struct super_operations kfs_s_op;
36 struct inode_operations kfs_i_op;
37 struct dentry_operations kfs_d_op;
38 struct file_operations kfs_f_op;
39
40 /* TODO: something more better.  Prob something like the vmem cache, for this,
41  * pids, etc.  Good enough for now.  This also means we can only have one
42  * KFS instance, and we also aren't synchronizing access. */
43 static unsigned long kfs_get_free_ino(void)
44 {
45         static unsigned long last_ino = 1;       /* 1 is reserved for the root */
46         last_ino++;
47         if (!last_ino)
48                 panic("Out of inos in KFS!");
49         return last_ino;
50 }
51
52 /* Slabs for KFS specific info chunks */
53 struct kmem_cache *kfs_i_kcache;
54
55 static void kfs_init(void)
56 {
57         kfs_i_kcache = kmem_cache_create("kfs_ino_info", sizeof(struct kfs_i_info),
58                                          __alignof__(struct kfs_i_info), 0, 0, 0);
59 }
60
61 /* Creates the SB (normally would read in from disc and create).  Passes it's
62  * ref out to whoever consumes this.  Returns 0 on failure.
63  * TODO: consider pulling out more of the FS-independent stuff, if possible.
64  * There are only two things, but the pain in the ass is that you'd need to read
65  * the disc to get that first inode, and it's a FS-specific thing. */
66 struct super_block *kfs_get_sb(struct fs_type *fs, int flags,
67                                char *dev_name, struct vfsmount *vmnt)
68 {
69         /* Ought to check that dev_name has our FS on it.  in this case, it's
70          * irrelevant. */
71         //if (something_bad)
72         //      return 0;
73         static bool ran_once = FALSE;
74         if (!ran_once) {
75                 ran_once = TRUE;
76                 kfs_init();
77         }
78
79         /* Build and init the SB.  No need to read off disc. */
80         struct super_block *sb = get_sb();
81         sb->s_dev = 0;
82         sb->s_blocksize = 1;
83         sb->s_maxbytes = KFS_MAX_FILE_SIZE;
84         sb->s_type = &kfs_fs_type;
85         sb->s_op = &kfs_s_op;
86         sb->s_flags = flags;
87         sb->s_magic = KFS_MAGIC;
88         sb->s_mount = vmnt;
89         sb->s_syncing = FALSE;
90         sb->s_bdev = 0;
91         strlcpy(sb->s_name, "KFS", 32);
92         /* store the location of the CPIO archive.  make this more generic later. */
93         extern uint8_t _binary_obj_kern_initramfs_cpio_size[];
94         extern uint8_t _binary_obj_kern_initramfs_cpio_start[];
95         sb->s_fs_info = (void*)_binary_obj_kern_initramfs_cpio_start;
96
97         /* Final stages of initializing the sb, mostly FS-independent */
98         /* 1 is the KFS root ino (inode number) */
99         init_sb(sb, vmnt, &kfs_d_op, 1, 0);
100         /* Parses the CPIO entries and builds the in-memory KFS tree. */
101         parse_cpio_entries(sb, sb->s_fs_info);
102         printk("KFS superblock loaded\n");
103         return sb;
104 }
105
106 void kfs_kill_sb(struct super_block *sb)
107 {
108         panic("Killing KFS is not supported!");
109 }
110
111 /* Every FS must have a static FS Type, with which the VFS code can bootstrap */
112 struct fs_type kfs_fs_type = {"KFS", 0, kfs_get_sb, kfs_kill_sb, {0, 0},
113                TAILQ_HEAD_INITIALIZER(kfs_fs_type.fs_supers)};
114
115 /* Page Map Operations */
116
117 /* Fills page with its contents from its backing store file.  Note that we do
118  * the zero padding here, instead of higher in the VFS.  Might change in the
119  * future. */
120 int kfs_readpage(struct file *file, struct page *page)
121 {
122         size_t pg_idx_byte = page->pg_index * PGSIZE;
123         struct kfs_i_info *k_i_info = (struct kfs_i_info*)
124                                       file->f_dentry->d_inode->i_fs_info;
125         uintptr_t begin = (size_t)k_i_info->filestart + pg_idx_byte;
126         /* If we're beyond the initial start point, we just need a zero page.  This
127          * is for a hole or for extending a file (even though it won't be saved).
128          * Otherwise, we want the data from KFS, being careful to not copy from
129          * beyond the original EOF (and zero padding anything extra). */
130         if (pg_idx_byte >= k_i_info->init_size) {
131                 memset(page2kva(page), 0, PGSIZE);
132         } else {
133                 size_t copy_amt = MIN(PGSIZE, k_i_info->init_size - pg_idx_byte);
134                 memcpy(page2kva(page), (void*)begin, copy_amt);
135                 memset(page2kva(page) + copy_amt, 0, PGSIZE - copy_amt);
136         }
137         /* This is supposed to be done in the IO system when the operation is
138          * complete.  Since we aren't doing a real IO request, and it is already
139          * done, we can do it here. */
140         page->pg_flags |= PG_UPTODATE;
141         unlock_page(page);
142         return 0;
143 }
144
145 /* Super Operations */
146
147 /* creates and initializes a new inode.  generic fields are filled in.  specific
148  * fields are filled in in read_inode() based on what's on the disk for a given
149  * i_no.  i_no is set by the caller.  Note that this means this inode can be for
150  * an inode that is already on disk, or it can be used when creating. */
151 struct inode *kfs_alloc_inode(struct super_block *sb)
152 {
153         struct inode *inode = kmem_cache_alloc(inode_kcache, 0);
154         memset(inode, 0, sizeof(struct inode));
155         inode->i_op = &kfs_i_op;
156         inode->i_fop = &kfs_f_op;
157         inode->i_pm.pm_op = &kfs_pm_op;
158         inode->i_fs_info = kmem_cache_alloc(kfs_i_kcache, 0);
159         TAILQ_INIT(&((struct kfs_i_info*)inode->i_fs_info)->children);
160         ((struct kfs_i_info*)inode->i_fs_info)->filestart = 0;
161         return inode;
162 }
163
164 /* deallocs and cleans up after an inode. */
165 void kfs_destroy_inode(struct inode *inode)
166 {
167         kmem_cache_free(kfs_i_kcache, inode->i_fs_info);
168 }
169
170 /* reads the inode data on disk specified by inode->i_ino into the inode.
171  * basically, it's a "make this inode the one for i_ino (i number)" */
172 void kfs_read_inode(struct inode *inode)
173 {
174         /* need to do something to link this inode/file to the actual "blocks" on
175          * "disk". */
176
177         /* TODO: what does it mean to ask for an inode->i_ino that doesn't exist?
178          *      possibly a bug, since these inos come from directories */
179         if (inode->i_ino == 1) {
180                 inode->i_mode = S_IRWXU | S_IRWXG | S_IRWXO;
181                 inode->i_type = FS_I_DIR;
182                 inode->i_nlink = 1;                             /* assuming only one hardlink */
183                 inode->i_uid = 0;
184                 inode->i_gid = 0;
185                 inode->i_rdev = 0;
186                 inode->i_size = 0;                              /* make sense for KFS? */
187                 inode->i_atime.tv_sec = 0;
188                 inode->i_atime.tv_nsec = 0;
189                 inode->i_mtime.tv_sec = 0;
190                 inode->i_mtime.tv_nsec = 0;
191                 inode->i_ctime.tv_sec = 0;
192                 inode->i_ctime.tv_nsec = 0;
193                 inode->i_blocks = 0;
194                 inode->i_bdev = 0;                              /* assuming blockdev? */
195                 inode->i_flags = 0;
196                 inode->i_socket = FALSE;
197         } else {
198                 panic("Not implemented");
199         }
200         /* TODO: unused: inode->i_hash add to hash (saves on disc reading) */
201 }
202
203 /* called when an inode in memory is modified (journalling FS's care) */
204 void kfs_dirty_inode(struct inode *inode)
205 {       // KFS doesn't care
206 }
207
208 /* write the inode to disk (specifically, to inode inode->i_ino), synchronously
209  * if we're asked to wait */
210 void kfs_write_inode(struct inode *inode, bool wait)
211 {       // KFS doesn't care
212 }
213
214 /* called when an inode is decref'd, to do any FS specific work */
215 void kfs_put_inode(struct inode *inode)
216 {       // KFS doesn't care
217 }
218
219 /* called when an inode is about to be destroyed.  the generic version ought to
220  * remove every reference to the inode from the VFS, and if the inode isn't in
221  * any directory, calls delete_inode */
222 void kfs_drop_inode(struct inode *inode)
223 { // TODO: should call a generic one instead.  or at least do something...
224         // remove from lists
225 }
226
227 /* delete the inode from disk (all data) and deallocs the in memory inode */
228 void kfs_delete_inode(struct inode *inode)
229 {
230         // would remove from "disk" here
231         kfs_destroy_inode(inode);
232 }
233
234 /* unmount and release the super block */
235 void kfs_put_super(struct super_block *sb)
236 {
237         panic("Shazbot! KFS can't be unmounted yet!");
238 }
239
240 /* updates the on-disk SB with the in-memory SB */
241 void kfs_write_super(struct super_block *sb)
242 {       // KFS doesn't care
243 }
244
245 /* syncs FS metadata with the disc, synchronously if we're waiting.  this info
246  * also includes anything pointed to by s_fs_info. */
247 int kfs_sync_fs(struct super_block *sb, bool wait)
248 {
249         return 0;
250 }
251
252 /* remount the FS with the new flags */
253 int kfs_remount_fs(struct super_block *sb, int flags, char *data)
254 {
255         warn("KFS will not remount.");
256         return -1; // can't remount
257 }
258
259 /* interrupts a mount operation - used by NFS and friends */
260 void kfs_umount_begin(struct super_block *sb)
261 {
262         panic("Cannot abort a KFS mount, and why would you?");
263 }
264
265 /* inode_operations */
266
267 /* Called when creating a new disk inode in dir associated with dentry.  We need
268  * to fill out the i_ino, set the type, and do whatever else we need */
269 int kfs_create(struct inode *dir, struct dentry *dentry, int mode,
270                struct nameidata *nd)
271 {
272         struct inode *inode = dentry->d_inode;
273         kref_get(&dentry->d_kref, 1);   /* to pin the dentry in RAM, KFS-style... */
274         inode->i_ino = kfs_get_free_ino();
275         inode->i_type = FS_I_FILE;
276         /* our parent dentry's inode tracks our dentry info.  We do this
277          * since it's all in memory and we aren't using the dcache yet.
278          * We're reusing the subdirs link, which is used by the VFS when
279          * we're a directory.  But since we're a file, it's okay to reuse
280          * it. */
281         TAILQ_INSERT_TAIL(&((struct kfs_i_info*)dir->i_fs_info)->children,
282                           dentry, d_subdirs_link);
283         /* fs_info->filestart is set by the caller, or else when first written (for
284          * new files.  it was set to 0 in alloc_inode(). */
285         return 0;
286 }
287
288 /* Searches the directory for the filename in the dentry, filling in the dentry
289  * with the FS specific info of this file.  If it succeeds, it will pass back
290  * the *dentry you should use.  If this fails, it will return 0 and will take
291  * the ref to the dentry for you.  Either way, you shouldn't use the ref you
292  * passed in anymore.  Still, there are issues with refcnting with this.
293  *
294  * Callers, make sure you alloc and fill out the name parts of the dentry, and
295  * an initialized nameidata. TODO: not sure why we need an ND.  Don't use it in
296  * a fs_lookup for now!
297  *
298  * Because of the way KFS currently works, if there is ever a dentry, it's
299  * already in memory, along with its inode (all path's pinned).  So we just find
300  * it and return it, freeing the one that came in. */
301 struct dentry *kfs_lookup(struct inode *dir, struct dentry *dentry,
302                           struct nameidata *nd)
303 {
304         struct kfs_i_info *k_i_info = (struct kfs_i_info*)dir->i_fs_info;
305         struct dentry *dir_dent = TAILQ_FIRST(&dir->i_dentry);
306         struct dentry *d_i;
307
308         assert(dir_dent && dir_dent == TAILQ_LAST(&dir->i_dentry, dentry_tailq));
309         assert(dir->i_type & FS_I_DIR);
310         assert(kref_refcnt(&dentry->d_kref) == 1);
311         TAILQ_FOREACH(d_i, &dir_dent->d_subdirs, d_subdirs_link) {
312                 if (!strcmp(d_i->d_name.name, dentry->d_name.name)) {
313                         /* since this dentry is already in memory (that's how KFS works), we
314                          * can free the one that came in and return the real one */
315                         kref_put(&dentry->d_kref);
316                         kref_get(&d_i->d_kref, 1);
317                         return d_i;
318                 }
319         }
320         TAILQ_FOREACH(d_i, &k_i_info->children, d_subdirs_link) {
321                 if (!strcmp(d_i->d_name.name, dentry->d_name.name)) {
322                         /* since this dentry is already in memory (that's how KFS works), we
323                          * can free the one that came in and return the real one */
324                         kref_put(&dentry->d_kref);
325                         kref_get(&d_i->d_kref, 1);
326                         return d_i;
327                 }
328         }
329         /* no match, consider caching the negative result, freeing the
330          * dentry, etc */
331         printd("Not Found %s!!\n", dentry->d_name.name);
332         kref_put(&dentry->d_kref);
333         return 0;
334 }
335
336 /* Hard link to old_dentry in directory dir with a name specified by new_dentry.
337  * TODO: should this also make the dentry linkage, or just discard everything?*/
338 int kfs_link(struct dentry *old_dentry, struct inode *dir,
339              struct dentry *new_dentry)
340 {
341         return -1;
342 }
343
344 /* Removes the link from the dentry in the directory */
345 int kfs_unlink(struct inode *dir, struct dentry *dentry)
346 {
347         return -1;
348 }
349
350 /* Creates a new inode for a symlink named symname in dir, and links to dentry.
351  * */
352 int kfs_symlink(struct inode *dir, struct dentry *dentry, const char *symname)
353 {
354         return -1;
355 }
356
357 /* Called when creating a new inode for a directory associated with dentry in
358  * dir with the given mode.  Note, we might (later) need to track subdirs within
359  * the parent inode, like we do with regular files.  I'd rather not, so we'll
360  * see if we need it. */
361 int kfs_mkdir(struct inode *dir, struct dentry *dentry, int mode)
362 {
363         struct inode *inode = dentry->d_inode;
364         kref_get(&dentry->d_kref, 1);   /* to pin the dentry in RAM, KFS-style... */
365         inode->i_ino = kfs_get_free_ino();
366         inode->i_type = FS_I_DIR;               /* this might be FS specific in the future */
367         /* get ready to have our own kids */
368         TAILQ_INIT(&((struct kfs_i_info*)inode->i_fs_info)->children);
369         ((struct kfs_i_info*)inode->i_fs_info)->filestart = 0;
370         return 0;
371 }
372
373 /* Removes from dir the directory specified by the name in dentry. */
374 // TODO: note this isn't necessarily the same dentry, just using it for the
375 // naming (which seems to be a common way of doing things, like in lookup() -
376 // can work either way.
377 int kfs_rmdir(struct inode *dir, struct dentry *dentry)
378 {
379         return -1;
380 }
381
382 /* Used to make a generic file, based on the type and the major/minor numbers
383  * (in rdev), with the given mode.  As with others, this creates a new disk
384  * inode for the file */
385 int kfs_mknod(struct inode *dir, struct dentry *dentry, int mode, dev_t rdev)
386 {
387         return -1;
388 }
389
390 /* Moves old_dentry from old_dir to new_dentry in new_dir */
391 int kfs_rename(struct inode *old_dir, struct dentry *old_dentry,
392                struct inode *new_dir, struct dentry *new_dentry)
393 {
394         return -1;
395 }
396
397 /* Copies to the userspace buffer the file pathname corresponding to the symlink
398  * specified by dentry. */
399 int kfs_readlink(struct dentry *dentry, char *buffer, size_t buflen)
400 {
401         return -1;
402 }
403
404 /* Translates the symlink specified by sym and puts the result in nd. */
405 int kfs_follow_link(struct dentry *sym, struct nameidata *nd)
406 {
407         return -1;
408 }
409
410 /* Cleans up after follow_link (decrefs the nameidata business) */
411 int kfs_put_link(struct dentry *sym, struct nameidata *nd)
412 {
413         return -1;
414 }
415
416 /* Modifies the size of the file of inode to whatever its i_size is set to */
417 void kfs_truncate(struct inode *inode)
418 {
419 }
420
421 /* Checks whether the the access mode is allowed for the file belonging to the
422  * inode.  Implies that the permissions are on the file, and not the hardlink */
423 int kfs_permission(struct inode *inode, int mode, struct nameidata *nd)
424 {
425         return -1;
426 }
427
428
429 /* dentry_operations */
430 /* Determines if the dentry is still valid before using it to translate a path.
431  * Network FS's need to deal with this. */
432 int kfs_d_revalidate(struct dentry *dir, struct nameidata *nd)
433 { // default, nothing
434         return -1;
435 }
436
437 /* Produces the hash to lookup this dentry from the dcache */
438 int kfs_d_hash(struct dentry *dentry, struct qstr *name)
439 {
440         return -1;
441 }
442
443 /* Compares name1 and name2.  name1 should be a member of dir. */
444 int kfs_d_compare(struct dentry *dir, struct qstr *name1, struct qstr *name2)
445 { // default, string comp (case sensitive)
446         return -1;
447 }
448
449 /* Called when the last ref is deleted (refcnt == 0) */
450 int kfs_d_delete(struct dentry *dentry)
451 { // default, nothin
452         return -1;
453 }
454
455 /* Called when it's about to be slab-freed */
456 int kfs_d_release(struct dentry *dentry)
457 {
458         return -1;
459 }
460
461 /* Called when the dentry loses it's inode (becomes "negative") */
462 void kfs_d_iput(struct dentry *dentry, struct inode *inode)
463 { // default, call i_put to release the inode object
464 }
465
466
467 /* file_operations */
468
469 /* Updates the file pointer.  KFS doesn't let you go past the end of a file
470  * yet, so it won't let you seek past either.  TODO: think about locking. */
471 off_t kfs_llseek(struct file *file, off_t offset, int whence)
472 {
473         off_t temp_off = 0;
474         switch (whence) {
475                 case SEEK_SET:
476                         temp_off = offset;
477                         break;
478                 case SEEK_CUR:
479                         temp_off = file->f_pos + offset;
480                         break;
481                 case SEEK_END:
482                         temp_off = file->f_dentry->d_inode->i_size + offset;
483                         break;
484                 default:
485                         set_errno(current_tf, EINVAL);
486                         warn("Unknown 'whence' in llseek()!\n");
487                         return -1;
488         }
489         /* make sure the f_pos isn't outside the limits of the existing file.
490          * techincally, if they go too far, we should return EINVAL */
491         temp_off = MAX(MIN(temp_off, file->f_dentry->d_inode->i_size), 0);
492         file->f_pos = temp_off;
493         return temp_off;
494 }
495
496 /* Fills in the next directory entry (dirent), starting with d_off.  Like with
497  * read and write, there will be issues with userspace and the *dirent buf.
498  * TODO: we don't really do anything with userspace concerns here, in part
499  * because memcpy_to doesn't work well.  When we fix how we want to handle the
500  * userbuffers, we can write this accordingly. (UMEM)  */
501 int kfs_readdir(struct file *dir, struct dirent *dirent)
502 {
503         int count = 0;
504         bool found = FALSE;
505         struct dentry *subent;
506         struct dentry *dir_d = dir->f_dentry;
507         struct kfs_i_info *k_i_info = (struct kfs_i_info*)dir_d->d_inode->i_fs_info;
508
509         /* how we check inside the for loops below.  moderately ghetto. */
510         void check_entry(void)
511         {
512                 if (count++ == dirent->d_off) {
513                         dirent->d_ino = subent->d_inode->i_ino;
514                         dirent->d_reclen = subent->d_name.len;
515                         /* d_name.name is null terminated, the byte after d_name.len */
516                         assert(subent->d_name.len <= MAX_FILENAME_SZ);
517                         strncpy(dirent->d_name, subent->d_name.name, subent->d_name.len +1);
518                         found = TRUE;
519                 }
520         }
521         /* some of this error handling can be done by the VFS.  The syscall should
522          * handle EBADF, EFAULT, and EINVAL (TODO, memory related). */
523         if (!(dir_d->d_inode->i_type & FS_I_DIR)) {
524                 set_errno(current_tf, ENOTDIR);
525                 return -1;
526         }
527
528         /* need to check the sub-dirs as well as the sub-"files" */
529         TAILQ_FOREACH(subent, &dir_d->d_subdirs, d_subdirs_link)
530                 check_entry();
531         TAILQ_FOREACH(subent, &k_i_info->children, d_subdirs_link)
532                 check_entry();
533
534         if (!found) {
535                 set_errno(current_tf, ENOENT);
536                 return -1;
537         }
538         if (count - 1 == dirent->d_off)         /* found the last dir in the list */
539                 return 0;
540         return 1;                                                       /* normal success for readdir */
541 }
542
543 /* This is called when a VMR is mapping a particular file.  The FS needs to do
544  * whatever it needs so that faults can be handled by read_page(), and handle all
545  * of the cases of MAP_SHARED, MAP_PRIVATE, whatever.  It also needs to ensure
546  * the file is not being mmaped in a way that conflicts with the manner in which
547  * the file was opened or the file type. */
548 int kfs_mmap(struct file *file, struct vm_region *vmr)
549 {
550         if (file->f_dentry->d_inode->i_type & FS_I_FILE)
551                 return 0;
552         return -1;
553 }
554
555 /* Called by the VFS while opening the file, which corresponds to inode,  for
556  * the FS to do whatever it needs. */
557 int kfs_open(struct inode *inode, struct file *file)
558 {
559         return 0;
560 }
561
562 /* Called when a file descriptor is closed. */
563 int kfs_flush(struct file *file)
564 {
565         return -1;
566 }
567
568 /* Called when the file is about to be closed (file obj freed) */
569 int kfs_release(struct inode *inode, struct file *file)
570 {
571         return 0;
572 }
573
574 /* Flushes the file's dirty contents to disc */
575 int kfs_fsync(struct file *file, struct dentry *dentry, int datasync)
576 {
577         return -1;
578 }
579
580 /* Traditionally, sleeps until there is file activity.  We probably won't
581  * support this, or we'll handle it differently. */
582 unsigned int kfs_poll(struct file *file, struct poll_table_struct *poll_table)
583 {
584         return -1;
585 }
586
587 /* Reads count bytes from a file, starting from (and modifiying) offset, and
588  * putting the bytes into buffers described by vector */
589 ssize_t kfs_readv(struct file *file, const struct iovec *vector,
590                   unsigned long count, off_t *offset)
591 {
592         return -1;
593 }
594
595 /* Writes count bytes to a file, starting from (and modifiying) offset, and
596  * taking the bytes from buffers described by vector */
597 ssize_t kfs_writev(struct file *file, const struct iovec *vector,
598                   unsigned long count, off_t *offset)
599 {
600         return -1;
601 }
602
603 /* Write the contents of file to the page.  Will sort the params later */
604 ssize_t kfs_sendpage(struct file *file, struct page *page, int offset,
605                      size_t size, off_t pos, int more)
606 {
607         return -1;
608 }
609
610 /* Checks random FS flags.  Used by NFS. */
611 int kfs_check_flags(int flags)
612 { // default, nothing
613         return -1;
614 }
615
616 /* Redeclaration and initialization of the FS ops structures */
617 struct page_map_operations kfs_pm_op = {
618         kfs_readpage,
619 };
620
621 struct super_operations kfs_s_op = {
622         kfs_alloc_inode,
623         kfs_destroy_inode,
624         kfs_read_inode,
625         kfs_dirty_inode,
626         kfs_write_inode,
627         kfs_put_inode,
628         kfs_drop_inode,
629         kfs_delete_inode,
630         kfs_put_super,
631         kfs_write_super,
632         kfs_sync_fs,
633         kfs_remount_fs,
634         kfs_umount_begin,
635 };
636
637 struct inode_operations kfs_i_op = {
638         kfs_create,
639         kfs_lookup,
640         kfs_link,
641         kfs_unlink,
642         kfs_symlink,
643         kfs_mkdir,
644         kfs_rmdir,
645         kfs_mknod,
646         kfs_rename,
647         kfs_readlink,
648         kfs_follow_link,
649         kfs_put_link,
650         kfs_truncate,
651         kfs_permission,
652 };
653
654 struct dentry_operations kfs_d_op = {
655         kfs_d_revalidate,
656         kfs_d_hash,
657         kfs_d_compare,
658         kfs_d_delete,
659         kfs_d_release,
660         kfs_d_iput,
661 };
662
663 struct file_operations kfs_f_op = {
664         kfs_llseek,
665         generic_file_read,
666         generic_file_write,
667         kfs_readdir,
668         kfs_mmap,
669         kfs_open,
670         kfs_flush,
671         kfs_release,
672         kfs_fsync,
673         kfs_poll,
674         kfs_readv,
675         kfs_writev,
676         kfs_sendpage,
677         kfs_check_flags,
678 };
679
680 /* KFS Specific Internal Functions */
681
682 /* Need to pass path separately, since we'll recurse on it.  TODO: this recurses,
683  * and takes up a lot of stack space (~270 bytes).  Core 0's KSTACK is 8 pages,
684  * which can handle about 120 levels deep...  Other cores are not so fortunate.
685  * Can rework this if it becomes an issue. */
686 static int __add_kfs_entry(struct dentry *parent, char *path,
687                            struct cpio_bin_hdr *c_bhdr)
688 {
689         char *first_slash = strchr(path, '/');  
690         char dir[MAX_FILENAME_SZ + 1];  /* room for the \0 */
691         size_t dirname_sz;                              /* not counting the \0 */
692         struct dentry *dentry = 0;
693         struct nameidata nd = {0};
694         struct inode *inode;
695
696         if (first_slash) {
697                 /* get the first part, find that dentry, pass in the second part,
698                  * recurse.  this isn't being smart about extra slashes, dots, or
699                  * anything like that. */
700                 dirname_sz = first_slash - path;
701                 assert(dirname_sz <= MAX_FILENAME_SZ);
702                 strncpy(dir, path, dirname_sz);
703                 dir[dirname_sz] = '\0';
704                 printd("Finding DIR %s in dentry %s (start: %p, size %d)\n", dir,
705                        parent->d_name.name, c_bhdr->c_filestart, c_bhdr->c_filesize);
706                 /* Need to create a dentry for the lookup, and fill in the basic nd */
707                 dentry = get_dentry(parent->d_sb, parent, dir);
708                 nd.dentry = dentry;
709                 nd.mnt = dentry->d_sb->s_mount;
710                 //nd.flags = 0;                 /* TODO: once we have lookup flags */
711                 //nd.last_type = 0;             /* TODO: should be a DIR */
712                 //nd.intent = 0;                /* TODO: RW, prob irrelevant*/
713                 /* TODO: use a VFS lookup instead, to use the dcache, thought its not a
714                  * big deal since KFS currently pins all metadata. */
715                 dentry = kfs_lookup(parent->d_inode, dentry, &nd);
716                 if (!dentry) {
717                         printk("Missing dir in CPIO archive or something, aborting.\n");
718                         return -1;
719                 }
720                 return __add_kfs_entry(dentry, first_slash + 1, c_bhdr);
721         } else {
722                 /* no directories left in the path.  add the 'file' to the dentry */
723                 printd("Adding file/dir %s to dentry %s (start: %p, size %d)\n", path,
724                        parent->d_name.name, c_bhdr->c_filestart, c_bhdr->c_filesize);
725                 /* Init the dentry for this path */
726                 dentry = get_dentry(parent->d_sb, parent, path);
727                 dcache_put(dentry);                     /* TODO: should set a d_flag too */
728                 /* build the inode */
729                 /* XXX: note we use an unrefcnt'd inode here (grabbing the dentry's) */
730                 if (!c_bhdr->c_filesize) {
731                         /* we are a directory.  Note that fifos might look like dirs... */
732                         create_dir(parent->d_inode, dentry, c_bhdr->c_mode);
733                         inode = dentry->d_inode;
734                 } else {
735                         /* we are a file */
736                         create_file(parent->d_inode, dentry, c_bhdr->c_mode);
737                         inode = dentry->d_inode;
738                         ((struct kfs_i_info*)inode->i_fs_info)->filestart =
739                                                                 c_bhdr->c_filestart;
740                         ((struct kfs_i_info*)inode->i_fs_info)->init_size =
741                                                                 c_bhdr->c_filesize;
742                 }
743                 /* Set other info from the CPIO entry */
744                 inode->i_uid = c_bhdr->c_uid;
745                 inode->i_gid = c_bhdr->c_gid;
746                 inode->i_atime.tv_sec = c_bhdr->c_mtime;
747                 inode->i_ctime.tv_sec = c_bhdr->c_mtime;
748                 inode->i_mtime.tv_sec = c_bhdr->c_mtime;
749                 inode->i_size = c_bhdr->c_filesize;
750                 //inode->i_XXX = c_bhdr->c_dev;                 /* and friends */
751                 inode->i_bdev = 0;                                              /* assuming blockdev? */
752                 inode->i_socket = FALSE;
753                 inode->i_blocks = c_bhdr->c_filesize;   /* blocksize == 1 */
754         }
755         return 0;
756 }
757
758 /* Adds an entry (from a CPIO archive) to KFS.  This will put all the FS
759  * metadata in memory, instead of having to reparse the entire archive each time
760  * we need to traverse.
761  *
762  * The other option is to just maintain a LL of {FN, FS}, and O(n) scan it.
763  *
764  * The path is a complete path, interpreted from the root of the mount point.
765  * Directories have a size of 0.  so do symlinks, but we don't handle those yet.
766  *
767  * If a directory does not exist for a file, this will return an error.  Don't
768  * use the -depth flag to find when building the CPIO archive, and this won't be
769  * a problem.  (Maybe) */
770 static int add_kfs_entry(struct super_block *sb, struct cpio_bin_hdr *c_bhdr)
771 {
772         char *path = c_bhdr->c_filename;
773         /* Root of the FS, already part of KFS */
774         if (!strcmp(path, "."))
775                 return 0;
776         return __add_kfs_entry(sb->s_mount->mnt_root, path, c_bhdr);
777 }
778
779 void parse_cpio_entries(struct super_block *sb, void *cpio_b)
780 {
781         struct cpio_newc_header *c_hdr = (struct cpio_newc_header*)cpio_b;
782
783         char buf[9] = {0};      /* temp space for strol conversions */
784         size_t namesize = 0;
785         int offset = 0;         /* offset in the cpio archive */
786         struct cpio_bin_hdr *c_bhdr = kmalloc(sizeof(*c_bhdr), 0);
787         memset(c_bhdr, 0, sizeof(*c_bhdr));
788
789         /* read all files and paths */
790         for (; ; c_hdr = (struct cpio_newc_header*)(cpio_b + offset)) {
791                 offset += sizeof(*c_hdr);
792                 if (strncmp(c_hdr->c_magic, "070701", 6)) {
793                         printk("Invalid magic number in CPIO header, aborting.\n");
794                         return;
795                 }
796                 c_bhdr->c_filename = (char*)c_hdr + sizeof(*c_hdr);
797                 namesize = cpio_strntol(buf, c_hdr->c_namesize, 8);
798                 printd("Namesize: %d\n", size);
799                 if (!strcmp(c_bhdr->c_filename, "TRAILER!!!"))
800                         break;
801                 c_bhdr->c_ino = cpio_strntol(buf, c_hdr->c_ino, 8);
802                 c_bhdr->c_mode = (int)cpio_strntol(buf, c_hdr->c_mode, 8);
803                 c_bhdr->c_uid = cpio_strntol(buf, c_hdr->c_uid, 8);
804                 c_bhdr->c_gid = cpio_strntol(buf, c_hdr->c_gid, 8);
805                 c_bhdr->c_nlink = (unsigned int)cpio_strntol(buf, c_hdr->c_nlink, 8);
806                 c_bhdr->c_mtime = cpio_strntol(buf, c_hdr->c_mtime, 8);
807                 c_bhdr->c_filesize = cpio_strntol(buf, c_hdr->c_filesize, 8);
808                 c_bhdr->c_dev_maj = cpio_strntol(buf, c_hdr->c_dev_maj, 8);
809                 c_bhdr->c_dev_min = cpio_strntol(buf, c_hdr->c_dev_min, 8);
810                 c_bhdr->c_rdev_maj = cpio_strntol(buf, c_hdr->c_rdev_maj, 8);
811                 c_bhdr->c_rdev_min = cpio_strntol(buf, c_hdr->c_rdev_min, 8);
812                 printd("File: %s: %d Bytes\n", c_bhdr->c_filename, c_bhdr->c_filesize);
813                 offset += namesize;
814                 /* header + name will be padded out to 4-byte alignment */
815                 offset = ROUNDUP(offset, 4);
816                 c_bhdr->c_filestart = cpio_b + offset;
817                 /* make this a function pointer or something */
818                 if (add_kfs_entry(sb, c_bhdr)) {
819                         printk("Failed to add an entry to KFS!\n");
820                         break;
821                 }
822                 offset += c_bhdr->c_filesize;
823                 offset = ROUNDUP(offset, 4);
824                 //printk("offset is %d bytes\n", offset);
825                 c_hdr = (struct cpio_newc_header*)(cpio_b + offset);
826         }
827         kfree(c_bhdr);
828 }