slab: Update the ctor/dtor interface
[akaros.git] / kern / src / blockdev.c
index 6e231b0..434051b 100644 (file)
@@ -10,6 +10,9 @@
 #include <slab.h>
 #include <page_alloc.h>
 #include <pmap.h>
+/* These two are needed for the fake interrupt */
+#include <alarm.h>
+#include <smp.h>
 
 struct file_operations block_f_op;
 struct page_map_operations block_pm_op;
@@ -17,12 +20,16 @@ struct kmem_cache *breq_kcache;
 
 void block_init(void)
 {
-       breq_kcache = kmem_cache_create("block_reqs", sizeof(struct block_request),
-                                       __alignof__(struct block_request), 0, 0, 0);
-       bh_kcache = kmem_cache_create("buffer_heads", sizeof(struct buffer_head),
-                                     __alignof__(struct buffer_head), 0, 0, 0);
+       breq_kcache = kmem_cache_create("block_reqs",
+                                       sizeof(struct block_request),
+                                       __alignof__(struct block_request), 0,
+                                       NULL, 0, 0, NULL);
+       bh_kcache = kmem_cache_create("buffer_heads",
+                                     sizeof(struct buffer_head),
+                                     __alignof__(struct buffer_head), 0,
+                                     NULL, 0, 0, NULL);
 
-       #ifdef __CONFIG_EXT2FS__
+       #ifdef CONFIG_EXT2FS
        /* Now probe for and init the block device for the ext2 ram disk */
        extern uint8_t _binary_mnt_ext2fs_img_size[];
        extern uint8_t _binary_mnt_ext2fs_img_start[];
@@ -31,20 +38,19 @@ void block_init(void)
        memset(ram_bd, 0, sizeof(struct block_device));
        ram_bd->b_id = 31337;
        ram_bd->b_sector_sz = 512;
-       ram_bd->b_nr_sector = (unsigned int)_binary_mnt_ext2fs_img_size / 512;
+       ram_bd->b_nr_sector = (unsigned long)_binary_mnt_ext2fs_img_size / 512;
        kref_init(&ram_bd->b_kref, fake_release, 1);
        pm_init(&ram_bd->b_pm, &block_pm_op, ram_bd);
        ram_bd->b_data = _binary_mnt_ext2fs_img_start;
-       strncpy(ram_bd->b_name, "RAMDISK", BDEV_INLINE_NAME);
-       ram_bd->b_name[BDEV_INLINE_NAME - 1] = '\0';
+       strlcpy(ram_bd->b_name, "RAMDISK", BDEV_INLINE_NAME);
        /* Connect it to the file system */
-       struct file *ram_bf = make_device("/dev/ramdisk", S_IRUSR | S_IWUSR,
+       struct file *ram_bf = make_device("/dev_vfs/ramdisk", S_IRUSR | S_IWUSR,
                                          __S_IFBLK, &block_f_op);
        /* make sure the inode tracks the right pm (not it's internal one) */
        ram_bf->f_dentry->d_inode->i_mapping = &ram_bd->b_pm;
        ram_bf->f_dentry->d_inode->i_bdev = ram_bd;     /* this holds the bd kref */
        kref_put(&ram_bf->f_kref);
-       #endif /* __CONFIG_EXT2FS__ */
+       #endif /* CONFIG_EXT2FS */
 }
 
 /* Generic helper, returns a kref'd reference out of principle. */
@@ -66,7 +72,7 @@ struct block_device *get_bdev(char *path)
 void free_bhs(struct page *page)
 {
        struct buffer_head *bh, *next;
-       assert(page->pg_flags & PG_BUFFER);
+       assert(atomic_read(&page->pg_flags) & PG_BUFFER);
        bh = (struct buffer_head*)page->pg_private;
        while (bh) {
                next = bh->bh_next;
@@ -105,49 +111,47 @@ int bdev_submit_request(struct block_device *bdev, struct block_request *breq)
                }
                memcpy(dst, src, nr_sector << SECTOR_SZ_LOG);
        }
-#ifdef __i386__        /* Sparc can't register interrupt handlers yet */
-       /* Faking an interrupt.  The handler runs in interrupt context btw */
-       void x86_breq_handler(struct trapframe *tf, void *data)
+       /* Faking the device interrupt with an alarm */
+       void breq_handler(struct alarm_waiter *waiter)
        {
-               /* Re-register the old dumb handler */
-               register_interrupt_handler(interrupt_handlers,
-                                          LAPIC_TIMER_DEFAULT_VECTOR, timer_interrupt,
-                                          NULL);
-               struct block_request *breq = (struct block_request*)data;
+               /* In the future, we'll need to figure out which breq this was in
+                * response to */
+               struct block_request *breq = (struct block_request*)waiter->data;
                if (breq->callback)
                        breq->callback(breq);
+               kfree(waiter);
        }
-       register_interrupt_handler(interrupt_handlers, LAPIC_TIMER_DEFAULT_VECTOR,
-                                  x86_breq_handler, breq);
-       /* Fake a 5ms delay */
-       set_core_timer(5000);
-#else
-       if (breq->callback)
-               breq->callback(breq);
-#endif
-
+       struct timer_chain *tchain = &per_cpu_info[core_id()].tchain;
+       struct alarm_waiter *waiter = kmalloc(sizeof(struct alarm_waiter), 0);
+       init_awaiter(waiter, breq_handler);
+       /* Stitch things up, so we know how to find things later */
+       waiter->data = breq;
+       /* Set for 5ms. */
+       set_awaiter_rel(waiter, 5000);
+       set_alarm(tchain, waiter);
        return 0;
 }
 
 /* Helper method, unblocks someone blocked on sleep_on_breq(). */
 void generic_breq_done(struct block_request *breq)
 {
-       /* TODO: BLK - unblock the kthread sleeping on this request */
-       breq->data = (void*)1;
+       int8_t irq_state = 0;
+       if (!sem_up_irqsave(&breq->sem, &irq_state)) {
+               /* This shouldn't happen anymore.  Let brho know if it does. */
+               warn("[kernel] no one waiting on breq %p", breq);
+       }
 }
 
-/* Helper, pairs with generic_breq_done() */
+/* Helper, pairs with generic_breq_done().  Note we sleep here on a semaphore
+ * instead of faking it with an alarm.  Ideally, this code will be the same even
+ * for real block devices (that don't fake things with timer interrupts). */
 void sleep_on_breq(struct block_request *breq)
 {
-       /* TODO: BLK Block til we are done: data gets toggled in the completion.
-        * This only works if the completion happened first (for now) */
+       int8_t irq_state = 0;
+       /* Since printk takes a while, this may make you lose the race */
+       printd("Sleeping on breq %p\n", breq);
        assert(irq_is_enabled());
-#ifdef __i386__        /* Sparc isn't interrupt driven yet */
-       while (!breq->data)
-               cpu_relax();
-#else
-       assert(breq->data);
-#endif
+       sem_down_irqsave(&breq->sem, &irq_state);
 }
 
 /* This just tells the page cache that it is 'up to date'.  Due to the nature of
@@ -155,8 +159,7 @@ void sleep_on_breq(struct block_request *breq)
  * readpage, we read them in when a specific block is there */
 int block_readpage(struct page_map *pm, struct page *page)
 {
-       page->pg_flags |= PG_UPTODATE;
-       unlock_page(page);
+       atomic_or(&page->pg_flags, PG_UPTODATE);
        return 0;
 }
 
@@ -187,11 +190,11 @@ struct buffer_head *bdev_get_buffer(struct block_device *bdev,
        if (!blk_num)
                warn("Asking for the 0th block of a bdev...");
        /* Make sure there's a page in the page cache.  Should always be one. */
-       error = pm_load_page(pm, blk_num / blk_per_pg, &page); 
+       error = pm_load_page(pm, blk_num / blk_per_pg, &page);
        if (error)
                panic("Failed to load page! (%d)", error);
        my_buf = page2kva(page) + blk_offset;
-       assert(page->pg_flags & PG_BUFFER);             /* Should be part of a page map */
+       atomic_or(&page->pg_flags, PG_BUFFER);
 retry:
        bh = (struct buffer_head*)page->pg_private;
        prev = 0;
@@ -219,7 +222,10 @@ retry:
        /* Try to insert the new one in place.  If it fails, retry the whole "find
         * the bh" process.  This should be rare, so no sense optimizing it. */
        next_loc = prev ? &prev->bh_next : (struct buffer_head**)&page->pg_private;
-       if (!atomic_comp_swap((uint32_t*)next_loc, (uint32_t)bh, (uint32_t)new)) {
+       /* Normally, there'd be an ABA problem here, but we never actually remove
+        * bhs from the chain until the whole page gets cleaned up, which can't
+        * happen while we hold a reference to the page. */
+       if (!atomic_cas_ptr((void**)next_loc, bh, new)) {
                kmem_cache_free(bh_kcache, new);
                goto retry;
        }
@@ -243,6 +249,7 @@ found:
        breq->flags = BREQ_READ;
        breq->callback = generic_breq_done;
        breq->data = 0;
+       sem_init_irqsave(&breq->sem, 0);
        breq->bhs = breq->local_bhs;
        breq->bhs[0] = bh;
        breq->nr_bhs = 1;
@@ -264,7 +271,7 @@ void bdev_dirty_buffer(struct buffer_head *bh)
        struct page *page = bh->bh_page;
        /* TODO: race on flag modification */
        bh->bh_flags |= BH_DIRTY;
-       page->pg_flags |= PG_DIRTY;
+       atomic_or(&page->pg_flags, PG_DIRTY);
 }
 
 /* Decrefs the buffer from bdev_get_buffer().  Call this when you no longer
@@ -272,7 +279,7 @@ void bdev_dirty_buffer(struct buffer_head *bh)
  * reclaiming will be in page sized chunks from the page cache. */
 void bdev_put_buffer(struct buffer_head *bh)
 {
-       page_decref(bh->bh_page);
+       pm_put_page(bh->bh_page);
 }
 
 /* Block device page map ops: */