Block extra_data
[akaros.git] / kern / src / monitor.c
index 03ff404..61977c8 100644 (file)
@@ -8,6 +8,7 @@
 #include <arch/arch.h>
 #include <stab.h>
 #include <smp.h>
+#include <console.h>
 #include <arch/console.h>
 
 #include <stdio.h>
@@ -26,8 +27,8 @@
 #include <elf.h>
 #include <event.h>
 #include <trap.h>
+#include <time.h>
 
-#include <ros/time.h>
 #include <ros/memlayout.h>
 #include <ros/event.h>
 
@@ -37,15 +38,17 @@ typedef struct command {
        const char *NTS name;
        const char *NTS desc;
        // return -1 to force monitor to exit
-       int (*func)(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf);
+       int (*func)(int argc, char **argv, struct hw_trapframe *hw_tf);
 } command_t;
 
 static command_t (RO commands)[] = {
        { "help", "Display this list of commands", mon_help },
        { "kerninfo", "Display information about the kernel", mon_kerninfo },
        { "backtrace", "Dump a backtrace", mon_backtrace },
+       { "bt", "Dump a backtrace", mon_bt },
        { "reboot", "Take a ride to the South Bay", mon_reboot },
        { "showmapping", "Shows VA->PA mappings", mon_showmapping},
+       { "sm", "Shows VA->PA mappings", mon_sm},
        { "setmapperm", "Sets permissions on a VA->PA mapping", mon_setmapperm},
        { "cpuinfo", "Prints CPU diagnostics", mon_cpuinfo},
        { "ps", "Prints process list", mon_ps},
@@ -54,6 +57,8 @@ static command_t (RO commands)[] = {
        { "bin_run", "Create and run a program from /bin", mon_bin_run},
        { "manager", "Run the manager", mon_manager},
        { "procinfo", "Show information about processes", mon_procinfo},
+       { "pip", "Shorthand for procinfo pid", mon_pip},
+       { "kill", "Kills a process", mon_kill},
        { "exit", "Leave the monitor", mon_exit},
        { "kfunc", "Run a kernel function directly (!!!)", mon_kfunc},
        { "notify", "Notify a process.  Vcoreid will skip their prefs", mon_notify},
@@ -63,12 +68,14 @@ static command_t (RO commands)[] = {
        { "fs", "Filesystem Diagnostics", mon_fs},
        { "bb", "Try to run busybox (ash)", mon_bb},
        { "alarm", "Alarm Diagnostics", mon_alarm},
+       { "msr", "read/write msr: msr msr [value]", mon_msr},
+       { "db", "Misc debugging", mon_db},
 };
 #define NCOMMANDS (sizeof(commands)/sizeof(commands[0]))
 
 /***** Implementations of basic kernel monitor commands *****/
 
-int mon_help(int argc, char **argv, trapframe_t *tf)
+int mon_help(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        int i;
 
@@ -77,13 +84,13 @@ int mon_help(int argc, char **argv, trapframe_t *tf)
        return 0;
 }
 
-int mon_ps(int argc, char** argv, trapframe_t *tf)
+int mon_ps(int argc, char** argv, struct hw_trapframe *hw_tf)
 {
        print_allpids();
        return 0;
 }
 
-int mon_kerninfo(int argc, char **argv, trapframe_t *tf)
+int mon_kerninfo(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        extern char (RO SNT _start)[], (RO SNT etext)[], (RO SNT edata)[], (RO SNT end)[];
 
@@ -124,13 +131,35 @@ static char RO* function_of(uint32_t address)
 }
 #endif
 
-int mon_backtrace(int argc, char **argv, trapframe_t *tf)
+static int __backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       backtrace();
+       uintptr_t pc, fp;
+       if (argc == 1) {
+               backtrace();
+               return 0;
+       }
+       if (argc != 3) {
+               printk("Need either no arguments, or two (PC and FP) in hex\n");
+               return 1;
+       }
+       pc = strtol(argv[1], 0, 16);
+       fp = strtol(argv[2], 0, 16);
+       printk("Backtrace from instruction %p, with frame pointer %p\n", pc, fp);
+       backtrace_frame(pc, fp);
        return 0;
 }
 
-int mon_reboot(int argc, char **argv, trapframe_t *tf)
+int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       return __backtrace(argc, argv, hw_tf);
+}
+
+int mon_bt(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       return __backtrace(argc, argv, hw_tf);
+}
+
+int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        cprintf("[Scottish Accent]: She's goin' down, Cap'n!\n");
        reboot();
@@ -140,32 +169,53 @@ int mon_reboot(int argc, char **argv, trapframe_t *tf)
        return 0;
 }
 
-int mon_showmapping(int argc, char **argv, trapframe_t *tf)
+static int __showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       if (argc < 2) {
-               cprintf("Shows virtual -> physical mappings for a virtual address range.\n");
-               cprintf("Usage: showmapping START_ADDR [END_ADDR]\n");
+       struct proc *p;
+       uintptr_t start;
+       size_t size;
+       pde_t *pgdir;
+       pid_t pid;
+       if (argc < 3) {
+               printk("Shows virtual -> physical mappings for a virt addr range.\n");
+               printk("Usage: showmapping PID START_ADDR [END_ADDR]\n");
+               printk("    PID == 0 for the boot pgdir\n");
                return 1;
        }
-       pde_t* pgdir = (pde_t*)vpd;
-       pte_t *pte, *pde;
-       page_t* page;
-       uintptr_t start, i;
-       size_t size;
-       start = ROUNDDOWN(strtol(argv[1], 0, 16), PGSIZE);
-       size = (argc == 2) ? 1 : strtol(argv[2], 0, 16) - start;
+       pid = strtol(argv[1], 0, 10);
+       if (!pid) {
+               pgdir = boot_pgdir;
+       } else {
+               p = pid2proc(pid);
+               if (!p) {
+                       printk("No proc with pid %d\n", pid);
+                       return 1;
+               }
+               pgdir = p->env_pgdir;
+       }
+       start = ROUNDDOWN(strtol(argv[2], 0, 16), PGSIZE);
+       size = (argc == 3) ? 1 : strtol(argv[3], 0, 16) - start;
        if (size/PGSIZE > 512) {
                cprintf("Not going to do this for more than 512 items\n");
                return 1;
        }
-
-       show_mapping(start,size);
+       show_mapping(pgdir, start, size);
        return 0;
 }
 
-int mon_setmapperm(int argc, char **argv, trapframe_t *tf)
+int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       return __showmapping(argc, argv, hw_tf);
+}
+
+int mon_sm(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       return __showmapping(argc, argv, hw_tf);
+}
+
+int mon_setmapperm(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-#ifndef __i386__
+#ifndef CONFIG_X86_32
        cprintf("I don't support this call yet!\n");
        return 1;
 #else
@@ -189,13 +239,13 @@ int mon_setmapperm(int argc, char **argv, trapframe_t *tf)
        pde = &pgdir[PDX(va)];
        cprintf("   Virtual    Physical  Ps Dr Ac CD WT U W\n");
        cprintf("------------------------------------------\n");
-       cprintf("%08p  %08p  %1d  %1d  %1d  %1d  %1d  %1d %1d\n", va, page2pa(page),
+       cprintf("%p  %p  %1d  %1d  %1d  %1d  %1d  %1d %1d\n", va, page2pa(page),
               (*pte & PTE_PS) >> 7, (*pte & PTE_D) >> 6, (*pte & PTE_A) >> 5,
               (*pte & PTE_PCD) >> 4, (*pte & PTE_PWT) >> 3, (*pte & *pde & PTE_U) >> 2,
               (*pte & *pde & PTE_W) >> 1);
        *pte = PTE_ADDR(*pte) | (*pte & PTE_PS) |
               (PGOFF(strtol(argv[2], 0, 16)) & ~PTE_PS ) | PTE_P;
-       cprintf("%08p  %08p  %1d  %1d  %1d  %1d  %1d  %1d %1d\n", va, page2pa(page),
+       cprintf("%p  %p  %1d  %1d  %1d  %1d  %1d  %1d %1d\n", va, page2pa(page),
               (*pte & PTE_PS) >> 7, (*pte & PTE_D) >> 6, (*pte & PTE_A) >> 5,
               (*pte & PTE_PCD) >> 4, (*pte & PTE_PWT) >> 3, (*pte & *pde & PTE_U) >> 2,
               (*pte & *pde & PTE_W) >> 1);
@@ -203,27 +253,69 @@ int mon_setmapperm(int argc, char **argv, trapframe_t *tf)
 #endif
 }
 
-int mon_cpuinfo(int argc, char **argv, trapframe_t *tf)
+static spinlock_t print_info_lock = SPINLOCK_INITIALIZER_IRQSAVE;
+
+static void print_info_handler(struct hw_trapframe *hw_tf, void *data)
+{
+       uint64_t tsc = read_tsc();
+
+       spin_lock_irqsave(&print_info_lock);
+       cprintf("----------------------------\n");
+       cprintf("This is Core %d\n", core_id());
+       cprintf("Timestamp = %lld\n", tsc);
+#ifdef CONFIG_X86
+       cprintf("Hardware core %d\n", hw_core_id());
+       cprintf("MTRR_DEF_TYPE = 0x%08x\n", read_msr(IA32_MTRR_DEF_TYPE));
+       cprintf("MTRR Phys0 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x200), read_msr(0x201));
+       cprintf("MTRR Phys1 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x202), read_msr(0x203));
+       cprintf("MTRR Phys2 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x204), read_msr(0x205));
+       cprintf("MTRR Phys3 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x206), read_msr(0x207));
+       cprintf("MTRR Phys4 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x208), read_msr(0x209));
+       cprintf("MTRR Phys5 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x20a), read_msr(0x20b));
+       cprintf("MTRR Phys6 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x20c), read_msr(0x20d));
+       cprintf("MTRR Phys7 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x20e), read_msr(0x20f));
+#endif // CONFIG_X86
+       cprintf("----------------------------\n");
+       spin_unlock_irqsave(&print_info_lock);
+}
+
+static bool print_all_info(void)
+{
+       cprintf("\nCORE 0 asking all cores to print info:\n");
+       smp_call_function_all(print_info_handler, NULL, 0);
+       cprintf("\nDone!\n");
+       return true;
+}
+
+int mon_cpuinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        cprintf("Number of CPUs detected: %d\n", num_cpus);
        cprintf("Calling CPU's ID: 0x%08x\n", core_id());
 
        if (argc < 2)
-               smp_call_function_self(test_print_info_handler, NULL, 0);
+               smp_call_function_self(print_info_handler, NULL, 0);
        else
                smp_call_function_single(strtol(argv[1], 0, 10),
-                                        test_print_info_handler, NULL, 0);
+                                        print_info_handler, NULL, 0);
        return 0;
 }
 
-int mon_manager(int argc, char** argv, trapframe_t *tf)
+int mon_manager(int argc, char** argv, struct hw_trapframe *hw_tf)
 {
        manager();
        panic("should never get here");
        return 0;
 }
 
-int mon_nanwan(int argc, char **argv, trapframe_t *tf)
+int mon_nanwan(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        /* Borrowed with love from http://www.geocities.com/SoHo/7373/zoo.htm
         * (http://www.ascii-art.com/).  Slightly modified to make it 25 lines tall.
@@ -255,7 +347,7 @@ int mon_nanwan(int argc, char **argv, trapframe_t *tf)
        return 0;
 }
 
-int mon_bin_ls(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
+int mon_bin_ls(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        struct dirent dir = {0};
        struct file *bin_dir;
@@ -275,7 +367,7 @@ int mon_bin_ls(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
        return 0;
 }
 
-int mon_bin_run(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
+int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        if (argc < 2) {
                printk("Usage: bin_run FILENAME\n");
@@ -295,14 +387,19 @@ int mon_bin_run(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                p_argv[i] = argv[i + 1];
        p_argv[argc - 1] = 0;
        char *p_envp[] = {"LD_LIBRARY_PATH=/lib", 0};
+       /* super ugly: we need to stash current, so that proc_create doesn't pick up
+        * on random processes running here and assuming they are the parent */
+       struct proc *old_cur = current;
+       current = 0;
        struct proc *p = proc_create(program, p_argv, p_envp);
+       current = old_cur;
        kfree(p_argv);
        proc_wakeup(p);
        proc_decref(p); /* let go of the reference created in proc_create() */
        kref_put(&program->f_kref);
        /* Make a scheduling decision.  You might not get the process you created,
         * in the event there are others floating around that are runnable */
-       schedule();
+       run_scheduler();
        /* want to idle, so we un the process we just selected.  this is a bit
         * hackish, but so is the monitor. */
        smp_idle();
@@ -310,8 +407,9 @@ int mon_bin_run(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
        return 0;
 }
 
-int mon_procinfo(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
+int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
+       int8_t irq_state = 0;
        if (argc < 2) {
                printk("Usage: procinfo OPTION\n");
                printk("\tidlecores: show idle core map\n");
@@ -358,7 +456,9 @@ int mon_procinfo(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                        printk("No such proc\n");
                        return 1;
                }
+               enable_irqsave(&irq_state);
                proc_destroy(p);
+               disable_irqsave(&irq_state);
                proc_decref(p);
        } else {
                printk("Bad option\n");
@@ -367,18 +467,43 @@ int mon_procinfo(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
        return 0;
 }
 
-int mon_exit(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
+int mon_pip(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       return -1;
+       if (argc != 2) {
+               printk("Give me a pid number.\n");
+               return 1;
+       }
+       print_proc_info(strtol(argv[1], 0, 0));
+       return 0;
+}
+
+int mon_kill(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       struct proc *p;
+       int8_t irq_state = 0;
+       if (argc < 2) {
+               printk("Usage: kill PID\n");
+               return 1;
+       }
+       p = pid2proc(strtol(argv[1], 0, 0));
+       if (!p) {
+               printk("No such proc\n");
+               return 1;
+       }
+       enable_irqsave(&irq_state);
+       proc_destroy(p);
+       disable_irqsave(&irq_state);
+       proc_decref(p);
+       return 0;
 }
 
-int mon_kfunc(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
+int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       #ifndef __i386__
-       printk("Only supported on x86 for now.  =(\n");
        return -1;
-       #endif
+}
 
+int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
        void (*func)(void *arg, ...);
 
        if (argc < 2) {
@@ -386,7 +511,7 @@ int mon_kfunc(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                printk("Arguments must be in hex.  Can take 6 args.\n");
                return 1;
        }
-       func = debug_get_fn_addr(argv[1]);
+       func = (void*)get_symbol_addr(argv[1]);
        if (!func) {
                printk("Function not found.\n");
                return 1;
@@ -438,7 +563,7 @@ int mon_kfunc(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
 }
 
 /* Sending a vcoreid forces an event and an IPI/notification */
-int mon_notify(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
+int mon_notify(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        struct proc *p;
        uint32_t vcoreid;
@@ -469,10 +594,11 @@ int mon_notify(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
 
 /* Micro-benchmarky Measurements.  This is really fragile code that probably
  * won't work perfectly, esp as the kernel evolves. */
-int mon_measure(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
+int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        uint64_t begin = 0, diff = 0;
        uint32_t end_refcnt = 0;
+       int8_t irq_state = 0;
 
        if (argc < 2) {
                printk("Usage: measure OPTION\n");
@@ -496,13 +622,15 @@ int mon_measure(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                        return 1;
                }
                begin = start_timing();
-#ifdef __CONFIG_APPSERVER__
+#ifdef CONFIG_APPSERVER
                printk("Warning: this will be inaccurate due to the appserver.\n");
                end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores - 1;
-#endif /* __CONFIG_APPSERVER__ */
+#endif /* CONFIG_APPSERVER */
+               enable_irqsave(&irq_state);
                proc_destroy(p);
+               disable_irqsave(&irq_state);
                proc_decref(p);
-#ifdef __CONFIG_APPSERVER__
+#ifdef CONFIG_APPSERVER
                /* Won't be that accurate, since it's not actually going through the
                 * __proc_free() path. */
                spin_on(kref_refcnt(&p->p_kref) != end_refcnt); 
@@ -511,7 +639,7 @@ int mon_measure(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                 * slowing it down by messing with it, esp with the busy waiting on a
                 * hyperthreaded core. */
                spin_on(p->env_cr3);
-#endif /* __CONFIG_APPSERVER__ */
+#endif /* CONFIG_APPSERVER */
                /* No noticeable difference using stop_timing instead of read_tsc() */
                diff = stop_timing(begin);
        } else if (!strcmp(argv[1], "preempt")) {
@@ -527,9 +655,13 @@ int mon_measure(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                if (argc == 4) { /* single core being preempted, warned but no delay */
                        uint32_t pcoreid = strtol(argv[3], 0, 0);
                        begin = start_timing();
-                       proc_preempt_core(p, pcoreid, 1000000); // 1 sec warning
-                       /* done when unmapped (right before abandoning) */
-                       spin_on(p->procinfo->pcoremap[pcoreid].valid);
+                       if (proc_preempt_core(p, pcoreid, 1000000)) {
+                               __sched_put_idle_core(p, pcoreid);
+                               /* done when unmapped (right before abandoning) */
+                               spin_on(p->procinfo->pcoremap[pcoreid].valid);
+                       } else {
+                               printk("Core %d was not mapped to proc\n", pcoreid);
+                       }
                        diff = stop_timing(begin);
                } else { /* preempt all cores, warned but no delay */
                        end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
@@ -602,7 +734,7 @@ int mon_measure(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                                __proc_set_state(p, PROC_RUNNABLE_M);
                        spin_unlock(&p->proc_lock);
                        /* ghetto, since the ksched should be calling all of this */
-                       put_idle_core(pcoreid);
+                       __sched_put_idle_core(p, pcoreid);
                        /* done when unmapped (right before abandoning) */
                        spin_on(p->procinfo->pcoremap[pcoreid].valid);
                        diff = stop_timing(begin);
@@ -616,7 +748,7 @@ int mon_measure(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                        __proc_set_state(p, PROC_RUNNABLE_M);
                        spin_unlock(&p->proc_lock);
                        if (num_revoked)
-                               put_idle_cores(pc_arr, num_revoked);
+                               __sched_put_idle_cores(p, pc_arr, num_revoked);
                        /* a little ghetto, implies no one else is using p */
                        spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
                        diff = stop_timing(begin);
@@ -631,14 +763,20 @@ int mon_measure(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
        return 0;
 }
 
-int mon_trace(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
+/* Used in various debug locations.  Not a kernel API or anything. */
+bool mon_verbose_trace = FALSE;
+
+int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       uint32_t core;
+       int core;
        if (argc < 2) {
                printk("Usage: trace OPTION\n");
                printk("\tsyscall start [silent] [pid]: starts tracing\n");
                printk("\tsyscall stop: stops tracing, prints if it was silent\n");
-               printk("\tcoretf COREID: cause the other core to print its TF (NMI)\n");
+               printk("\tcoretf COREID: prints PC, -1 for all cores, verbose => TF\n");
+               printk("\tpcpui [type [coreid]]: runs pcpui trace ring handlers\n");
+               printk("\tpcpui-reset [noclear]: resets/clears pcpui trace ring\n");
+               printk("\tverbose: toggles verbosity, depends on trace command\n");
                return 1;
        }
        if (!strcmp(argv[1], "syscall")) {
@@ -676,12 +814,48 @@ int mon_trace(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                        return 1;
                }
                core = strtol(argv[2], 0, 0);
-               if (core >= num_cpus) {
-                       printk("No such core!  Maybe it's in another cell...\n");
-                       return 1;
+               if (core < 0) {
+                       printk("Sending NMIs to all cores:\n");
+                       for (int i = 0; i < num_cpus; i++)
+                               send_nmi(i);
+               } else {
+                       printk("Sending NMI core %d:\n", core);
+                       if (core >= num_cpus) {
+                               printk("No such core!  Maybe it's in another cell...\n");
+                               return 1;
+                       }
+                       send_nmi(core);
                }
-               send_nmi(core);
                udelay(1000000);
+       } else if (!strcmp(argv[1], "pcpui")) {
+               int pcpui_type, pcpui_coreid;
+               if (argc >= 3)
+                       pcpui_type = strtol(argv[2], 0, 0);
+               else
+                       pcpui_type = 0;
+               printk("\nRunning PCPUI Trace Ring handlers for type %d\n", pcpui_type);
+               if (argc >= 4) {
+                       pcpui_coreid = strtol(argv[3], 0, 0); 
+                       pcpui_tr_foreach(pcpui_coreid, pcpui_type);
+               } else {
+                       pcpui_tr_foreach_all(pcpui_type);
+               }
+       } else if (!strcmp(argv[1], "pcpui-reset")) {
+               if (argc >= 3) {
+                       printk("\nResetting all PCPUI Trace Rings\n");
+                       pcpui_tr_reset_all();
+               } else {
+                       printk("\nResetting and clearing all PCPUI Trace Rings\n");
+                       pcpui_tr_reset_and_clear_all();
+               }
+       } else if (!strcmp(argv[1], "verbose")) {
+               if (mon_verbose_trace) {
+                       printk("Turning trace verbosity off\n");
+                       mon_verbose_trace = FALSE;
+               } else {
+                       printk("Turning trace verbosity on\n");
+                       mon_verbose_trace = TRUE;
+               }
        } else if (!strcmp(argv[1], "opt2")) {
                if (argc != 3) {
                        printk("ERRRRRRRRRR.\n");
@@ -695,7 +869,7 @@ int mon_trace(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
        return 0;
 }
 
-int mon_monitor(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
+int mon_monitor(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        if (argc < 2) {
                printk("Usage: monitor COREID\n");
@@ -706,12 +880,7 @@ int mon_monitor(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                printk("No such core!  Maybe it's in another cell...\n");
                return 1;
        }
-       void run_mon(struct trapframe *tf, uint32_t srcid, long a0, long a1,
-                    long a2)
-       {
-               monitor(0);
-       }
-       send_kernel_message(core, run_mon, 0, 0, 0, KMSG_ROUTINE);
+       send_kernel_message(core, __run_mon, 0, 0, 0, KMSG_ROUTINE);
        return 0;
 }
 
@@ -720,7 +889,7 @@ int mon_monitor(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
 #define WHITESPACE "\t\r\n "
 #define MAXARGS 16
 
-static int runcmd(char *NTS real_buf, trapframe_t *tf) {
+static int runcmd(char *NTS real_buf, struct hw_trapframe *hw_tf) {
        char * buf = NTEXPAND(real_buf);
        int argc;
        char *NTS argv[MAXARGS];
@@ -753,39 +922,63 @@ static int runcmd(char *NTS real_buf, trapframe_t *tf) {
                return 0;
        for (i = 0; i < NCOMMANDS; i++) {
                if (strcmp(argv[0], commands[i].name) == 0)
-                       return commands[i].func(argc, argv, tf);
+                       return commands[i].func(argc, argv, hw_tf);
        }
        cprintf("Unknown command '%s'\n", argv[0]);
        return 0;
 }
 
-void monitor(struct trapframe *tf)
+void monitor(struct hw_trapframe *hw_tf)
 {
        #define MON_CMD_LENGTH 256
        char buf[MON_CMD_LENGTH];
        int cnt;
+       int coreid = core_id_early();
 
        /* they are always disabled, since we have this irqsave lock */
        if (irq_is_enabled())
-               printk("Entering Nanwan's Dungeon on Core %d (Ints on):\n", core_id());
+               printk("Entering Nanwan's Dungeon on Core %d (Ints on):\n", coreid);
        else
-               printk("Entering Nanwan's Dungeon on Core %d (Ints off):\n", core_id());
+               printk("Entering Nanwan's Dungeon on Core %d (Ints off):\n", coreid);
        printk("Type 'help' for a list of commands.\n");
 
-       if (tf != NULL)
-               print_trapframe(tf);
+       if (hw_tf != NULL)
+               print_trapframe(hw_tf);
 
        while (1) {
-               cnt = readline(buf, MON_CMD_LENGTH, "ROS(Core %d)> ", core_id());
+               /* on occasion, the kernel monitor can migrate (like if you run
+                * something that blocks / syncs and wakes up on another core) */
+               cmb();
+               cnt = readline(buf, MON_CMD_LENGTH, "ROS(Core %d)> ", core_id_early());
                if (cnt > 0) {
                        buf[cnt] = 0;
-                       if (runcmd(buf, tf) < 0)
+                       if (runcmd(buf, hw_tf) < 0)
                                break;
                }
        }
 }
 
-int mon_fs(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
+static void pm_flusher(void *unused)
+{
+       struct super_block *sb;
+       struct inode *inode;
+       unsigned long nr_pages;
+
+       /* could also put the delay between calls, or even within remove, during the
+        * WB phase. */
+       while (1) {
+               udelay_sched(5000);
+               TAILQ_FOREACH(sb, &super_blocks, s_list) {
+                       TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
+                               nr_pages = ROUNDUP(inode->i_size, PGSIZE) >> PGSHIFT;
+                               if (nr_pages)
+                                       pm_remove_contig(inode->i_mapping, 0, nr_pages);
+                       }
+               }
+       }
+}
+
+int mon_fs(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        /* this assumes one mounted FS at the NS root */
        struct super_block *sb;
@@ -799,6 +992,7 @@ int mon_fs(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                printk("\tdentries [lru|prune]: show all dentries, opt LRU/prune\n");
                printk("\tls DIR: print the dir tree starting with DIR\n");
                printk("\tpid: proc PID's fs crap placeholder\n");
+               printk("\tpmflusher: start a ktask to keep flushing all PMs\n");
                return 1;
        }
        if (!strcmp(argv[1], "open")) {
@@ -806,21 +1000,22 @@ int mon_fs(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                TAILQ_FOREACH(sb, &super_blocks, s_list) {
                        printk("Superblock for %s\n", sb->s_name);
                        TAILQ_FOREACH(file, &sb->s_files, f_list)
-                               printk("File: %08p, %s, Refs: %d, Drefs: %d, Irefs: %d\n", file,
-                                      file_name(file), kref_refcnt(&file->f_kref),
+                               printk("File: %p, %s, Refs: %d, Drefs: %d, Irefs: %d PM: %p\n",
+                                      file, file_name(file), kref_refcnt(&file->f_kref),
                                       kref_refcnt(&file->f_dentry->d_kref),
-                                      kref_refcnt(&file->f_dentry->d_inode->i_kref));
+                                      kref_refcnt(&file->f_dentry->d_inode->i_kref),
+                                          file->f_mapping);
                }
        } else if (!strcmp(argv[1], "inodes")) {
                printk("Mounted FS Inodes:\n----------------------------\n");
                TAILQ_FOREACH(sb, &super_blocks, s_list) {
                        printk("Superblock for %s\n", sb->s_name);
                        TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
-                               printk("Inode: %08p, Refs: %d, Nlinks: %d, Size(B): %d\n",
+                               printk("Inode: %p, Refs: %d, Nlinks: %d, Size(B): %d\n",
                                       inode, kref_refcnt(&inode->i_kref), inode->i_nlink,
                                       inode->i_size);
                                TAILQ_FOREACH(dentry, &inode->i_dentry, d_alias)
-                                       printk("\t%s: Dentry: %08p, Refs: %d\n",
+                                       printk("\t%s: Dentry: %p, Refs: %d\n",
                                               dentry->d_name.name, dentry,
                                               kref_refcnt(&dentry->d_kref));
                        }
@@ -835,7 +1030,7 @@ int mon_fs(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                        void print_dcache_entry(void *item)
                        {
                                struct dentry *d_i = (struct dentry*)item;
-                               printk("%08p %08p %02d     %s\n", d_i, d_i->d_flags,
+                               printk("%p %p %02d     %s\n", d_i, d_i->d_flags,
                                       kref_refcnt(&d_i->d_kref), d_i->d_name.name);
                        }
                        hash_for_each(sb->s_dcache, print_dcache_entry);
@@ -847,7 +1042,7 @@ int mon_fs(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                        TAILQ_FOREACH(sb, &super_blocks, s_list) {
                                printk("Superblock for %s\n", sb->s_name);
                                TAILQ_FOREACH(dentry, &sb->s_lru_d, d_lru)
-                                       printk("Dentry: %08p, Name: %s\n", dentry,
+                                       printk("Dentry: %p, Name: %s\n", dentry,
                                               dentry->d_name.name);
                        }
                } else if (!strcmp(argv[2], "prune")) {
@@ -872,6 +1067,8 @@ int mon_fs(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
                        return 1;
                }
                /* whatever.  placeholder. */
+       } else if (!strcmp(argv[1], "pmflusher")) {
+               ktask("pm_flusher", pm_flusher, 0);
        } else {
                printk("Bad option\n");
                return 1;
@@ -879,13 +1076,13 @@ int mon_fs(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
        return 0;
 }
 
-int mon_bb(int argc, char *NTS *NT COUNT(argc) argv, trapframe_t *tf)
+int mon_bb(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        char *l_argv[3] = {"", "busybox", "ash"};
-       return mon_bin_run(3, l_argv, tf);
+       return mon_bin_run(3, l_argv, hw_tf);
 }
 
-int mon_alarm(int argc, char **argv, struct trapframe *tf)
+int mon_alarm(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        if (argc < 2) {
                printk("Usage: alarm OPTION\n");
@@ -900,3 +1097,75 @@ int mon_alarm(int argc, char **argv, struct trapframe *tf)
        }
        return 0;
 }
+
+static void show_msr(struct hw_trapframe *unused, void *v)
+{
+       int core = core_id();
+       uint64_t val;
+       uint32_t msr = *(uint32_t *)v;
+       val = read_msr(msr);
+       printk("%d: %08x: %016llx\n", core, msr, val);
+}
+
+struct set {
+       uint32_t msr;
+       uint64_t val;
+};
+
+static void set_msr(struct hw_trapframe *unused, void *v)
+{
+       int core = core_id();
+       struct set *s = v;
+       uint32_t msr = s->msr;
+       uint64_t val = s->val;
+       write_msr(msr, val);
+       val = read_msr(msr);
+       printk("%d: %08x: %016llx\n", core, msr, val);
+}
+
+int mon_msr(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+#ifndef CONFIG_X86
+       cprintf("Not on this architecture\n");
+       return 1;
+#else
+       uint64_t val;
+       uint32_t msr;
+       if (argc < 2 || argc > 3) {
+               printk("Usage: msr register [value]\n");
+               return 1;
+       }
+       msr = strtoul(argv[1], 0, 16);
+       handler_wrapper_t *w;
+       smp_call_function_all(show_msr, &msr, &w);
+       smp_call_wait(w);
+
+       if (argc < 3)
+               return 0;
+       /* somewhat bogus on 32 bit. */
+       val = strtoul(argv[2], 0, 16);
+
+       struct set set;
+       set.msr = msr;
+       set.val = val;
+       smp_call_function_all(set_msr, &set, &w);
+       smp_call_wait(w);
+       return 0;
+#endif
+}
+
+int mon_db(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       if (argc < 2) {
+               printk("Usage: db OPTION\n");
+               printk("\tsem: print all semaphore info\n");
+               return 1;
+       }
+       if (!strcmp(argv[1], "sem")) {
+               print_all_sem_info();
+       } else {
+               printk("Bad option\n");
+               return 1;
+       }
+       return 0;
+}