kth: Remove irq_state from sem_.*irqsave's interface
[akaros.git] / kern / src / monitor.c
index fd01270..3f26125 100644 (file)
@@ -1,14 +1,8 @@
 // Simple command-line kernel monitor useful for
 // controlling the kernel and exploring the system interactively.
 
-#ifdef __SHARC__
-#pragma nosharc
-#endif
-
 #include <arch/arch.h>
-#include <stab.h>
 #include <smp.h>
-#include <console.h>
 #include <arch/console.h>
 
 #include <stdio.h>
@@ -28,6 +22,8 @@
 #include <event.h>
 #include <trap.h>
 #include <time.h>
+#include <percpu.h>
+#include <kprof.h>
 
 #include <ros/memlayout.h>
 #include <ros/event.h>
 #define CMDBUF_SIZE    80      // enough for one VGA text line
 
 typedef struct command {
-       const char *NTS name;
-       const char *NTS desc;
+       const char *name;
+       const char *desc;
        // return -1 to force monitor to exit
        int (*func)(int argc, char **argv, struct hw_trapframe *hw_tf);
 } command_t;
 
-static command_t (RO commands)[] = {
+static command_t commands[] = {
        { "help", "Display this list of commands", mon_help },
        { "kerninfo", "Display information about the kernel", mon_kerninfo },
        { "backtrace", "Dump a backtrace", mon_backtrace },
+       { "bt", "Dump a backtrace", mon_backtrace },
        { "reboot", "Take a ride to the South Bay", mon_reboot },
        { "showmapping", "Shows VA->PA mappings", mon_showmapping},
-       { "setmapperm", "Sets permissions on a VA->PA mapping", mon_setmapperm},
+       { "sm", "Shows VA->PA mappings", mon_sm},
        { "cpuinfo", "Prints CPU diagnostics", mon_cpuinfo},
        { "ps", "Prints process list", mon_ps},
        { "nanwan", "Meet Nanwan!!", mon_nanwan},
-       { "bin_ls", "List files in /bin", mon_bin_ls},
        { "bin_run", "Create and run a program from /bin", mon_bin_run},
        { "manager", "Run the manager", mon_manager},
        { "procinfo", "Show information about processes", mon_procinfo},
+       { "pip", "Shorthand for procinfo pid", mon_pip},
+       { "kill", "Kills a process", mon_kill},
        { "exit", "Leave the monitor", mon_exit},
+       { "e", "Leave the monitor", mon_exit},
        { "kfunc", "Run a kernel function directly (!!!)", mon_kfunc},
        { "notify", "Notify a process.  Vcoreid will skip their prefs", mon_notify},
        { "measure", "Run a specific measurement", mon_measure},
        { "trace", "Run some tracing functions", mon_trace},
        { "monitor", "Run the monitor on another core", mon_monitor},
-       { "fs", "Filesystem Diagnostics", mon_fs},
-       { "bb", "Try to run busybox (ash)", mon_bb},
+       { "sh", "Try to run a shell (bash)", mon_shell},
+       { "bash", "Try to run a shell (bash)", mon_shell},
+       { "bb", "Try to run a shell (bash)", mon_shell},
        { "alarm", "Alarm Diagnostics", mon_alarm},
        { "msr", "read/write msr: msr msr [value]", mon_msr},
+       { "db", "Misc debugging", mon_db},
+       { "px", "Toggle printx", mon_px},
+       { "kpfret", "Attempt to idle after a kernel fault", mon_kpfret},
+       { "ks", "Kernel scheduler hacks", mon_ks},
+       { "coreinfo", "Print diagnostics for a core", mon_coreinfo},
+       { "hexdump", "Hexdump PID's memory (0 for kernel)", mon_hexdump},
+       { "hd", "Hexdump PID's memory (0 for kernel)", mon_hexdump},
+       { "pahexdump", "Hexdump physical memory", mon_pahexdump},
+       { "phd", "Hexdump physical memory", mon_pahexdump},
+       { "dmesg", "Dump the dmesg buffer", mon_dmesg},
 };
 #define NCOMMANDS (sizeof(commands)/sizeof(commands[0]))
 
@@ -87,46 +97,18 @@ int mon_ps(int argc, char** argv, struct hw_trapframe *hw_tf)
 
 int mon_kerninfo(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       extern char (RO SNT _start)[], (RO SNT etext)[], (RO SNT edata)[], (RO SNT end)[];
+       extern char _start[], etext[], end[];
 
        cprintf("Special kernel symbols:\n");
        cprintf("  _start %016x (virt)  %016x (phys)\n", _start, (uintptr_t)(_start - KERNBASE));
        cprintf("  etext  %016x (virt)  %016x (phys)\n", etext, (uintptr_t)(etext - KERNBASE));
-       cprintf("  edata  %016x (virt)  %016x (phys)\n", edata, (uintptr_t)(edata - KERNBASE));
        cprintf("  end    %016x (virt)  %016x (phys)\n", end, (uintptr_t)(end - KERNBASE));
        cprintf("Kernel executable memory footprint: %dKB\n",
                (uint32_t)(end-_start+1023)/1024);
        return 0;
 }
 
-#if 0
-zra: not called
-static char RO* function_of(uint32_t address)
-{
-       extern stab_t (RO stab)[], (RO estab)[];
-       extern char (RO stabstr)[];
-       stab_t* symtab;
-       stab_t* best_symtab = 0;
-       uint32_t best_func = 0;
-
-       // ugly and unsorted
-       for (symtab = stab; symtab < estab; symtab++) {
-               // only consider functions, type = N_FUN
-               if ((symtab->n_type == N_FUN) &&
-                   (symtab->n_value <= address) &&
-                       (symtab->n_value > best_func)) {
-                       best_func = symtab->n_value;
-                       best_symtab = symtab;
-               }
-       }
-       // maybe the first stab really is the right one...  we'll see.
-       if (best_symtab == 0)
-               return "Function not found!";
-       return stabstr + best_symtab->n_strx;
-}
-#endif
-
-int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
+static int __backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        uintptr_t pc, fp;
        if (argc == 1) {
@@ -139,11 +121,18 @@ int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
        }
        pc = strtol(argv[1], 0, 16);
        fp = strtol(argv[2], 0, 16);
+       print_lock();
        printk("Backtrace from instruction %p, with frame pointer %p\n", pc, fp);
        backtrace_frame(pc, fp);
+       print_unlock();
        return 0;
 }
 
+int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       return __backtrace(argc, argv, hw_tf);
+}
+
 int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        cprintf("[Scottish Accent]: She's goin' down, Cap'n!\n");
@@ -154,76 +143,103 @@ int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
        return 0;
 }
 
-int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
+static int __showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       if (argc < 2) {
-               cprintf("Shows virtual -> physical mappings for a virt addr range.\n");
-               cprintf("Usage: showmapping START_ADDR [END_ADDR]\n");
-               return 1;
-       }
+       struct proc *p = NULL;
        uintptr_t start;
        size_t size;
-       start = ROUNDDOWN(strtol(argv[1], 0, 16), PGSIZE);
-       size = (argc == 2) ? 1 : strtol(argv[2], 0, 16) - start;
+       pgdir_t pgdir;
+       pid_t pid;
+
+       if (argc < 3) {
+               printk("Shows virtual -> physical mappings for a virt addr range.\n");
+               printk("Usage: showmapping PID START_ADDR [END_ADDR]\n");
+               printk("    PID == 0 for the boot pgdir\n");
+               return 1;
+       }
+       pid = strtol(argv[1], 0, 10);
+       if (!pid) {
+               pgdir = boot_pgdir;
+       } else {
+               p = pid2proc(pid);
+               if (!p) {
+                       printk("No proc with pid %d\n", pid);
+                       return 1;
+               }
+               pgdir = p->env_pgdir;
+       }
+       start = ROUNDDOWN(strtol(argv[2], 0, 16), PGSIZE);
+       size = (argc == 3) ? 1 : strtol(argv[3], 0, 16) - start;
        if (size/PGSIZE > 512) {
                cprintf("Not going to do this for more than 512 items\n");
                return 1;
        }
-
-       show_mapping(start,size);
+       show_mapping(pgdir, start, size);
+       if (p)
+               proc_decref(p);
        return 0;
 }
 
-int mon_setmapperm(int argc, char **argv, struct hw_trapframe *hw_tf)
+int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-#ifndef CONFIG_X86_32
-       cprintf("I don't support this call yet!\n");
-       return 1;
-#else
-       if (argc < 3) {
-               cprintf("Sets VIRT_ADDR's mapping's permissions to PERMS (in hex)\n");
-               cprintf("Only affects the lowest level PTE.  To adjust the PDE, do the math.\n");
-               cprintf("Be careful with this around UVPT, VPT, and friends.\n");
-               cprintf("Usage: setmapperm VIRT_ADDR PERMS\n");
-               return 1;
-       }
-       pde_t*COUNT(PTSIZE) pgdir = (pde_t*COUNT(PTSIZE))vpd;
-       pte_t *pte, *pde;
-       page_t* page;
-       uintptr_t va;
-       va = ROUNDDOWN(strtol(argv[1], 0, 16), PGSIZE);
-       page = page_lookup(pgdir, (void*SNT)va, &pte);
-       if (!page) {
-               cprintf("No such mapping\n");
-               return 1;
-       }
-       pde = &pgdir[PDX(va)];
-       cprintf("   Virtual    Physical  Ps Dr Ac CD WT U W\n");
-       cprintf("------------------------------------------\n");
-       cprintf("%p  %p  %1d  %1d  %1d  %1d  %1d  %1d %1d\n", va, page2pa(page),
-              (*pte & PTE_PS) >> 7, (*pte & PTE_D) >> 6, (*pte & PTE_A) >> 5,
-              (*pte & PTE_PCD) >> 4, (*pte & PTE_PWT) >> 3, (*pte & *pde & PTE_U) >> 2,
-              (*pte & *pde & PTE_W) >> 1);
-       *pte = PTE_ADDR(*pte) | (*pte & PTE_PS) |
-              (PGOFF(strtol(argv[2], 0, 16)) & ~PTE_PS ) | PTE_P;
-       cprintf("%p  %p  %1d  %1d  %1d  %1d  %1d  %1d %1d\n", va, page2pa(page),
-              (*pte & PTE_PS) >> 7, (*pte & PTE_D) >> 6, (*pte & PTE_A) >> 5,
-              (*pte & PTE_PCD) >> 4, (*pte & PTE_PWT) >> 3, (*pte & *pde & PTE_U) >> 2,
-              (*pte & *pde & PTE_W) >> 1);
-       return 0;
-#endif
+       return __showmapping(argc, argv, hw_tf);
+}
+
+int mon_sm(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       return __showmapping(argc, argv, hw_tf);
+}
+
+static void print_info_handler(struct hw_trapframe *hw_tf, void *data)
+{
+       uint64_t tsc = read_tsc();
+
+       print_lock();
+       cprintf("----------------------------\n");
+       cprintf("This is Core %d\n", core_id());
+       cprintf("Timestamp = %lld\n", tsc);
+#ifdef CONFIG_X86
+       cprintf("Hardware core %d\n", hw_core_id());
+       cprintf("MTRR_DEF_TYPE = 0x%08x\n", read_msr(IA32_MTRR_DEF_TYPE));
+       cprintf("MTRR Phys0 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x200), read_msr(0x201));
+       cprintf("MTRR Phys1 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x202), read_msr(0x203));
+       cprintf("MTRR Phys2 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x204), read_msr(0x205));
+       cprintf("MTRR Phys3 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x206), read_msr(0x207));
+       cprintf("MTRR Phys4 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x208), read_msr(0x209));
+       cprintf("MTRR Phys5 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x20a), read_msr(0x20b));
+       cprintf("MTRR Phys6 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x20c), read_msr(0x20d));
+       cprintf("MTRR Phys7 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x20e), read_msr(0x20f));
+#endif // CONFIG_X86
+       cprintf("----------------------------\n");
+       print_unlock();
+}
+
+static bool print_all_info(void)
+{
+       cprintf("\nCORE 0 asking all cores to print info:\n");
+       smp_call_function_all(print_info_handler, NULL, 0);
+       cprintf("\nDone!\n");
+       return true;
 }
 
 int mon_cpuinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       cprintf("Number of CPUs detected: %d\n", num_cpus);
+       cprintf("Number of Cores detected: %d\n", num_cores);
        cprintf("Calling CPU's ID: 0x%08x\n", core_id());
 
        if (argc < 2)
-               smp_call_function_self(test_print_info_handler, NULL, 0);
+               smp_call_function_self(print_info_handler, NULL, 0);
        else
                smp_call_function_single(strtol(argv[1], 0, 10),
-                                        test_print_info_handler, NULL, 0);
+                                        print_info_handler, NULL, 0);
        return 0;
 }
 
@@ -239,6 +255,7 @@ int mon_nanwan(int argc, char **argv, struct hw_trapframe *hw_tf)
        /* Borrowed with love from http://www.geocities.com/SoHo/7373/zoo.htm
         * (http://www.ascii-art.com/).  Slightly modified to make it 25 lines tall.
         */
+       print_lock();
        printk("\n");
        printk("             .-.  .-.\n");
        printk("             |  \\/  |\n");
@@ -263,26 +280,7 @@ int mon_nanwan(int argc, char **argv, struct hw_trapframe *hw_tf)
        printk("                                \\'   .\\#\n");
        printk("                             jgs \\   ::\\#\n");
        printk("                                  \\      \n");
-       return 0;
-}
-
-int mon_bin_ls(int argc, char **argv, struct hw_trapframe *hw_tf)
-{
-       struct dirent dir = {0};
-       struct file *bin_dir;
-       int retval = 0;
-
-       bin_dir = do_file_open("/bin", 0, 0);
-       if (!bin_dir) {
-               printk("No /bin directory!\n");
-               return 1;
-       }
-       printk("Files in /bin:\n-------------------------------\n");
-       do {
-               retval = bin_dir->f_op->readdir(bin_dir, &dir); 
-               printk("%s\n", dir.d_name);
-       } while (retval == 1);
-       kref_put(&bin_dir->f_kref);
+       print_unlock();
        return 0;
 }
 
@@ -292,11 +290,16 @@ int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
                printk("Usage: bin_run FILENAME\n");
                return 1;
        }
-       struct file *program;
+       struct file_or_chan *program;
        int retval = 0;
-       char buf[6 + MAX_FILENAME_SZ] = "/bin/";        /* /bin/ + max + \0 */
-       strncpy(buf + 5, argv[1], MAX_FILENAME_SZ);
-       program = do_file_open(buf, 0, 0);
+       char buf[5 + MAX_FILENAME_SZ + 1] = "/bin/";    /* /bin/ + max + \0 */
+
+       strlcpy(buf, "/bin/", sizeof(buf));
+       if (strlcat(buf, argv[1], sizeof(buf)) > sizeof(buf)) {
+               printk("Filename '%s' too long!\n", argv[1]);
+               return 1;
+       }
+       program = foc_open(buf, O_EXEC | O_READ, 0);
        if (!program) {
                printk("No such program!\n");
                return 1;
@@ -305,17 +308,16 @@ int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
        for (int i = 0; i < argc - 1; i++)
                p_argv[i] = argv[i + 1];
        p_argv[argc - 1] = 0;
-       char *p_envp[] = {"LD_LIBRARY_PATH=/lib", 0};
        /* super ugly: we need to stash current, so that proc_create doesn't pick up
         * on random processes running here and assuming they are the parent */
        struct proc *old_cur = current;
        current = 0;
-       struct proc *p = proc_create(program, p_argv, p_envp);
+       struct proc *p = proc_create(program, p_argv, NULL);
        current = old_cur;
        kfree(p_argv);
        proc_wakeup(p);
        proc_decref(p); /* let go of the reference created in proc_create() */
-       kref_put(&program->f_kref);
+       foc_decref(program);
        /* Make a scheduling decision.  You might not get the process you created,
         * in the event there are others floating around that are runnable */
        run_scheduler();
@@ -328,32 +330,26 @@ int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
 
 int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       int8_t irq_state = 0;
+       int verbosity = 0;
+
        if (argc < 2) {
                printk("Usage: procinfo OPTION\n");
-               printk("\tidlecores: show idle core map\n");
                printk("\tall: show all active pids\n");
-               printk("\tsched: scheduler diagnostic report\n");
-               printk("\tresources: show resources wanted/granted for all procs\n");
                printk("\tpid NUM: show a lot of info for proc NUM\n");
                printk("\tunlock: unlock the lock for the ADDR (OMG!!!)\n");
                printk("\tkill NUM: destroy proc NUM\n");
                return 1;
        }
-       if (!strcmp(argv[1], "idlecores")) {
-               print_idlecoremap();
-       } else if (!strcmp(argv[1], "all")) {
+       if (!strcmp(argv[1], "all")) {
                print_allpids();
-       } else if (!strcmp(argv[1], "sched")) {
-               sched_diag();
-       } else if (!strcmp(argv[1], "resources")) {
-               print_all_resources();
        } else if (!strcmp(argv[1], "pid")) {
-               if (argc != 3) {
+               if (argc < 3) {
                        printk("Give me a pid number.\n");
                        return 1;
                }
-               print_proc_info(strtol(argv[2], 0, 0));
+               if (argc >= 4)
+                       verbosity = strtol(argv[3], 0, 0);
+               print_proc_info(strtol(argv[2], 0, 0), verbosity);
        } else if (!strcmp(argv[1], "unlock")) {
                if (argc != 3) {
                        printk("Gimme lock address!  Me want lock address!.\n");
@@ -375,9 +371,7 @@ int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
                        printk("No such proc\n");
                        return 1;
                }
-               enable_irqsave(&irq_state);
                proc_destroy(p);
-               disable_irqsave(&irq_state);
                proc_decref(p);
        } else {
                printk("Bad option\n");
@@ -386,6 +380,39 @@ int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
        return 0;
 }
 
+int mon_pip(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       int verbosity = 0;
+
+       if (argc < 2) {
+               printk("Give me a pid number.\n");
+               return 1;
+       }
+       if (argc >= 3)
+               verbosity = strtol(argv[2], 0, 0);
+       print_proc_info(strtol(argv[1], 0, 0), verbosity);
+       return 0;
+}
+
+int mon_kill(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       struct proc *p;
+
+       if (argc < 2) {
+               printk("Usage: kill PID\n");
+               return 1;
+       }
+       p = pid2proc(strtol(argv[1], 0, 0));
+       if (!p) {
+               printk("No such proc\n");
+               return 1;
+       }
+       p->exitcode = 1;        /* typical EXIT_FAILURE */
+       proc_destroy(p);
+       proc_decref(p);
+       return 0;
+}
+
 int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        return -1;
@@ -393,11 +420,12 @@ int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
 
 int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       void (*func)(void *arg, ...);
+       long ret;
+       long (*func)(void *arg, ...);
 
        if (argc < 2) {
                printk("Usage: kfunc FUNCTION [arg1] [arg2] [etc]\n");
-               printk("Arguments must be in hex.  Can take 6 args.\n");
+               printk("Use 0x with hex arguments.  Can take 6 args.\n");
                return 1;
        }
        func = (void*)get_symbol_addr(argv[1]);
@@ -408,46 +436,47 @@ int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
        /* Not elegant, but whatever.  maybe there's a better syntax, or we can do
         * it with asm magic. */
        switch (argc) {
-               case 2: /* have to fake one arg */
-                       func((void*)0);
-                       break;
-               case 3: /* the real first arg */
-                       func((void*)strtol(argv[2], 0, 16));
-                       break;
-               case 4:
-                       func((void*)strtol(argv[2], 0, 16),
-                                   strtol(argv[3], 0, 16));
-                       break;
-               case 5:
-                       func((void*)strtol(argv[2], 0, 16),
-                                   strtol(argv[3], 0, 16),
-                                   strtol(argv[4], 0, 16));
-                       break;
-               case 6:
-                       func((void*)strtol(argv[2], 0, 16),
-                                   strtol(argv[3], 0, 16),
-                                   strtol(argv[4], 0, 16),
-                                   strtol(argv[5], 0, 16));
-                       break;
-               case 7:
-                       func((void*)strtol(argv[2], 0, 16),
-                                   strtol(argv[3], 0, 16),
-                                   strtol(argv[4], 0, 16),
-                                   strtol(argv[5], 0, 16),
-                                   strtol(argv[6], 0, 16));
-                       break;
-               case 8:
-                       func((void*)strtol(argv[2], 0, 16),
-                                   strtol(argv[3], 0, 16),
-                                   strtol(argv[4], 0, 16),
-                                   strtol(argv[5], 0, 16),
-                                   strtol(argv[6], 0, 16),
-                                   strtol(argv[7], 0, 16));
-                       break;
-               default:
-                       printk("Bad number of arguments.\n");
-                       return -1;
+       case 2: /* have to fake one arg */
+               ret = func((void*)0);
+               break;
+       case 3: /* the real first arg */
+               ret = func((void*)strtol(argv[2], 0, 0));
+               break;
+       case 4:
+               ret = func((void*)strtol(argv[2], 0, 0),
+                                 strtol(argv[3], 0, 0));
+               break;
+       case 5:
+               ret = func((void*)strtol(argv[2], 0, 0),
+                                 strtol(argv[3], 0, 0),
+                                 strtol(argv[4], 0, 0));
+               break;
+       case 6:
+               ret = func((void*)strtol(argv[2], 0, 0),
+                                 strtol(argv[3], 0, 0),
+                                 strtol(argv[4], 0, 0),
+                                 strtol(argv[5], 0, 0));
+               break;
+       case 7:
+               ret = func((void*)strtol(argv[2], 0, 0),
+                                 strtol(argv[3], 0, 0),
+                                 strtol(argv[4], 0, 0),
+                                 strtol(argv[5], 0, 0),
+                                 strtol(argv[6], 0, 0));
+               break;
+       case 8:
+               ret = func((void*)strtol(argv[2], 0, 0),
+                                 strtol(argv[3], 0, 0),
+                                 strtol(argv[4], 0, 0),
+                                 strtol(argv[5], 0, 0),
+                                 strtol(argv[6], 0, 0),
+                                 strtol(argv[7], 0, 0));
+               break;
+       default:
+               printk("Bad number of arguments.\n");
+               return -1;
        }
+       printk("%s (might have) returned %p\n", argv[1], ret);
        return 0;
 }
 
@@ -487,7 +516,6 @@ int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        uint64_t begin = 0, diff = 0;
        uint32_t end_refcnt = 0;
-       int8_t irq_state = 0;
 
        if (argc < 2) {
                printk("Usage: measure OPTION\n");
@@ -515,14 +543,12 @@ int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
                printk("Warning: this will be inaccurate due to the appserver.\n");
                end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores - 1;
 #endif /* CONFIG_APPSERVER */
-               enable_irqsave(&irq_state);
                proc_destroy(p);
-               disable_irqsave(&irq_state);
                proc_decref(p);
 #ifdef CONFIG_APPSERVER
                /* Won't be that accurate, since it's not actually going through the
                 * __proc_free() path. */
-               spin_on(kref_refcnt(&p->p_kref) != end_refcnt); 
+               spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
 #else
                /* this is a little ghetto. it's not fully free yet, but we are also
                 * slowing it down by messing with it, esp with the busy waiting on a
@@ -652,16 +678,56 @@ int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
        return 0;
 }
 
-/* Used in various debug locations.  Not a kernel API or anything. */
-bool mon_verbose_trace = FALSE;
+static bool mon_verbose_trace = FALSE;
+static DEFINE_PERCPU(bool, mon_nmi_trace);
+
+static void emit_hwtf_backtrace(struct hw_trapframe *hw_tf)
+{
+       if (mon_verbose_trace) {
+               printk("\n");
+               print_trapframe(hw_tf);
+               backtrace_hwtf(hw_tf);
+       }
+       printk("Core %d is at %p (%s)\n", core_id(), get_hwtf_pc(hw_tf),
+              get_fn_name(get_hwtf_pc(hw_tf)));
+}
+
+static void emit_vmtf_backtrace(struct vm_trapframe *vm_tf)
+{
+       if (mon_verbose_trace) {
+               printk("\n");
+               print_vmtrapframe(vm_tf);
+       }
+       printk("Core %d is at %p\n", core_id(), get_vmtf_pc(vm_tf));
+}
+
+/* This is dangerous and could cause a deadlock, since it runs in NMI context.
+ * It's only for monitor debugging, so YMMV.  We pass the type since the kernel
+ * doesn't deal in contexts (yet) */
+void emit_monitor_backtrace(int type, void *tf)
+{
+       if (!PERCPU_VAR(mon_nmi_trace))
+               return;
+       /* To prevent a spew of output during a lot of perf NMIs, we'll turn off the
+        * monitor output as soon as any NMI hits our core. */
+       PERCPU_VAR(mon_nmi_trace) = FALSE;
+       print_lock();
+       if (type == ROS_HW_CTX)
+               emit_hwtf_backtrace((struct hw_trapframe*)tf);
+       else
+               emit_vmtf_backtrace((struct vm_trapframe*)tf);
+       print_kmsgs(core_id());
+       print_unlock();
+}
+
 
 int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        int core;
        if (argc < 2) {
                printk("Usage: trace OPTION\n");
-               printk("\tsyscall start [silent] [pid]: starts tracing\n");
-               printk("\tsyscall stop: stops tracing, prints if it was silent\n");
+               printk("\tsyscall start [silent (0 or non-zero, NOT the word silent)] [pid]: starts tracing\n");
+               printk("\tsyscall stop: stops tracing.\n");
                printk("\tcoretf COREID: prints PC, -1 for all cores, verbose => TF\n");
                printk("\tpcpui [type [coreid]]: runs pcpui trace ring handlers\n");
                printk("\tpcpui-reset [noclear]: resets/clears pcpui trace ring\n");
@@ -674,28 +740,12 @@ int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
                        return 1;
                }
                if (!strcmp(argv[2], "start")) {
-                       bool all = TRUE;
-                       bool silent = FALSE;
-                       struct proc *p = NULL;
-                       if (argc >= 4) {
-                               silent = (bool)strtol(argv[3], 0, 0);
-                       }
-                       if (argc >= 5) {
-                               all = FALSE;
-                               p = pid2proc(strtol(argv[4], 0, 0));
-                               if (!p) {
-                                       printk("No such process\n");
-                                       return 1;
-                               }
-                       }
-                       systrace_start(silent);
-                       if (systrace_reg(all, p))
-                               printk("No room to trace more processes\n");
+                       systrace_loud = TRUE;
                } else if (!strcmp(argv[2], "stop")) {
-                       /* Stop and print for all processes */
-                       systrace_stop();
-                       systrace_print(TRUE, 0);
-                       systrace_clear_buffer();
+                       systrace_loud = FALSE;
+               } else {
+                       printk("Need a start or stop.\n");
+                       return 1;
                }
        } else if (!strcmp(argv[1], "coretf")) {
                if (argc != 3) {
@@ -705,14 +755,18 @@ int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
                core = strtol(argv[2], 0, 0);
                if (core < 0) {
                        printk("Sending NMIs to all cores:\n");
-                       for (int i = 0; i < num_cpus; i++)
+                       for (int i = 0; i < num_cores; i++) {
+                               _PERCPU_VAR(mon_nmi_trace, i) = TRUE;
                                send_nmi(i);
+                               udelay(1000000);
+                       }
                } else {
                        printk("Sending NMI core %d:\n", core);
-                       if (core >= num_cpus) {
+                       if (core >= num_cores) {
                                printk("No such core!  Maybe it's in another cell...\n");
                                return 1;
                        }
+                       _PERCPU_VAR(mon_nmi_trace, core) = TRUE;
                        send_nmi(core);
                }
                udelay(1000000);
@@ -724,7 +778,7 @@ int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
                        pcpui_type = 0;
                printk("\nRunning PCPUI Trace Ring handlers for type %d\n", pcpui_type);
                if (argc >= 4) {
-                       pcpui_coreid = strtol(argv[3], 0, 0); 
+                       pcpui_coreid = strtol(argv[3], 0, 0);
                        pcpui_tr_foreach(pcpui_coreid, pcpui_type);
                } else {
                        pcpui_tr_foreach_all(pcpui_type);
@@ -750,7 +804,7 @@ int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
                        printk("ERRRRRRRRRR.\n");
                        return 1;
                }
-               print_proc_info(strtol(argv[2], 0, 0));
+               print_proc_info(strtol(argv[2], 0, 0), 0);
        } else {
                printk("Bad option\n");
                return 1;
@@ -765,7 +819,7 @@ int mon_monitor(int argc, char **argv, struct hw_trapframe *hw_tf)
                return 1;
        }
        uint32_t core = strtol(argv[1], 0, 0);
-       if (core >= num_cpus) {
+       if (core >= num_cores) {
                printk("No such core!  Maybe it's in another cell...\n");
                return 1;
        }
@@ -778,15 +832,35 @@ int mon_monitor(int argc, char **argv, struct hw_trapframe *hw_tf)
 #define WHITESPACE "\t\r\n "
 #define MAXARGS 16
 
-static int runcmd(char *NTS real_buf, struct hw_trapframe *hw_tf) {
-       char * buf = NTEXPAND(real_buf);
+
+int onecmd(int argc, char *argv[], struct hw_trapframe *hw_tf) {
+       int i;
+       if (!argc)
+               return -1;
+       for (i = 0; i < NCOMMANDS; i++) {
+               if (strcmp(argv[0], commands[i].name) == 0)
+                       return commands[i].func(argc, argv, hw_tf);
+       }
+       return -1;
+}
+
+void __run_mon(uint32_t srcid, long a0, long a1, long a2)
+{
+       monitor(0);
+}
+
+static int runcmd(char *real_buf, struct hw_trapframe *hw_tf) {
+       char * buf = real_buf;
        int argc;
-       char *NTS argv[MAXARGS];
+       char *argv[MAXARGS];
        int i;
 
        // Parse the command buffer into whitespace-separated arguments
        argc = 0;
        argv[argc] = 0;
+       /* Discard initial 'm ', which is a common mistake when using 'm' a lot */
+       if ((buf[0] == 'm') && (buf[1] == ' '))
+               buf += 2;
        while (1) {
                // gobble whitespace
                while (*buf && strchr(WHITESPACE, *buf))
@@ -847,128 +921,10 @@ void monitor(struct hw_trapframe *hw_tf)
        }
 }
 
-static void pm_flusher(void *unused)
+int mon_shell(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       struct super_block *sb;
-       struct inode *inode;
-       unsigned long nr_pages;
-
-       /* could also put the delay between calls, or even within remove, during the
-        * WB phase. */
-       while (1) {
-               udelay_sched(5000);
-               TAILQ_FOREACH(sb, &super_blocks, s_list) {
-                       TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
-                               nr_pages = ROUNDUP(inode->i_size, PGSIZE) >> PGSHIFT;
-                               if (nr_pages)
-                                       pm_remove_contig(inode->i_mapping, 0, nr_pages);
-                       }
-               }
-       }
-}
-
-int mon_fs(int argc, char **argv, struct hw_trapframe *hw_tf)
-{
-       /* this assumes one mounted FS at the NS root */
-       struct super_block *sb;
-       struct file *file;
-       struct inode *inode;
-       struct dentry *dentry;
-       if (argc < 2) {
-               printk("Usage: fs OPTION\n");
-               printk("\topen: show all open files\n");
-               printk("\tinodes: show all inodes\n");
-               printk("\tdentries [lru|prune]: show all dentries, opt LRU/prune\n");
-               printk("\tls DIR: print the dir tree starting with DIR\n");
-               printk("\tpid: proc PID's fs crap placeholder\n");
-               printk("\tpmflusher: start a ktask to keep flushing all PMs\n");
-               return 1;
-       }
-       if (!strcmp(argv[1], "open")) {
-               printk("Open Files:\n----------------------------\n");
-               TAILQ_FOREACH(sb, &super_blocks, s_list) {
-                       printk("Superblock for %s\n", sb->s_name);
-                       TAILQ_FOREACH(file, &sb->s_files, f_list)
-                               printk("File: %p, %s, Refs: %d, Drefs: %d, Irefs: %d PM: %p\n",
-                                      file, file_name(file), kref_refcnt(&file->f_kref),
-                                      kref_refcnt(&file->f_dentry->d_kref),
-                                      kref_refcnt(&file->f_dentry->d_inode->i_kref),
-                                          file->f_mapping);
-               }
-       } else if (!strcmp(argv[1], "inodes")) {
-               printk("Mounted FS Inodes:\n----------------------------\n");
-               TAILQ_FOREACH(sb, &super_blocks, s_list) {
-                       printk("Superblock for %s\n", sb->s_name);
-                       TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
-                               printk("Inode: %p, Refs: %d, Nlinks: %d, Size(B): %d\n",
-                                      inode, kref_refcnt(&inode->i_kref), inode->i_nlink,
-                                      inode->i_size);
-                               TAILQ_FOREACH(dentry, &inode->i_dentry, d_alias)
-                                       printk("\t%s: Dentry: %p, Refs: %d\n",
-                                              dentry->d_name.name, dentry,
-                                              kref_refcnt(&dentry->d_kref));
-                       }
-               }
-       } else if (!strcmp(argv[1], "dentries")) {
-               printk("Dentry Cache:\n----------------------------\n");
-               TAILQ_FOREACH(sb, &super_blocks, s_list) {
-                       printk("Superblock for %s\n", sb->s_name);
-                       printk("DENTRY     FLAGS      REFCNT NAME\n");
-                       printk("--------------------------------\n");
-                       /* Hash helper */
-                       void print_dcache_entry(void *item)
-                       {
-                               struct dentry *d_i = (struct dentry*)item;
-                               printk("%p %p %02d     %s\n", d_i, d_i->d_flags,
-                                      kref_refcnt(&d_i->d_kref), d_i->d_name.name);
-                       }
-                       hash_for_each(sb->s_dcache, print_dcache_entry);
-               }
-               if (argc < 3)
-                       return 0;
-               if (!strcmp(argv[2], "lru")) {
-                       printk("LRU lists:\n");
-                       TAILQ_FOREACH(sb, &super_blocks, s_list) {
-                               printk("Superblock for %s\n", sb->s_name);
-                               TAILQ_FOREACH(dentry, &sb->s_lru_d, d_lru)
-                                       printk("Dentry: %p, Name: %s\n", dentry,
-                                              dentry->d_name.name);
-                       }
-               } else if (!strcmp(argv[2], "prune")) {
-                       printk("Pruning unused dentries\n");
-                       TAILQ_FOREACH(sb, &super_blocks, s_list)
-                               dcache_prune(sb, FALSE);
-               }
-       } else if (!strcmp(argv[1], "ls")) {
-               if (argc != 3) {
-                       printk("Give me a dir.\n");
-                       return 1;
-               }
-               if (argv[2][0] != '/') {
-                       printk("Dear fellow giraffe lover, Use absolute paths.\n");
-                       return 1;
-               }
-               ls_dash_r(argv[2]);
-               /* whatever.  placeholder. */
-       } else if (!strcmp(argv[1], "pid")) {
-               if (argc != 3) {
-                       printk("Give me a pid number.\n");
-                       return 1;
-               }
-               /* whatever.  placeholder. */
-       } else if (!strcmp(argv[1], "pmflusher")) {
-               ktask("pm_flusher", pm_flusher, 0);
-       } else {
-               printk("Bad option\n");
-               return 1;
-       }
-       return 0;
-}
-
-int mon_bb(int argc, char **argv, struct hw_trapframe *hw_tf)
-{
-       char *l_argv[3] = {"", "busybox", "ash"};
-       return mon_bin_run(3, l_argv, hw_tf);
+       char *l_argv[2] = {"/bin/bash", "bash"};
+       return mon_bin_run(2, l_argv, hw_tf);
 }
 
 int mon_alarm(int argc, char **argv, struct hw_trapframe *hw_tf)
@@ -1042,3 +998,223 @@ int mon_msr(int argc, char **argv, struct hw_trapframe *hw_tf)
        return 0;
 #endif
 }
+
+int mon_db(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       pid_t pid = -1;
+
+       if (argc < 2) {
+               printk("Usage: db OPTION\n");
+               printk("\tblk [PID]: print all blocked kthreads\n");
+               printk("\taddr PID 0xADDR: for PID lookup ADDR's file/vmr info\n");
+               return 1;
+       }
+       if (!strcmp(argv[1], "blk") || !strcmp(argv[1], "sem")) {
+               if (argc > 2)
+                       pid = strtol(argv[2], 0, 0);
+               print_db_blk_info(pid);
+       } else if (!strcmp(argv[1], "addr")) {
+               if (argc < 4) {
+                       printk("Usage: db addr PID 0xADDR\n");
+                       return 1;
+               }
+               debug_addr_pid(strtol(argv[2], 0, 10), strtol(argv[3], 0, 16));
+       } else {
+               printk("Bad option\n");
+               return 1;
+       }
+       return 0;
+}
+
+int mon_px(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       pid_t pid = 0;
+       struct proc *p;
+
+       if (argc == 2)
+               pid = strtol(argv[1], 0, 0);
+       if (!pid) {
+               set_printx(2);
+               printk("Printxing is now %sabled\n", printx_on ? "en" : "dis");
+               return 0;
+       }
+       p = pid2proc(pid);
+       if (!p) {
+               printk("No proc with pid %d\n", pid);
+               return 1;
+       }
+       p->procdata->printx_on = !p->procdata->printx_on;
+       proc_decref(p);
+       return 0;
+}
+
+/* Super hack.  Given a kernel hw_tf, we hack the RIP to smp_idle, then return
+ * to it.  Any locks or other stuff being done is completely lost, so you could
+ * deadlock.  This gets out of the "we're totall screwed, but don't want to
+ * reboot right now", typically caused by screw-ups from the monitor. */
+int mon_kpfret(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       struct per_cpu_info *pcpui = &per_cpu_info[core_id()];
+
+       /* if monitor had a TF, try to use that */
+       if (!hw_tf) {
+               if (argc < 2) {
+                       printk("Usage: kpfret HW_TF\n");
+                       return 1;
+               }
+               /* the hw_tf passed in is the one we got from monitor, which is 0 from
+                * panics. */
+               hw_tf = (struct hw_trapframe*)strtol(argv[1], 0, 16);
+       }
+
+       if (!in_kernel(hw_tf)) {
+               printk("hw_tf %p was not a kernel tf!\n", hw_tf);
+               return -1;
+       }
+
+#ifdef CONFIG_X86
+       hw_tf->tf_rip = (uintptr_t)smp_idle;
+       dec_ktrap_depth(pcpui);
+
+       asm volatile("mov %0, %%rsp;"
+                    "addq $0x10, %%rsp;"
+                    "popq %%rax;"
+                    "popq %%rbx;"
+                    "popq %%rcx;"
+                    "popq %%rdx;"
+                    "popq %%rbp;"
+                    "popq %%rsi;"
+                    "popq %%rdi;"
+                    "popq %%r8;"
+                    "popq %%r9;"
+                    "popq %%r10;"
+                    "popq %%r11;"
+                    "popq %%r12;"
+                    "popq %%r13;"
+                    "popq %%r14;"
+                    "popq %%r15;"
+                    "addq $0x10, %%rsp;"
+                    "iretq;"
+                                : : "r"(hw_tf));
+       assert(0);
+#else
+       printk("KPF return not supported\n");
+       return -1;
+#endif /* CONFIG_X86 */
+}
+
+int mon_ks(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       if (argc < 2) {
+usage:
+               printk("Usage: ks OPTION\n");
+               printk("\tidles: show idle core map\n");
+               printk("\tdiag: scheduler diagnostic report\n");
+               printk("\tresources: show resources wanted/granted for all procs\n");
+               printk("\tsort: sorts the idlecoremap, 1..n\n");
+               printk("\tnc PCOREID: sets the next CG core allocated\n");
+               return 1;
+       }
+       if (!strcmp(argv[1], "idles")) {
+               print_idle_core_map();
+       } else if (!strcmp(argv[1], "diag")) {
+               sched_diag();
+       } else if (!strcmp(argv[1], "resources")) {
+               print_all_resources();
+       } else if (!strcmp(argv[1], "sort")) {
+               sort_idle_cores();
+       } else if (!strcmp(argv[1], "nc")) {
+               if (argc != 3) {
+                       printk("Need a pcore number.\n");
+                       return 1;
+               }
+               next_core_to_alloc(strtol(argv[2], 0, 0));
+       } else {
+               printk("Bad option %s\n", argv[1]);
+               goto usage;
+       }
+       return 0;
+}
+
+/* Prints info about a core.  Optional first arg == coreid. */
+int mon_coreinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       struct per_cpu_info *pcpui;
+       struct kthread *kth;
+       int coreid = core_id();
+
+       if (argc >= 2)
+               coreid = strtol(argv[1], 0, 0);
+       pcpui = &per_cpu_info[coreid];
+       printk("Core %d:\n\tcur_proc %d\n\towning proc %d, owning vc %d\n",
+              coreid, pcpui->cur_proc ? pcpui->cur_proc->pid : 0,
+              pcpui->owning_proc ? pcpui->owning_proc->pid : 0,
+              pcpui->owning_vcoreid != 0xdeadbeef ? pcpui->owning_vcoreid : 0);
+       kth = pcpui->cur_kthread;
+       if (kth) {
+               /* kth->proc is only used when the kthread is sleeping.  when it's
+                * running, we care about cur_proc.  if we're here, proc should be 0
+                * unless the kth is concurrently sleeping (we called this remotely) */
+               printk("\tkthread %p (%s), sysc %p (%d)\n", kth, kth->name,
+                      kth->sysc, kth->sysc ? kth->sysc->num : -1);
+       } else {
+               /* Can happen during early boot */
+               printk("\tNo kthread!\n");
+       }
+       return 0;
+}
+
+int mon_hexdump(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       struct proc *p = NULL;
+       uintptr_t switch_state;
+       pid_t pid;
+       uintptr_t start;
+       size_t len;
+
+       assert(argc >= 1);
+       if (argc < 4) {
+               printk("Usage: %s PID ADDR LEN\n", argv[0]);
+               printk("    PID == 0 for kernel / don't care\n");
+               return 1;
+       }
+       pid = strtol(argv[1], 0, 0);
+       start = strtoul(argv[2], 0, 0);
+       len = strtoul(argv[3], 0, 0);
+       if (pid) {
+               p = pid2proc(pid);
+               if (!p) {
+                       printk("No proc with pid %d\n", pid);
+                       return 1;
+               }
+               switch_state = switch_to(p);
+       }
+       hexdump((void*)start, len);
+       if (p) {
+               switch_back(p, switch_state);
+               proc_decref(p);
+       }
+       return 0;
+}
+
+int mon_pahexdump(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       uintptr_t start;
+       size_t len;
+
+       assert(argc >= 1);
+       if (argc < 3) {
+               printk("Usage: %s PHYS_ADDR LEN\n", argv[0]);
+               return 1;
+       }
+       start = strtoul(argv[1], 0, 0);
+       len = strtoul(argv[2], 0, 0);
+       pahexdump(start, len);
+       return 0;
+}
+
+int mon_dmesg(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       kprof_dump_data();
+       return 0;
+}