Kernel alarms can run in IRQ or RKM context
[akaros.git] / kern / src / monitor.c
index 803252e..61977c8 100644 (file)
@@ -45,8 +45,10 @@ static command_t (RO commands)[] = {
        { "help", "Display this list of commands", mon_help },
        { "kerninfo", "Display information about the kernel", mon_kerninfo },
        { "backtrace", "Dump a backtrace", mon_backtrace },
+       { "bt", "Dump a backtrace", mon_bt },
        { "reboot", "Take a ride to the South Bay", mon_reboot },
        { "showmapping", "Shows VA->PA mappings", mon_showmapping},
+       { "sm", "Shows VA->PA mappings", mon_sm},
        { "setmapperm", "Sets permissions on a VA->PA mapping", mon_setmapperm},
        { "cpuinfo", "Prints CPU diagnostics", mon_cpuinfo},
        { "ps", "Prints process list", mon_ps},
@@ -55,6 +57,8 @@ static command_t (RO commands)[] = {
        { "bin_run", "Create and run a program from /bin", mon_bin_run},
        { "manager", "Run the manager", mon_manager},
        { "procinfo", "Show information about processes", mon_procinfo},
+       { "pip", "Shorthand for procinfo pid", mon_pip},
+       { "kill", "Kills a process", mon_kill},
        { "exit", "Leave the monitor", mon_exit},
        { "kfunc", "Run a kernel function directly (!!!)", mon_kfunc},
        { "notify", "Notify a process.  Vcoreid will skip their prefs", mon_notify},
@@ -64,6 +68,8 @@ static command_t (RO commands)[] = {
        { "fs", "Filesystem Diagnostics", mon_fs},
        { "bb", "Try to run busybox (ash)", mon_bb},
        { "alarm", "Alarm Diagnostics", mon_alarm},
+       { "msr", "read/write msr: msr msr [value]", mon_msr},
+       { "db", "Misc debugging", mon_db},
 };
 #define NCOMMANDS (sizeof(commands)/sizeof(commands[0]))
 
@@ -125,12 +131,34 @@ static char RO* function_of(uint32_t address)
 }
 #endif
 
-int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
+static int __backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       backtrace();
+       uintptr_t pc, fp;
+       if (argc == 1) {
+               backtrace();
+               return 0;
+       }
+       if (argc != 3) {
+               printk("Need either no arguments, or two (PC and FP) in hex\n");
+               return 1;
+       }
+       pc = strtol(argv[1], 0, 16);
+       fp = strtol(argv[2], 0, 16);
+       printk("Backtrace from instruction %p, with frame pointer %p\n", pc, fp);
+       backtrace_frame(pc, fp);
        return 0;
 }
 
+int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       return __backtrace(argc, argv, hw_tf);
+}
+
+int mon_bt(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       return __backtrace(argc, argv, hw_tf);
+}
+
 int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        cprintf("[Scottish Accent]: She's goin' down, Cap'n!\n");
@@ -141,32 +169,53 @@ int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
        return 0;
 }
 
-int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
+static int __showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       if (argc < 2) {
-               cprintf("Shows virtual -> physical mappings for a virtual address range.\n");
-               cprintf("Usage: showmapping START_ADDR [END_ADDR]\n");
+       struct proc *p;
+       uintptr_t start;
+       size_t size;
+       pde_t *pgdir;
+       pid_t pid;
+       if (argc < 3) {
+               printk("Shows virtual -> physical mappings for a virt addr range.\n");
+               printk("Usage: showmapping PID START_ADDR [END_ADDR]\n");
+               printk("    PID == 0 for the boot pgdir\n");
                return 1;
        }
-       pde_t* pgdir = (pde_t*)vpd;
-       pte_t *pte, *pde;
-       page_t* page;
-       uintptr_t start, i;
-       size_t size;
-       start = ROUNDDOWN(strtol(argv[1], 0, 16), PGSIZE);
-       size = (argc == 2) ? 1 : strtol(argv[2], 0, 16) - start;
+       pid = strtol(argv[1], 0, 10);
+       if (!pid) {
+               pgdir = boot_pgdir;
+       } else {
+               p = pid2proc(pid);
+               if (!p) {
+                       printk("No proc with pid %d\n", pid);
+                       return 1;
+               }
+               pgdir = p->env_pgdir;
+       }
+       start = ROUNDDOWN(strtol(argv[2], 0, 16), PGSIZE);
+       size = (argc == 3) ? 1 : strtol(argv[3], 0, 16) - start;
        if (size/PGSIZE > 512) {
                cprintf("Not going to do this for more than 512 items\n");
                return 1;
        }
-
-       show_mapping(start,size);
+       show_mapping(pgdir, start, size);
        return 0;
 }
 
+int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       return __showmapping(argc, argv, hw_tf);
+}
+
+int mon_sm(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       return __showmapping(argc, argv, hw_tf);
+}
+
 int mon_setmapperm(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-#ifndef __i386__
+#ifndef CONFIG_X86_32
        cprintf("I don't support this call yet!\n");
        return 1;
 #else
@@ -204,16 +253,58 @@ int mon_setmapperm(int argc, char **argv, struct hw_trapframe *hw_tf)
 #endif
 }
 
+static spinlock_t print_info_lock = SPINLOCK_INITIALIZER_IRQSAVE;
+
+static void print_info_handler(struct hw_trapframe *hw_tf, void *data)
+{
+       uint64_t tsc = read_tsc();
+
+       spin_lock_irqsave(&print_info_lock);
+       cprintf("----------------------------\n");
+       cprintf("This is Core %d\n", core_id());
+       cprintf("Timestamp = %lld\n", tsc);
+#ifdef CONFIG_X86
+       cprintf("Hardware core %d\n", hw_core_id());
+       cprintf("MTRR_DEF_TYPE = 0x%08x\n", read_msr(IA32_MTRR_DEF_TYPE));
+       cprintf("MTRR Phys0 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x200), read_msr(0x201));
+       cprintf("MTRR Phys1 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x202), read_msr(0x203));
+       cprintf("MTRR Phys2 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x204), read_msr(0x205));
+       cprintf("MTRR Phys3 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x206), read_msr(0x207));
+       cprintf("MTRR Phys4 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x208), read_msr(0x209));
+       cprintf("MTRR Phys5 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x20a), read_msr(0x20b));
+       cprintf("MTRR Phys6 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x20c), read_msr(0x20d));
+       cprintf("MTRR Phys7 Base = 0x%016llx, Mask = 0x%016llx\n",
+               read_msr(0x20e), read_msr(0x20f));
+#endif // CONFIG_X86
+       cprintf("----------------------------\n");
+       spin_unlock_irqsave(&print_info_lock);
+}
+
+static bool print_all_info(void)
+{
+       cprintf("\nCORE 0 asking all cores to print info:\n");
+       smp_call_function_all(print_info_handler, NULL, 0);
+       cprintf("\nDone!\n");
+       return true;
+}
+
 int mon_cpuinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        cprintf("Number of CPUs detected: %d\n", num_cpus);
        cprintf("Calling CPU's ID: 0x%08x\n", core_id());
 
        if (argc < 2)
-               smp_call_function_self(test_print_info_handler, NULL, 0);
+               smp_call_function_self(print_info_handler, NULL, 0);
        else
                smp_call_function_single(strtol(argv[1], 0, 10),
-                                        test_print_info_handler, NULL, 0);
+                                        print_info_handler, NULL, 0);
        return 0;
 }
 
@@ -296,14 +387,19 @@ int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
                p_argv[i] = argv[i + 1];
        p_argv[argc - 1] = 0;
        char *p_envp[] = {"LD_LIBRARY_PATH=/lib", 0};
+       /* super ugly: we need to stash current, so that proc_create doesn't pick up
+        * on random processes running here and assuming they are the parent */
+       struct proc *old_cur = current;
+       current = 0;
        struct proc *p = proc_create(program, p_argv, p_envp);
+       current = old_cur;
        kfree(p_argv);
        proc_wakeup(p);
        proc_decref(p); /* let go of the reference created in proc_create() */
        kref_put(&program->f_kref);
        /* Make a scheduling decision.  You might not get the process you created,
         * in the event there are others floating around that are runnable */
-       schedule();
+       run_scheduler();
        /* want to idle, so we un the process we just selected.  this is a bit
         * hackish, but so is the monitor. */
        smp_idle();
@@ -371,6 +467,36 @@ int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
        return 0;
 }
 
+int mon_pip(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       if (argc != 2) {
+               printk("Give me a pid number.\n");
+               return 1;
+       }
+       print_proc_info(strtol(argv[1], 0, 0));
+       return 0;
+}
+
+int mon_kill(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       struct proc *p;
+       int8_t irq_state = 0;
+       if (argc < 2) {
+               printk("Usage: kill PID\n");
+               return 1;
+       }
+       p = pid2proc(strtol(argv[1], 0, 0));
+       if (!p) {
+               printk("No such proc\n");
+               return 1;
+       }
+       enable_irqsave(&irq_state);
+       proc_destroy(p);
+       disable_irqsave(&irq_state);
+       proc_decref(p);
+       return 0;
+}
+
 int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        return -1;
@@ -378,11 +504,6 @@ int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
 
 int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       #ifndef __i386__
-       printk("Only supported on x86 for now.  =(\n");
-       return -1;
-       #endif
-
        void (*func)(void *arg, ...);
 
        if (argc < 2) {
@@ -390,7 +511,7 @@ int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
                printk("Arguments must be in hex.  Can take 6 args.\n");
                return 1;
        }
-       func = debug_get_fn_addr(argv[1]);
+       func = (void*)get_symbol_addr(argv[1]);
        if (!func) {
                printk("Function not found.\n");
                return 1;
@@ -642,14 +763,20 @@ int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
        return 0;
 }
 
+/* Used in various debug locations.  Not a kernel API or anything. */
+bool mon_verbose_trace = FALSE;
+
 int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
-       uint32_t core;
+       int core;
        if (argc < 2) {
                printk("Usage: trace OPTION\n");
                printk("\tsyscall start [silent] [pid]: starts tracing\n");
                printk("\tsyscall stop: stops tracing, prints if it was silent\n");
-               printk("\tcoretf COREID: cause the other core to print its TF (NMI)\n");
+               printk("\tcoretf COREID: prints PC, -1 for all cores, verbose => TF\n");
+               printk("\tpcpui [type [coreid]]: runs pcpui trace ring handlers\n");
+               printk("\tpcpui-reset [noclear]: resets/clears pcpui trace ring\n");
+               printk("\tverbose: toggles verbosity, depends on trace command\n");
                return 1;
        }
        if (!strcmp(argv[1], "syscall")) {
@@ -687,12 +814,48 @@ int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
                        return 1;
                }
                core = strtol(argv[2], 0, 0);
-               if (core >= num_cpus) {
-                       printk("No such core!  Maybe it's in another cell...\n");
-                       return 1;
+               if (core < 0) {
+                       printk("Sending NMIs to all cores:\n");
+                       for (int i = 0; i < num_cpus; i++)
+                               send_nmi(i);
+               } else {
+                       printk("Sending NMI core %d:\n", core);
+                       if (core >= num_cpus) {
+                               printk("No such core!  Maybe it's in another cell...\n");
+                               return 1;
+                       }
+                       send_nmi(core);
                }
-               send_nmi(core);
                udelay(1000000);
+       } else if (!strcmp(argv[1], "pcpui")) {
+               int pcpui_type, pcpui_coreid;
+               if (argc >= 3)
+                       pcpui_type = strtol(argv[2], 0, 0);
+               else
+                       pcpui_type = 0;
+               printk("\nRunning PCPUI Trace Ring handlers for type %d\n", pcpui_type);
+               if (argc >= 4) {
+                       pcpui_coreid = strtol(argv[3], 0, 0); 
+                       pcpui_tr_foreach(pcpui_coreid, pcpui_type);
+               } else {
+                       pcpui_tr_foreach_all(pcpui_type);
+               }
+       } else if (!strcmp(argv[1], "pcpui-reset")) {
+               if (argc >= 3) {
+                       printk("\nResetting all PCPUI Trace Rings\n");
+                       pcpui_tr_reset_all();
+               } else {
+                       printk("\nResetting and clearing all PCPUI Trace Rings\n");
+                       pcpui_tr_reset_and_clear_all();
+               }
+       } else if (!strcmp(argv[1], "verbose")) {
+               if (mon_verbose_trace) {
+                       printk("Turning trace verbosity off\n");
+                       mon_verbose_trace = FALSE;
+               } else {
+                       printk("Turning trace verbosity on\n");
+                       mon_verbose_trace = TRUE;
+               }
        } else if (!strcmp(argv[1], "opt2")) {
                if (argc != 3) {
                        printk("ERRRRRRRRRR.\n");
@@ -770,19 +933,23 @@ void monitor(struct hw_trapframe *hw_tf)
        #define MON_CMD_LENGTH 256
        char buf[MON_CMD_LENGTH];
        int cnt;
+       int coreid = core_id_early();
 
        /* they are always disabled, since we have this irqsave lock */
        if (irq_is_enabled())
-               printk("Entering Nanwan's Dungeon on Core %d (Ints on):\n", core_id());
+               printk("Entering Nanwan's Dungeon on Core %d (Ints on):\n", coreid);
        else
-               printk("Entering Nanwan's Dungeon on Core %d (Ints off):\n", core_id());
+               printk("Entering Nanwan's Dungeon on Core %d (Ints off):\n", coreid);
        printk("Type 'help' for a list of commands.\n");
 
        if (hw_tf != NULL)
                print_trapframe(hw_tf);
 
        while (1) {
-               cnt = readline(buf, MON_CMD_LENGTH, "ROS(Core %d)> ", core_id());
+               /* on occasion, the kernel monitor can migrate (like if you run
+                * something that blocks / syncs and wakes up on another core) */
+               cmb();
+               cnt = readline(buf, MON_CMD_LENGTH, "ROS(Core %d)> ", core_id_early());
                if (cnt > 0) {
                        buf[cnt] = 0;
                        if (runcmd(buf, hw_tf) < 0)
@@ -791,6 +958,26 @@ void monitor(struct hw_trapframe *hw_tf)
        }
 }
 
+static void pm_flusher(void *unused)
+{
+       struct super_block *sb;
+       struct inode *inode;
+       unsigned long nr_pages;
+
+       /* could also put the delay between calls, or even within remove, during the
+        * WB phase. */
+       while (1) {
+               udelay_sched(5000);
+               TAILQ_FOREACH(sb, &super_blocks, s_list) {
+                       TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
+                               nr_pages = ROUNDUP(inode->i_size, PGSIZE) >> PGSHIFT;
+                               if (nr_pages)
+                                       pm_remove_contig(inode->i_mapping, 0, nr_pages);
+                       }
+               }
+       }
+}
+
 int mon_fs(int argc, char **argv, struct hw_trapframe *hw_tf)
 {
        /* this assumes one mounted FS at the NS root */
@@ -805,6 +992,7 @@ int mon_fs(int argc, char **argv, struct hw_trapframe *hw_tf)
                printk("\tdentries [lru|prune]: show all dentries, opt LRU/prune\n");
                printk("\tls DIR: print the dir tree starting with DIR\n");
                printk("\tpid: proc PID's fs crap placeholder\n");
+               printk("\tpmflusher: start a ktask to keep flushing all PMs\n");
                return 1;
        }
        if (!strcmp(argv[1], "open")) {
@@ -812,10 +1000,11 @@ int mon_fs(int argc, char **argv, struct hw_trapframe *hw_tf)
                TAILQ_FOREACH(sb, &super_blocks, s_list) {
                        printk("Superblock for %s\n", sb->s_name);
                        TAILQ_FOREACH(file, &sb->s_files, f_list)
-                               printk("File: %p, %s, Refs: %d, Drefs: %d, Irefs: %d\n", file,
-                                      file_name(file), kref_refcnt(&file->f_kref),
+                               printk("File: %p, %s, Refs: %d, Drefs: %d, Irefs: %d PM: %p\n",
+                                      file, file_name(file), kref_refcnt(&file->f_kref),
                                       kref_refcnt(&file->f_dentry->d_kref),
-                                      kref_refcnt(&file->f_dentry->d_inode->i_kref));
+                                      kref_refcnt(&file->f_dentry->d_inode->i_kref),
+                                          file->f_mapping);
                }
        } else if (!strcmp(argv[1], "inodes")) {
                printk("Mounted FS Inodes:\n----------------------------\n");
@@ -878,6 +1067,8 @@ int mon_fs(int argc, char **argv, struct hw_trapframe *hw_tf)
                        return 1;
                }
                /* whatever.  placeholder. */
+       } else if (!strcmp(argv[1], "pmflusher")) {
+               ktask("pm_flusher", pm_flusher, 0);
        } else {
                printk("Bad option\n");
                return 1;
@@ -906,3 +1097,75 @@ int mon_alarm(int argc, char **argv, struct hw_trapframe *hw_tf)
        }
        return 0;
 }
+
+static void show_msr(struct hw_trapframe *unused, void *v)
+{
+       int core = core_id();
+       uint64_t val;
+       uint32_t msr = *(uint32_t *)v;
+       val = read_msr(msr);
+       printk("%d: %08x: %016llx\n", core, msr, val);
+}
+
+struct set {
+       uint32_t msr;
+       uint64_t val;
+};
+
+static void set_msr(struct hw_trapframe *unused, void *v)
+{
+       int core = core_id();
+       struct set *s = v;
+       uint32_t msr = s->msr;
+       uint64_t val = s->val;
+       write_msr(msr, val);
+       val = read_msr(msr);
+       printk("%d: %08x: %016llx\n", core, msr, val);
+}
+
+int mon_msr(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+#ifndef CONFIG_X86
+       cprintf("Not on this architecture\n");
+       return 1;
+#else
+       uint64_t val;
+       uint32_t msr;
+       if (argc < 2 || argc > 3) {
+               printk("Usage: msr register [value]\n");
+               return 1;
+       }
+       msr = strtoul(argv[1], 0, 16);
+       handler_wrapper_t *w;
+       smp_call_function_all(show_msr, &msr, &w);
+       smp_call_wait(w);
+
+       if (argc < 3)
+               return 0;
+       /* somewhat bogus on 32 bit. */
+       val = strtoul(argv[2], 0, 16);
+
+       struct set set;
+       set.msr = msr;
+       set.val = val;
+       smp_call_function_all(set_msr, &set, &w);
+       smp_call_wait(w);
+       return 0;
+#endif
+}
+
+int mon_db(int argc, char **argv, struct hw_trapframe *hw_tf)
+{
+       if (argc < 2) {
+               printk("Usage: db OPTION\n");
+               printk("\tsem: print all semaphore info\n");
+               return 1;
+       }
+       if (!strcmp(argv[1], "sem")) {
+               print_all_sem_info();
+       } else {
+               printk("Bad option\n");
+               return 1;
+       }
+       return 0;
+}