Decreases harm from races on VFS file offsets
[akaros.git] / kern / src / monitor.c
1 // Simple command-line kernel monitor useful for
2 // controlling the kernel and exploring the system interactively.
3
4 #ifdef __SHARC__
5 #pragma nosharc
6 #endif
7
8 #include <arch/arch.h>
9 #include <stab.h>
10 #include <smp.h>
11 #include <console.h>
12 #include <arch/console.h>
13
14 #include <stdio.h>
15 #include <string.h>
16 #include <assert.h>
17 #include <monitor.h>
18 #include <trap.h>
19 #include <pmap.h>
20 #include <kdebug.h>
21 #include <testing.h>
22 #include <manager.h>
23 #include <schedule.h>
24 #include <kdebug.h>
25 #include <syscall.h>
26 #include <kmalloc.h>
27 #include <elf.h>
28 #include <event.h>
29 #include <trap.h>
30 #include <time.h>
31
32 #include <ros/memlayout.h>
33 #include <ros/event.h>
34
35 #define CMDBUF_SIZE     80      // enough for one VGA text line
36
37 typedef struct command {
38         const char *NTS name;
39         const char *NTS desc;
40         // return -1 to force monitor to exit
41         int (*func)(int argc, char **argv, struct hw_trapframe *hw_tf);
42 } command_t;
43
44 static command_t (RO commands)[] = {
45         { "help", "Display this list of commands", mon_help },
46         { "kerninfo", "Display information about the kernel", mon_kerninfo },
47         { "backtrace", "Dump a backtrace", mon_backtrace },
48         { "bt", "Dump a backtrace", mon_bt },
49         { "reboot", "Take a ride to the South Bay", mon_reboot },
50         { "showmapping", "Shows VA->PA mappings", mon_showmapping},
51         { "sm", "Shows VA->PA mappings", mon_sm},
52         { "setmapperm", "Sets permissions on a VA->PA mapping", mon_setmapperm},
53         { "cpuinfo", "Prints CPU diagnostics", mon_cpuinfo},
54         { "ps", "Prints process list", mon_ps},
55         { "nanwan", "Meet Nanwan!!", mon_nanwan},
56         { "bin_ls", "List files in /bin", mon_bin_ls},
57         { "bin_run", "Create and run a program from /bin", mon_bin_run},
58         { "manager", "Run the manager", mon_manager},
59         { "procinfo", "Show information about processes", mon_procinfo},
60         { "pip", "Shorthand for procinfo pid", mon_pip},
61         { "kill", "Kills a process", mon_kill},
62         { "exit", "Leave the monitor", mon_exit},
63         { "kfunc", "Run a kernel function directly (!!!)", mon_kfunc},
64         { "notify", "Notify a process.  Vcoreid will skip their prefs", mon_notify},
65         { "measure", "Run a specific measurement", mon_measure},
66         { "trace", "Run some tracing functions", mon_trace},
67         { "monitor", "Run the monitor on another core", mon_monitor},
68         { "fs", "Filesystem Diagnostics", mon_fs},
69         { "bb", "Try to run busybox (ash)", mon_bb},
70         { "alarm", "Alarm Diagnostics", mon_alarm},
71         { "msr", "read/write msr: msr msr [value]", mon_msr},
72         { "db", "Misc debugging", mon_db},
73 };
74 #define NCOMMANDS (sizeof(commands)/sizeof(commands[0]))
75
76 /***** Implementations of basic kernel monitor commands *****/
77
78 int mon_help(int argc, char **argv, struct hw_trapframe *hw_tf)
79 {
80         int i;
81
82         for (i = 0; i < NCOMMANDS; i++)
83                 cprintf("%s - %s\n", commands[i].name, commands[i].desc);
84         return 0;
85 }
86
87 int mon_ps(int argc, char** argv, struct hw_trapframe *hw_tf)
88 {
89         print_allpids();
90         return 0;
91 }
92
93 int mon_kerninfo(int argc, char **argv, struct hw_trapframe *hw_tf)
94 {
95         extern char (RO SNT _start)[], (RO SNT etext)[], (RO SNT edata)[], (RO SNT end)[];
96
97         cprintf("Special kernel symbols:\n");
98         cprintf("  _start %016x (virt)  %016x (phys)\n", _start, (uintptr_t)(_start - KERNBASE));
99         cprintf("  etext  %016x (virt)  %016x (phys)\n", etext, (uintptr_t)(etext - KERNBASE));
100         cprintf("  edata  %016x (virt)  %016x (phys)\n", edata, (uintptr_t)(edata - KERNBASE));
101         cprintf("  end    %016x (virt)  %016x (phys)\n", end, (uintptr_t)(end - KERNBASE));
102         cprintf("Kernel executable memory footprint: %dKB\n",
103                 (uint32_t)(end-_start+1023)/1024);
104         return 0;
105 }
106
107 #if 0
108 zra: not called
109 static char RO* function_of(uint32_t address)
110 {
111         extern stab_t (RO stab)[], (RO estab)[];
112         extern char (RO stabstr)[];
113         stab_t* symtab;
114         stab_t* best_symtab = 0;
115         uint32_t best_func = 0;
116
117         // ugly and unsorted
118         for (symtab = stab; symtab < estab; symtab++) {
119                 // only consider functions, type = N_FUN
120                 if ((symtab->n_type == N_FUN) &&
121                     (symtab->n_value <= address) &&
122                         (symtab->n_value > best_func)) {
123                         best_func = symtab->n_value;
124                         best_symtab = symtab;
125                 }
126         }
127         // maybe the first stab really is the right one...  we'll see.
128         if (best_symtab == 0)
129                 return "Function not found!";
130         return stabstr + best_symtab->n_strx;
131 }
132 #endif
133
134 static int __backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
135 {
136         uintptr_t pc, fp;
137         if (argc == 1) {
138                 backtrace();
139                 return 0;
140         }
141         if (argc != 3) {
142                 printk("Need either no arguments, or two (PC and FP) in hex\n");
143                 return 1;
144         }
145         pc = strtol(argv[1], 0, 16);
146         fp = strtol(argv[2], 0, 16);
147         printk("Backtrace from instruction %p, with frame pointer %p\n", pc, fp);
148         backtrace_frame(pc, fp);
149         return 0;
150 }
151
152 int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
153 {
154         return __backtrace(argc, argv, hw_tf);
155 }
156
157 int mon_bt(int argc, char **argv, struct hw_trapframe *hw_tf)
158 {
159         return __backtrace(argc, argv, hw_tf);
160 }
161
162 int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
163 {
164         cprintf("[Scottish Accent]: She's goin' down, Cap'n!\n");
165         reboot();
166
167         // really, should never see this
168         cprintf("Sigh....\n");
169         return 0;
170 }
171
172 static int __showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
173 {
174         struct proc *p;
175         uintptr_t start;
176         size_t size;
177         pde_t *pgdir;
178         pid_t pid;
179         if (argc < 3) {
180                 printk("Shows virtual -> physical mappings for a virt addr range.\n");
181                 printk("Usage: showmapping PID START_ADDR [END_ADDR]\n");
182                 printk("    PID == 0 for the boot pgdir\n");
183                 return 1;
184         }
185         pid = strtol(argv[1], 0, 10);
186         if (!pid) {
187                 pgdir = boot_pgdir;
188         } else {
189                 p = pid2proc(pid);
190                 if (!p) {
191                         printk("No proc with pid %d\n", pid);
192                         return 1;
193                 }
194                 pgdir = p->env_pgdir;
195         }
196         start = ROUNDDOWN(strtol(argv[2], 0, 16), PGSIZE);
197         size = (argc == 3) ? 1 : strtol(argv[3], 0, 16) - start;
198         if (size/PGSIZE > 512) {
199                 cprintf("Not going to do this for more than 512 items\n");
200                 return 1;
201         }
202         show_mapping(pgdir, start, size);
203         return 0;
204 }
205
206 int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
207 {
208         return __showmapping(argc, argv, hw_tf);
209 }
210
211 int mon_sm(int argc, char **argv, struct hw_trapframe *hw_tf)
212 {
213         return __showmapping(argc, argv, hw_tf);
214 }
215
216 int mon_setmapperm(int argc, char **argv, struct hw_trapframe *hw_tf)
217 {
218 #ifndef CONFIG_X86_32
219         cprintf("I don't support this call yet!\n");
220         return 1;
221 #else
222         if (argc < 3) {
223                 cprintf("Sets VIRT_ADDR's mapping's permissions to PERMS (in hex)\n");
224                 cprintf("Only affects the lowest level PTE.  To adjust the PDE, do the math.\n");
225                 cprintf("Be careful with this around UVPT, VPT, and friends.\n");
226                 cprintf("Usage: setmapperm VIRT_ADDR PERMS\n");
227                 return 1;
228         }
229         pde_t*COUNT(PTSIZE) pgdir = (pde_t*COUNT(PTSIZE))vpd;
230         pte_t *pte, *pde;
231         page_t* page;
232         uintptr_t va;
233         va = ROUNDDOWN(strtol(argv[1], 0, 16), PGSIZE);
234         page = page_lookup(pgdir, (void*SNT)va, &pte);
235         if (!page) {
236                 cprintf("No such mapping\n");
237                 return 1;
238         }
239         pde = &pgdir[PDX(va)];
240         cprintf("   Virtual    Physical  Ps Dr Ac CD WT U W\n");
241         cprintf("------------------------------------------\n");
242         cprintf("%p  %p  %1d  %1d  %1d  %1d  %1d  %1d %1d\n", va, page2pa(page),
243                (*pte & PTE_PS) >> 7, (*pte & PTE_D) >> 6, (*pte & PTE_A) >> 5,
244                (*pte & PTE_PCD) >> 4, (*pte & PTE_PWT) >> 3, (*pte & *pde & PTE_U) >> 2,
245                (*pte & *pde & PTE_W) >> 1);
246         *pte = PTE_ADDR(*pte) | (*pte & PTE_PS) |
247                (PGOFF(strtol(argv[2], 0, 16)) & ~PTE_PS ) | PTE_P;
248         cprintf("%p  %p  %1d  %1d  %1d  %1d  %1d  %1d %1d\n", va, page2pa(page),
249                (*pte & PTE_PS) >> 7, (*pte & PTE_D) >> 6, (*pte & PTE_A) >> 5,
250                (*pte & PTE_PCD) >> 4, (*pte & PTE_PWT) >> 3, (*pte & *pde & PTE_U) >> 2,
251                (*pte & *pde & PTE_W) >> 1);
252         return 0;
253 #endif
254 }
255
256 static spinlock_t print_info_lock = SPINLOCK_INITIALIZER_IRQSAVE;
257
258 static void print_info_handler(struct hw_trapframe *hw_tf, void *data)
259 {
260         uint64_t tsc = read_tsc();
261
262         spin_lock_irqsave(&print_info_lock);
263         cprintf("----------------------------\n");
264         cprintf("This is Core %d\n", core_id());
265         cprintf("Timestamp = %lld\n", tsc);
266 #ifdef CONFIG_X86
267         cprintf("Hardware core %d\n", hw_core_id());
268         cprintf("MTRR_DEF_TYPE = 0x%08x\n", read_msr(IA32_MTRR_DEF_TYPE));
269         cprintf("MTRR Phys0 Base = 0x%016llx, Mask = 0x%016llx\n",
270                 read_msr(0x200), read_msr(0x201));
271         cprintf("MTRR Phys1 Base = 0x%016llx, Mask = 0x%016llx\n",
272                 read_msr(0x202), read_msr(0x203));
273         cprintf("MTRR Phys2 Base = 0x%016llx, Mask = 0x%016llx\n",
274                 read_msr(0x204), read_msr(0x205));
275         cprintf("MTRR Phys3 Base = 0x%016llx, Mask = 0x%016llx\n",
276                 read_msr(0x206), read_msr(0x207));
277         cprintf("MTRR Phys4 Base = 0x%016llx, Mask = 0x%016llx\n",
278                 read_msr(0x208), read_msr(0x209));
279         cprintf("MTRR Phys5 Base = 0x%016llx, Mask = 0x%016llx\n",
280                 read_msr(0x20a), read_msr(0x20b));
281         cprintf("MTRR Phys6 Base = 0x%016llx, Mask = 0x%016llx\n",
282                 read_msr(0x20c), read_msr(0x20d));
283         cprintf("MTRR Phys7 Base = 0x%016llx, Mask = 0x%016llx\n",
284                 read_msr(0x20e), read_msr(0x20f));
285 #endif // CONFIG_X86
286         cprintf("----------------------------\n");
287         spin_unlock_irqsave(&print_info_lock);
288 }
289
290 static bool print_all_info(void)
291 {
292         cprintf("\nCORE 0 asking all cores to print info:\n");
293         smp_call_function_all(print_info_handler, NULL, 0);
294         cprintf("\nDone!\n");
295         return true;
296 }
297
298 int mon_cpuinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
299 {
300         cprintf("Number of CPUs detected: %d\n", num_cpus);
301         cprintf("Calling CPU's ID: 0x%08x\n", core_id());
302
303         if (argc < 2)
304                 smp_call_function_self(print_info_handler, NULL, 0);
305         else
306                 smp_call_function_single(strtol(argv[1], 0, 10),
307                                          print_info_handler, NULL, 0);
308         return 0;
309 }
310
311 int mon_manager(int argc, char** argv, struct hw_trapframe *hw_tf)
312 {
313         manager();
314         panic("should never get here");
315         return 0;
316 }
317
318 int mon_nanwan(int argc, char **argv, struct hw_trapframe *hw_tf)
319 {
320         /* Borrowed with love from http://www.geocities.com/SoHo/7373/zoo.htm
321          * (http://www.ascii-art.com/).  Slightly modified to make it 25 lines tall.
322          */
323         printk("\n");
324         printk("             .-.  .-.\n");
325         printk("             |  \\/  |\n");
326         printk("            /,   ,_  `'-.\n");
327         printk("          .-|\\   /`\\     '. \n");
328         printk("        .'  0/   | 0\\  \\_  `\".  \n");
329         printk("     .-'  _,/    '--'.'|#''---'\n");
330         printk("      `--'  |       /   \\#\n");
331         printk("            |      /     \\#\n");
332         printk("            \\     ;|\\    .\\#\n");
333         printk("            |' ' //  \\   ::\\# \n");
334         printk("            \\   /`    \\   ':\\#\n");
335         printk("             `\"`       \\..   \\#\n");
336         printk("                        \\::.  \\#\n");
337         printk("                         \\::   \\#\n");
338         printk("                          \\'  .:\\#\n");
339         printk("                           \\  :::\\#\n");
340         printk("                            \\  '::\\#\n");
341         printk("                             \\     \\#\n");
342         printk("                              \\:.   \\#\n");
343         printk("                               \\::   \\#\n");
344         printk("                                \\'   .\\#\n");
345         printk("                             jgs \\   ::\\#\n");
346         printk("                                  \\      \n");
347         return 0;
348 }
349
350 int mon_bin_ls(int argc, char **argv, struct hw_trapframe *hw_tf)
351 {
352         struct dirent dir = {0};
353         struct file *bin_dir;
354         int retval = 0;
355
356         bin_dir = do_file_open("/bin", 0, 0);
357         if (!bin_dir) {
358                 printk("No /bin directory!\n");
359                 return 1;
360         }
361         printk("Files in /bin:\n-------------------------------\n");
362         do {
363                 retval = bin_dir->f_op->readdir(bin_dir, &dir); 
364                 printk("%s\n", dir.d_name);
365         } while (retval == 1);
366         kref_put(&bin_dir->f_kref);
367         return 0;
368 }
369
370 int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
371 {
372         if (argc < 2) {
373                 printk("Usage: bin_run FILENAME\n");
374                 return 1;
375         }
376         struct file *program;
377         int retval = 0;
378         char buf[6 + MAX_FILENAME_SZ] = "/bin/";        /* /bin/ + max + \0 */
379         strncpy(buf + 5, argv[1], MAX_FILENAME_SZ);
380         program = do_file_open(buf, 0, 0);
381         if (!program) {
382                 printk("No such program!\n");
383                 return 1;
384         }
385         char **p_argv = kmalloc(sizeof(char*) * argc, 0);       /* bin_run's argc */
386         for (int i = 0; i < argc - 1; i++)
387                 p_argv[i] = argv[i + 1];
388         p_argv[argc - 1] = 0;
389         char *p_envp[] = {"LD_LIBRARY_PATH=/lib", 0};
390         /* super ugly: we need to stash current, so that proc_create doesn't pick up
391          * on random processes running here and assuming they are the parent */
392         struct proc *old_cur = current;
393         current = 0;
394         struct proc *p = proc_create(program, p_argv, p_envp);
395         current = old_cur;
396         kfree(p_argv);
397         proc_wakeup(p);
398         proc_decref(p); /* let go of the reference created in proc_create() */
399         kref_put(&program->f_kref);
400         /* Make a scheduling decision.  You might not get the process you created,
401          * in the event there are others floating around that are runnable */
402         run_scheduler();
403         /* want to idle, so we un the process we just selected.  this is a bit
404          * hackish, but so is the monitor. */
405         smp_idle();
406         assert(0);
407         return 0;
408 }
409
410 int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
411 {
412         int8_t irq_state = 0;
413         if (argc < 2) {
414                 printk("Usage: procinfo OPTION\n");
415                 printk("\tidlecores: show idle core map\n");
416                 printk("\tall: show all active pids\n");
417                 printk("\tsched: scheduler diagnostic report\n");
418                 printk("\tresources: show resources wanted/granted for all procs\n");
419                 printk("\tpid NUM: show a lot of info for proc NUM\n");
420                 printk("\tunlock: unlock the lock for the ADDR (OMG!!!)\n");
421                 printk("\tkill NUM: destroy proc NUM\n");
422                 return 1;
423         }
424         if (!strcmp(argv[1], "idlecores")) {
425                 print_idlecoremap();
426         } else if (!strcmp(argv[1], "all")) {
427                 print_allpids();
428         } else if (!strcmp(argv[1], "sched")) {
429                 sched_diag();
430         } else if (!strcmp(argv[1], "resources")) {
431                 print_all_resources();
432         } else if (!strcmp(argv[1], "pid")) {
433                 if (argc != 3) {
434                         printk("Give me a pid number.\n");
435                         return 1;
436                 }
437                 print_proc_info(strtol(argv[2], 0, 0));
438         } else if (!strcmp(argv[1], "unlock")) {
439                 if (argc != 3) {
440                         printk("Gimme lock address!  Me want lock address!.\n");
441                         return 1;
442                 }
443                 spinlock_t *lock = (spinlock_t*)strtol(argv[2], 0, 16);
444                 if (!lock) {
445                         printk("Null address...\n");
446                         return 1;
447                 }
448                 spin_unlock(lock);
449         } else if (!strcmp(argv[1], "kill")) {
450                 if (argc != 3) {
451                         printk("Give me a pid number.\n");
452                         return 1;
453                 }
454                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
455                 if (!p) {
456                         printk("No such proc\n");
457                         return 1;
458                 }
459                 enable_irqsave(&irq_state);
460                 proc_destroy(p);
461                 disable_irqsave(&irq_state);
462                 proc_decref(p);
463         } else {
464                 printk("Bad option\n");
465                 return 1;
466         }
467         return 0;
468 }
469
470 int mon_pip(int argc, char **argv, struct hw_trapframe *hw_tf)
471 {
472         if (argc != 2) {
473                 printk("Give me a pid number.\n");
474                 return 1;
475         }
476         print_proc_info(strtol(argv[1], 0, 0));
477         return 0;
478 }
479
480 int mon_kill(int argc, char **argv, struct hw_trapframe *hw_tf)
481 {
482         struct proc *p;
483         int8_t irq_state = 0;
484         if (argc < 2) {
485                 printk("Usage: kill PID\n");
486                 return 1;
487         }
488         p = pid2proc(strtol(argv[1], 0, 0));
489         if (!p) {
490                 printk("No such proc\n");
491                 return 1;
492         }
493         enable_irqsave(&irq_state);
494         proc_destroy(p);
495         disable_irqsave(&irq_state);
496         proc_decref(p);
497         return 0;
498 }
499
500 int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
501 {
502         return -1;
503 }
504
505 int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
506 {
507         void (*func)(void *arg, ...);
508
509         if (argc < 2) {
510                 printk("Usage: kfunc FUNCTION [arg1] [arg2] [etc]\n");
511                 printk("Arguments must be in hex.  Can take 6 args.\n");
512                 return 1;
513         }
514         func = (void*)get_symbol_addr(argv[1]);
515         if (!func) {
516                 printk("Function not found.\n");
517                 return 1;
518         }
519         /* Not elegant, but whatever.  maybe there's a better syntax, or we can do
520          * it with asm magic. */
521         switch (argc) {
522                 case 2: /* have to fake one arg */
523                         func((void*)0);
524                         break;
525                 case 3: /* the real first arg */
526                         func((void*)strtol(argv[2], 0, 16));
527                         break;
528                 case 4:
529                         func((void*)strtol(argv[2], 0, 16),
530                                     strtol(argv[3], 0, 16));
531                         break;
532                 case 5:
533                         func((void*)strtol(argv[2], 0, 16),
534                                     strtol(argv[3], 0, 16),
535                                     strtol(argv[4], 0, 16));
536                         break;
537                 case 6:
538                         func((void*)strtol(argv[2], 0, 16),
539                                     strtol(argv[3], 0, 16),
540                                     strtol(argv[4], 0, 16),
541                                     strtol(argv[5], 0, 16));
542                         break;
543                 case 7:
544                         func((void*)strtol(argv[2], 0, 16),
545                                     strtol(argv[3], 0, 16),
546                                     strtol(argv[4], 0, 16),
547                                     strtol(argv[5], 0, 16),
548                                     strtol(argv[6], 0, 16));
549                         break;
550                 case 8:
551                         func((void*)strtol(argv[2], 0, 16),
552                                     strtol(argv[3], 0, 16),
553                                     strtol(argv[4], 0, 16),
554                                     strtol(argv[5], 0, 16),
555                                     strtol(argv[6], 0, 16),
556                                     strtol(argv[7], 0, 16));
557                         break;
558                 default:
559                         printk("Bad number of arguments.\n");
560                         return -1;
561         }
562         return 0;
563 }
564
565 /* Sending a vcoreid forces an event and an IPI/notification */
566 int mon_notify(int argc, char **argv, struct hw_trapframe *hw_tf)
567 {
568         struct proc *p;
569         uint32_t vcoreid;
570         struct event_msg msg = {0};
571
572         if (argc < 3) {
573                 printk("Usage: notify PID NUM [VCOREID]\n");
574                 return 1;
575         }
576         p = pid2proc(strtol(argv[1], 0, 0));
577         if (!p) {
578                 printk("No such proc\n");
579                 return 1;
580         }
581         msg.ev_type = strtol(argv[2], 0, 0);
582         if (argc == 4) {
583                 vcoreid = strtol(argv[3], 0, 0);
584                 /* This will go to the private mbox */
585                 post_vcore_event(p, &msg, vcoreid, EVENT_VCORE_PRIVATE);
586                 proc_notify(p, vcoreid);
587         } else {
588                 /* o/w, try and do what they want */
589                 send_kernel_event(p, &msg, 0);
590         }
591         proc_decref(p);
592         return 0;
593 }
594
595 /* Micro-benchmarky Measurements.  This is really fragile code that probably
596  * won't work perfectly, esp as the kernel evolves. */
597 int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
598 {
599         uint64_t begin = 0, diff = 0;
600         uint32_t end_refcnt = 0;
601         int8_t irq_state = 0;
602
603         if (argc < 2) {
604                 printk("Usage: measure OPTION\n");
605                 printk("\tkill PID : kill proc PID\n");
606                 printk("\tpreempt PID : preempt proc PID (no delay)\n");
607                 printk("\tpreempt PID [pcore] : preempt PID's pcore (no delay)\n");
608                 printk("\tpreempt-warn PID : warn-preempt proc PID (pending)\n");
609                 printk("\tpreempt-warn PID [pcore] : warn-preempt proc PID's pcore\n");
610                 printk("\tpreempt-raw PID : raw-preempt proc PID\n");
611                 printk("\tpreempt-raw PID [pcore] : raw-preempt proc PID's pcore\n");
612                 return 1;
613         }
614         if (!strcmp(argv[1], "kill")) {
615                 if (argc < 3) {
616                         printk("Give me a pid number.\n");
617                         return 1;
618                 }
619                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
620                 if (!p) {
621                         printk("No such proc\n");
622                         return 1;
623                 }
624                 begin = start_timing();
625 #ifdef CONFIG_APPSERVER
626                 printk("Warning: this will be inaccurate due to the appserver.\n");
627                 end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores - 1;
628 #endif /* CONFIG_APPSERVER */
629                 enable_irqsave(&irq_state);
630                 proc_destroy(p);
631                 disable_irqsave(&irq_state);
632                 proc_decref(p);
633 #ifdef CONFIG_APPSERVER
634                 /* Won't be that accurate, since it's not actually going through the
635                  * __proc_free() path. */
636                 spin_on(kref_refcnt(&p->p_kref) != end_refcnt); 
637 #else
638                 /* this is a little ghetto. it's not fully free yet, but we are also
639                  * slowing it down by messing with it, esp with the busy waiting on a
640                  * hyperthreaded core. */
641                 spin_on(p->env_cr3);
642 #endif /* CONFIG_APPSERVER */
643                 /* No noticeable difference using stop_timing instead of read_tsc() */
644                 diff = stop_timing(begin);
645         } else if (!strcmp(argv[1], "preempt")) {
646                 if (argc < 3) {
647                         printk("Give me a pid number.\n");
648                         return 1;
649                 }
650                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
651                 if (!p) {
652                         printk("No such proc\n");
653                         return 1;
654                 }
655                 if (argc == 4) { /* single core being preempted, warned but no delay */
656                         uint32_t pcoreid = strtol(argv[3], 0, 0);
657                         begin = start_timing();
658                         if (proc_preempt_core(p, pcoreid, 1000000)) {
659                                 __sched_put_idle_core(p, pcoreid);
660                                 /* done when unmapped (right before abandoning) */
661                                 spin_on(p->procinfo->pcoremap[pcoreid].valid);
662                         } else {
663                                 printk("Core %d was not mapped to proc\n", pcoreid);
664                         }
665                         diff = stop_timing(begin);
666                 } else { /* preempt all cores, warned but no delay */
667                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
668                         begin = start_timing();
669                         proc_preempt_all(p, 1000000);
670                         /* a little ghetto, implies no one is using p */
671                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
672                         diff = stop_timing(begin);
673                 }
674                 proc_decref(p);
675         } else if (!strcmp(argv[1], "preempt-warn")) {
676                 if (argc < 3) {
677                         printk("Give me a pid number.\n");
678                         return 1;
679                 }
680                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
681                 if (!p) {
682                         printk("No such proc\n");
683                         return 1;
684                 }
685                 printk("Careful: if this hangs, then the process isn't responding.\n");
686                 if (argc == 4) { /* single core being preempted-warned */
687                         uint32_t pcoreid = strtol(argv[3], 0, 0);
688                         spin_lock(&p->proc_lock);
689                         uint32_t vcoreid = p->procinfo->pcoremap[pcoreid].vcoreid;
690                         if (!p->procinfo->pcoremap[pcoreid].valid) {
691                                 printk("Pick a mapped pcore\n");
692                                 spin_unlock(&p->proc_lock);
693                                 return 1;
694                         }
695                         begin = start_timing();
696                         __proc_preempt_warn(p, vcoreid, 1000000); // 1 sec
697                         spin_unlock(&p->proc_lock);
698                         /* done when unmapped (right before abandoning) */
699                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
700                         diff = stop_timing(begin);
701                 } else { /* preempt-warn all cores */
702                         printk("Warning, this won't work if they can't yield their "
703                                "last vcore, will stop at 1!\n");
704                         spin_lock(&p->proc_lock);
705                         begin = start_timing();
706                         __proc_preempt_warnall(p, 1000000);
707                         spin_unlock(&p->proc_lock);
708                         /* target cores do the unmapping / changing of the num_vcores */
709                         spin_on(p->procinfo->num_vcores > 1);
710                         diff = stop_timing(begin);
711                 }
712                 proc_decref(p);
713         } else if (!strcmp(argv[1], "preempt-raw")) {
714                 if (argc < 3) {
715                         printk("Give me a pid number.\n");
716                         return 1;
717                 }
718                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
719                 if (!p) {
720                         printk("No such proc\n");
721                         return 1;
722                 }
723                 if (argc == 4) { /* single core preempted, no warning or waiting */
724                         uint32_t pcoreid = strtol(argv[3], 0, 0);
725                         spin_lock(&p->proc_lock);
726                         if (!p->procinfo->pcoremap[pcoreid].valid) {
727                                 printk("Pick a mapped pcore\n");
728                                 spin_unlock(&p->proc_lock);
729                                 return 1;
730                         }
731                         begin = start_timing();
732                         __proc_preempt_core(p, pcoreid);
733                         if (!p->procinfo->num_vcores)
734                                 __proc_set_state(p, PROC_RUNNABLE_M);
735                         spin_unlock(&p->proc_lock);
736                         /* ghetto, since the ksched should be calling all of this */
737                         __sched_put_idle_core(p, pcoreid);
738                         /* done when unmapped (right before abandoning) */
739                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
740                         diff = stop_timing(begin);
741                 } else { /* preempt all cores, no warning or waiting */
742                         spin_lock(&p->proc_lock);
743                         uint32_t pc_arr[p->procinfo->num_vcores];
744                         uint32_t num_revoked;
745                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
746                         begin = start_timing();
747                         num_revoked = __proc_preempt_all(p, pc_arr);
748                         __proc_set_state(p, PROC_RUNNABLE_M);
749                         spin_unlock(&p->proc_lock);
750                         if (num_revoked)
751                                 __sched_put_idle_cores(p, pc_arr, num_revoked);
752                         /* a little ghetto, implies no one else is using p */
753                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
754                         diff = stop_timing(begin);
755                 }
756                 proc_decref(p);
757         } else {
758                 printk("Bad option\n");
759                 return 1;
760         }
761         printk("[Tired Giraffe Accent] Took %llu usec (%llu nsec) to finish.\n",
762                tsc2usec(diff), tsc2nsec(diff));
763         return 0;
764 }
765
766 /* Used in various debug locations.  Not a kernel API or anything. */
767 bool mon_verbose_trace = FALSE;
768
769 int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
770 {
771         int core;
772         if (argc < 2) {
773                 printk("Usage: trace OPTION\n");
774                 printk("\tsyscall start [silent] [pid]: starts tracing\n");
775                 printk("\tsyscall stop: stops tracing, prints if it was silent\n");
776                 printk("\tcoretf COREID: prints PC, -1 for all cores, verbose => TF\n");
777                 printk("\tpcpui [type [coreid]]: runs pcpui trace ring handlers\n");
778                 printk("\tpcpui-reset [noclear]: resets/clears pcpui trace ring\n");
779                 printk("\tverbose: toggles verbosity, depends on trace command\n");
780                 return 1;
781         }
782         if (!strcmp(argv[1], "syscall")) {
783                 if (argc < 3) {
784                         printk("Need a start or stop.\n");
785                         return 1;
786                 }
787                 if (!strcmp(argv[2], "start")) {
788                         bool all = TRUE;
789                         bool silent = FALSE;
790                         struct proc *p = NULL;
791                         if (argc >= 4) {
792                                 silent = (bool)strtol(argv[3], 0, 0);
793                         }
794                         if (argc >= 5) {
795                                 all = FALSE;
796                                 p = pid2proc(strtol(argv[4], 0, 0));
797                                 if (!p) {
798                                         printk("No such process\n");
799                                         return 1;
800                                 }
801                         }
802                         systrace_start(silent);
803                         if (systrace_reg(all, p))
804                                 printk("No room to trace more processes\n");
805                 } else if (!strcmp(argv[2], "stop")) {
806                         /* Stop and print for all processes */
807                         systrace_stop();
808                         systrace_print(TRUE, 0);
809                         systrace_clear_buffer();
810                 }
811         } else if (!strcmp(argv[1], "coretf")) {
812                 if (argc != 3) {
813                         printk("Need a coreid, fool.\n");
814                         return 1;
815                 }
816                 core = strtol(argv[2], 0, 0);
817                 if (core < 0) {
818                         printk("Sending NMIs to all cores:\n");
819                         for (int i = 0; i < num_cpus; i++)
820                                 send_nmi(i);
821                 } else {
822                         printk("Sending NMI core %d:\n", core);
823                         if (core >= num_cpus) {
824                                 printk("No such core!  Maybe it's in another cell...\n");
825                                 return 1;
826                         }
827                         send_nmi(core);
828                 }
829                 udelay(1000000);
830         } else if (!strcmp(argv[1], "pcpui")) {
831                 int pcpui_type, pcpui_coreid;
832                 if (argc >= 3)
833                         pcpui_type = strtol(argv[2], 0, 0);
834                 else
835                         pcpui_type = 0;
836                 printk("\nRunning PCPUI Trace Ring handlers for type %d\n", pcpui_type);
837                 if (argc >= 4) {
838                         pcpui_coreid = strtol(argv[3], 0, 0); 
839                         pcpui_tr_foreach(pcpui_coreid, pcpui_type);
840                 } else {
841                         pcpui_tr_foreach_all(pcpui_type);
842                 }
843         } else if (!strcmp(argv[1], "pcpui-reset")) {
844                 if (argc >= 3) {
845                         printk("\nResetting all PCPUI Trace Rings\n");
846                         pcpui_tr_reset_all();
847                 } else {
848                         printk("\nResetting and clearing all PCPUI Trace Rings\n");
849                         pcpui_tr_reset_and_clear_all();
850                 }
851         } else if (!strcmp(argv[1], "verbose")) {
852                 if (mon_verbose_trace) {
853                         printk("Turning trace verbosity off\n");
854                         mon_verbose_trace = FALSE;
855                 } else {
856                         printk("Turning trace verbosity on\n");
857                         mon_verbose_trace = TRUE;
858                 }
859         } else if (!strcmp(argv[1], "opt2")) {
860                 if (argc != 3) {
861                         printk("ERRRRRRRRRR.\n");
862                         return 1;
863                 }
864                 print_proc_info(strtol(argv[2], 0, 0));
865         } else {
866                 printk("Bad option\n");
867                 return 1;
868         }
869         return 0;
870 }
871
872 int mon_monitor(int argc, char **argv, struct hw_trapframe *hw_tf)
873 {
874         if (argc < 2) {
875                 printk("Usage: monitor COREID\n");
876                 return 1;
877         }
878         uint32_t core = strtol(argv[1], 0, 0);
879         if (core >= num_cpus) {
880                 printk("No such core!  Maybe it's in another cell...\n");
881                 return 1;
882         }
883         send_kernel_message(core, __run_mon, 0, 0, 0, KMSG_ROUTINE);
884         return 0;
885 }
886
887 /***** Kernel monitor command interpreter *****/
888
889 #define WHITESPACE "\t\r\n "
890 #define MAXARGS 16
891
892 static int runcmd(char *NTS real_buf, struct hw_trapframe *hw_tf) {
893         char * buf = NTEXPAND(real_buf);
894         int argc;
895         char *NTS argv[MAXARGS];
896         int i;
897
898         // Parse the command buffer into whitespace-separated arguments
899         argc = 0;
900         argv[argc] = 0;
901         while (1) {
902                 // gobble whitespace
903                 while (*buf && strchr(WHITESPACE, *buf))
904                         *buf++ = 0;
905                 if (*buf == 0)
906                         break;
907
908                 // save and scan past next arg
909                 if (argc == MAXARGS-1) {
910                         cprintf("Too many arguments (max %d)\n", MAXARGS);
911                         return 0;
912                 }
913                 //This will get fucked at runtime..... in the ASS
914                 argv[argc++] = buf;
915                 while (*buf && !strchr(WHITESPACE, *buf))
916                         buf++;
917         }
918         argv[argc] = 0;
919
920         // Lookup and invoke the command
921         if (argc == 0)
922                 return 0;
923         for (i = 0; i < NCOMMANDS; i++) {
924                 if (strcmp(argv[0], commands[i].name) == 0)
925                         return commands[i].func(argc, argv, hw_tf);
926         }
927         cprintf("Unknown command '%s'\n", argv[0]);
928         return 0;
929 }
930
931 void monitor(struct hw_trapframe *hw_tf)
932 {
933         #define MON_CMD_LENGTH 256
934         char buf[MON_CMD_LENGTH];
935         int cnt;
936         int coreid = core_id_early();
937
938         /* they are always disabled, since we have this irqsave lock */
939         if (irq_is_enabled())
940                 printk("Entering Nanwan's Dungeon on Core %d (Ints on):\n", coreid);
941         else
942                 printk("Entering Nanwan's Dungeon on Core %d (Ints off):\n", coreid);
943         printk("Type 'help' for a list of commands.\n");
944
945         if (hw_tf != NULL)
946                 print_trapframe(hw_tf);
947
948         while (1) {
949                 /* on occasion, the kernel monitor can migrate (like if you run
950                  * something that blocks / syncs and wakes up on another core) */
951                 cmb();
952                 cnt = readline(buf, MON_CMD_LENGTH, "ROS(Core %d)> ", core_id_early());
953                 if (cnt > 0) {
954                         buf[cnt] = 0;
955                         if (runcmd(buf, hw_tf) < 0)
956                                 break;
957                 }
958         }
959 }
960
961 static void pm_flusher(void *unused)
962 {
963         struct super_block *sb;
964         struct inode *inode;
965         unsigned long nr_pages;
966
967         /* could also put the delay between calls, or even within remove, during the
968          * WB phase. */
969         while (1) {
970                 udelay_sched(5000);
971                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
972                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
973                                 nr_pages = ROUNDUP(inode->i_size, PGSIZE) >> PGSHIFT;
974                                 if (nr_pages)
975                                         pm_remove_contig(inode->i_mapping, 0, nr_pages);
976                         }
977                 }
978         }
979 }
980
981 int mon_fs(int argc, char **argv, struct hw_trapframe *hw_tf)
982 {
983         /* this assumes one mounted FS at the NS root */
984         struct super_block *sb;
985         struct file *file;
986         struct inode *inode;
987         struct dentry *dentry;
988         if (argc < 2) {
989                 printk("Usage: fs OPTION\n");
990                 printk("\topen: show all open files\n");
991                 printk("\tinodes: show all inodes\n");
992                 printk("\tdentries [lru|prune]: show all dentries, opt LRU/prune\n");
993                 printk("\tls DIR: print the dir tree starting with DIR\n");
994                 printk("\tpid: proc PID's fs crap placeholder\n");
995                 printk("\tpmflusher: start a ktask to keep flushing all PMs\n");
996                 return 1;
997         }
998         if (!strcmp(argv[1], "open")) {
999                 printk("Open Files:\n----------------------------\n");
1000                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
1001                         printk("Superblock for %s\n", sb->s_name);
1002                         TAILQ_FOREACH(file, &sb->s_files, f_list)
1003                                 printk("File: %p, %s, Refs: %d, Drefs: %d, Irefs: %d PM: %p\n",
1004                                        file, file_name(file), kref_refcnt(&file->f_kref),
1005                                        kref_refcnt(&file->f_dentry->d_kref),
1006                                        kref_refcnt(&file->f_dentry->d_inode->i_kref),
1007                                            file->f_mapping);
1008                 }
1009         } else if (!strcmp(argv[1], "inodes")) {
1010                 printk("Mounted FS Inodes:\n----------------------------\n");
1011                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
1012                         printk("Superblock for %s\n", sb->s_name);
1013                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
1014                                 printk("Inode: %p, Refs: %d, Nlinks: %d, Size(B): %d\n",
1015                                        inode, kref_refcnt(&inode->i_kref), inode->i_nlink,
1016                                        inode->i_size);
1017                                 TAILQ_FOREACH(dentry, &inode->i_dentry, d_alias)
1018                                         printk("\t%s: Dentry: %p, Refs: %d\n",
1019                                                dentry->d_name.name, dentry,
1020                                                kref_refcnt(&dentry->d_kref));
1021                         }
1022                 }
1023         } else if (!strcmp(argv[1], "dentries")) {
1024                 printk("Dentry Cache:\n----------------------------\n");
1025                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
1026                         printk("Superblock for %s\n", sb->s_name);
1027                         printk("DENTRY     FLAGS      REFCNT NAME\n");
1028                         printk("--------------------------------\n");
1029                         /* Hash helper */
1030                         void print_dcache_entry(void *item)
1031                         {
1032                                 struct dentry *d_i = (struct dentry*)item;
1033                                 printk("%p %p %02d     %s\n", d_i, d_i->d_flags,
1034                                        kref_refcnt(&d_i->d_kref), d_i->d_name.name);
1035                         }
1036                         hash_for_each(sb->s_dcache, print_dcache_entry);
1037                 }
1038                 if (argc < 3)
1039                         return 0;
1040                 if (!strcmp(argv[2], "lru")) {
1041                         printk("LRU lists:\n");
1042                         TAILQ_FOREACH(sb, &super_blocks, s_list) {
1043                                 printk("Superblock for %s\n", sb->s_name);
1044                                 TAILQ_FOREACH(dentry, &sb->s_lru_d, d_lru)
1045                                         printk("Dentry: %p, Name: %s\n", dentry,
1046                                                dentry->d_name.name);
1047                         }
1048                 } else if (!strcmp(argv[2], "prune")) {
1049                         printk("Pruning unused dentries\n");
1050                         TAILQ_FOREACH(sb, &super_blocks, s_list)
1051                                 dcache_prune(sb, FALSE);
1052                 }
1053         } else if (!strcmp(argv[1], "ls")) {
1054                 if (argc != 3) {
1055                         printk("Give me a dir.\n");
1056                         return 1;
1057                 }
1058                 if (argv[2][0] != '/') {
1059                         printk("Dear fellow giraffe lover, Use absolute paths.\n");
1060                         return 1;
1061                 }
1062                 ls_dash_r(argv[2]);
1063                 /* whatever.  placeholder. */
1064         } else if (!strcmp(argv[1], "pid")) {
1065                 if (argc != 3) {
1066                         printk("Give me a pid number.\n");
1067                         return 1;
1068                 }
1069                 /* whatever.  placeholder. */
1070         } else if (!strcmp(argv[1], "pmflusher")) {
1071                 ktask("pm_flusher", pm_flusher, 0);
1072         } else {
1073                 printk("Bad option\n");
1074                 return 1;
1075         }
1076         return 0;
1077 }
1078
1079 int mon_bb(int argc, char **argv, struct hw_trapframe *hw_tf)
1080 {
1081         char *l_argv[3] = {"", "busybox", "ash"};
1082         return mon_bin_run(3, l_argv, hw_tf);
1083 }
1084
1085 int mon_alarm(int argc, char **argv, struct hw_trapframe *hw_tf)
1086 {
1087         if (argc < 2) {
1088                 printk("Usage: alarm OPTION\n");
1089                 printk("\tpcpu: print full alarm tchains from every core\n");
1090                 return 1;
1091         }
1092         if (!strcmp(argv[1], "pcpu")) {
1093                 print_pcpu_chains();
1094         } else {
1095                 printk("Bad option\n");
1096                 return 1;
1097         }
1098         return 0;
1099 }
1100
1101 static void show_msr(struct hw_trapframe *unused, void *v)
1102 {
1103         int core = core_id();
1104         uint64_t val;
1105         uint32_t msr = *(uint32_t *)v;
1106         val = read_msr(msr);
1107         printk("%d: %08x: %016llx\n", core, msr, val);
1108 }
1109
1110 struct set {
1111         uint32_t msr;
1112         uint64_t val;
1113 };
1114
1115 static void set_msr(struct hw_trapframe *unused, void *v)
1116 {
1117         int core = core_id();
1118         struct set *s = v;
1119         uint32_t msr = s->msr;
1120         uint64_t val = s->val;
1121         write_msr(msr, val);
1122         val = read_msr(msr);
1123         printk("%d: %08x: %016llx\n", core, msr, val);
1124 }
1125
1126 int mon_msr(int argc, char **argv, struct hw_trapframe *hw_tf)
1127 {
1128 #ifndef CONFIG_X86
1129         cprintf("Not on this architecture\n");
1130         return 1;
1131 #else
1132         uint64_t val;
1133         uint32_t msr;
1134         if (argc < 2 || argc > 3) {
1135                 printk("Usage: msr register [value]\n");
1136                 return 1;
1137         }
1138         msr = strtoul(argv[1], 0, 16);
1139         handler_wrapper_t *w;
1140         smp_call_function_all(show_msr, &msr, &w);
1141         smp_call_wait(w);
1142
1143         if (argc < 3)
1144                 return 0;
1145         /* somewhat bogus on 32 bit. */
1146         val = strtoul(argv[2], 0, 16);
1147
1148         struct set set;
1149         set.msr = msr;
1150         set.val = val;
1151         smp_call_function_all(set_msr, &set, &w);
1152         smp_call_wait(w);
1153         return 0;
1154 #endif
1155 }
1156
1157 int mon_db(int argc, char **argv, struct hw_trapframe *hw_tf)
1158 {
1159         if (argc < 2) {
1160                 printk("Usage: db OPTION\n");
1161                 printk("\tsem: print all semaphore info\n");
1162                 return 1;
1163         }
1164         if (!strcmp(argv[1], "sem")) {
1165                 print_all_sem_info();
1166         } else {
1167                 printk("Bad option\n");
1168                 return 1;
1169         }
1170         return 0;
1171 }