Monitor command showmappings updates
[akaros.git] / kern / src / monitor.c
1 // Simple command-line kernel monitor useful for
2 // controlling the kernel and exploring the system interactively.
3
4 #ifdef __SHARC__
5 #pragma nosharc
6 #endif
7
8 #include <arch/arch.h>
9 #include <stab.h>
10 #include <smp.h>
11 #include <console.h>
12 #include <arch/console.h>
13
14 #include <stdio.h>
15 #include <string.h>
16 #include <assert.h>
17 #include <monitor.h>
18 #include <trap.h>
19 #include <pmap.h>
20 #include <kdebug.h>
21 #include <testing.h>
22 #include <manager.h>
23 #include <schedule.h>
24 #include <kdebug.h>
25 #include <syscall.h>
26 #include <kmalloc.h>
27 #include <elf.h>
28 #include <event.h>
29 #include <trap.h>
30 #include <time.h>
31
32 #include <ros/memlayout.h>
33 #include <ros/event.h>
34
35 #define CMDBUF_SIZE     80      // enough for one VGA text line
36
37 typedef struct command {
38         const char *NTS name;
39         const char *NTS desc;
40         // return -1 to force monitor to exit
41         int (*func)(int argc, char **argv, struct hw_trapframe *hw_tf);
42 } command_t;
43
44 static command_t (RO commands)[] = {
45         { "help", "Display this list of commands", mon_help },
46         { "kerninfo", "Display information about the kernel", mon_kerninfo },
47         { "backtrace", "Dump a backtrace", mon_backtrace },
48         { "bt", "Dump a backtrace", mon_bt },
49         { "reboot", "Take a ride to the South Bay", mon_reboot },
50         { "showmapping", "Shows VA->PA mappings", mon_showmapping},
51         { "sm", "Shows VA->PA mappings", mon_sm},
52         { "setmapperm", "Sets permissions on a VA->PA mapping", mon_setmapperm},
53         { "cpuinfo", "Prints CPU diagnostics", mon_cpuinfo},
54         { "ps", "Prints process list", mon_ps},
55         { "nanwan", "Meet Nanwan!!", mon_nanwan},
56         { "bin_ls", "List files in /bin", mon_bin_ls},
57         { "bin_run", "Create and run a program from /bin", mon_bin_run},
58         { "manager", "Run the manager", mon_manager},
59         { "procinfo", "Show information about processes", mon_procinfo},
60         { "kill", "Kills a process", mon_kill},
61         { "exit", "Leave the monitor", mon_exit},
62         { "kfunc", "Run a kernel function directly (!!!)", mon_kfunc},
63         { "notify", "Notify a process.  Vcoreid will skip their prefs", mon_notify},
64         { "measure", "Run a specific measurement", mon_measure},
65         { "trace", "Run some tracing functions", mon_trace},
66         { "monitor", "Run the monitor on another core", mon_monitor},
67         { "fs", "Filesystem Diagnostics", mon_fs},
68         { "bb", "Try to run busybox (ash)", mon_bb},
69         { "alarm", "Alarm Diagnostics", mon_alarm},
70         { "msr", "read/write msr: msr msr [value]", mon_msr},
71         { "db", "Misc debugging", mon_db},
72 };
73 #define NCOMMANDS (sizeof(commands)/sizeof(commands[0]))
74
75 /***** Implementations of basic kernel monitor commands *****/
76
77 int mon_help(int argc, char **argv, struct hw_trapframe *hw_tf)
78 {
79         int i;
80
81         for (i = 0; i < NCOMMANDS; i++)
82                 cprintf("%s - %s\n", commands[i].name, commands[i].desc);
83         return 0;
84 }
85
86 int mon_ps(int argc, char** argv, struct hw_trapframe *hw_tf)
87 {
88         print_allpids();
89         return 0;
90 }
91
92 int mon_kerninfo(int argc, char **argv, struct hw_trapframe *hw_tf)
93 {
94         extern char (RO SNT _start)[], (RO SNT etext)[], (RO SNT edata)[], (RO SNT end)[];
95
96         cprintf("Special kernel symbols:\n");
97         cprintf("  _start %016x (virt)  %016x (phys)\n", _start, (uintptr_t)(_start - KERNBASE));
98         cprintf("  etext  %016x (virt)  %016x (phys)\n", etext, (uintptr_t)(etext - KERNBASE));
99         cprintf("  edata  %016x (virt)  %016x (phys)\n", edata, (uintptr_t)(edata - KERNBASE));
100         cprintf("  end    %016x (virt)  %016x (phys)\n", end, (uintptr_t)(end - KERNBASE));
101         cprintf("Kernel executable memory footprint: %dKB\n",
102                 (uint32_t)(end-_start+1023)/1024);
103         return 0;
104 }
105
106 #if 0
107 zra: not called
108 static char RO* function_of(uint32_t address)
109 {
110         extern stab_t (RO stab)[], (RO estab)[];
111         extern char (RO stabstr)[];
112         stab_t* symtab;
113         stab_t* best_symtab = 0;
114         uint32_t best_func = 0;
115
116         // ugly and unsorted
117         for (symtab = stab; symtab < estab; symtab++) {
118                 // only consider functions, type = N_FUN
119                 if ((symtab->n_type == N_FUN) &&
120                     (symtab->n_value <= address) &&
121                         (symtab->n_value > best_func)) {
122                         best_func = symtab->n_value;
123                         best_symtab = symtab;
124                 }
125         }
126         // maybe the first stab really is the right one...  we'll see.
127         if (best_symtab == 0)
128                 return "Function not found!";
129         return stabstr + best_symtab->n_strx;
130 }
131 #endif
132
133 static int __backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
134 {
135         uintptr_t pc, fp;
136         if (argc == 1) {
137                 backtrace();
138                 return 0;
139         }
140         if (argc != 3) {
141                 printk("Need either no arguments, or two (PC and FP) in hex\n");
142                 return 1;
143         }
144         pc = strtol(argv[1], 0, 16);
145         fp = strtol(argv[2], 0, 16);
146         printk("Backtrace from instruction %p, with frame pointer %p\n", pc, fp);
147         backtrace_frame(pc, fp);
148         return 0;
149 }
150
151 int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
152 {
153         return __backtrace(argc, argv, hw_tf);
154 }
155
156 int mon_bt(int argc, char **argv, struct hw_trapframe *hw_tf)
157 {
158         return __backtrace(argc, argv, hw_tf);
159 }
160
161 int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
162 {
163         cprintf("[Scottish Accent]: She's goin' down, Cap'n!\n");
164         reboot();
165
166         // really, should never see this
167         cprintf("Sigh....\n");
168         return 0;
169 }
170
171 static int __showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
172 {
173         struct proc *p;
174         uintptr_t start;
175         size_t size;
176         pde_t *pgdir;
177         pid_t pid;
178         if (argc < 3) {
179                 printk("Shows virtual -> physical mappings for a virt addr range.\n");
180                 printk("Usage: showmapping PID START_ADDR [END_ADDR]\n");
181                 printk("    PID == 0 for the boot pgdir\n");
182                 return 1;
183         }
184         pid = strtol(argv[1], 0, 10);
185         if (!pid) {
186                 pgdir = boot_pgdir;
187         } else {
188                 p = pid2proc(pid);
189                 if (!p) {
190                         printk("No proc with pid %d\n", pid);
191                         return 1;
192                 }
193                 pgdir = p->env_pgdir;
194         }
195         start = ROUNDDOWN(strtol(argv[2], 0, 16), PGSIZE);
196         size = (argc == 3) ? 1 : strtol(argv[3], 0, 16) - start;
197         if (size/PGSIZE > 512) {
198                 cprintf("Not going to do this for more than 512 items\n");
199                 return 1;
200         }
201         show_mapping(pgdir, start, size);
202         return 0;
203 }
204
205 int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
206 {
207         return __showmapping(argc, argv, hw_tf);
208 }
209
210 int mon_sm(int argc, char **argv, struct hw_trapframe *hw_tf)
211 {
212         return __showmapping(argc, argv, hw_tf);
213 }
214
215 int mon_setmapperm(int argc, char **argv, struct hw_trapframe *hw_tf)
216 {
217 #ifndef CONFIG_X86_32
218         cprintf("I don't support this call yet!\n");
219         return 1;
220 #else
221         if (argc < 3) {
222                 cprintf("Sets VIRT_ADDR's mapping's permissions to PERMS (in hex)\n");
223                 cprintf("Only affects the lowest level PTE.  To adjust the PDE, do the math.\n");
224                 cprintf("Be careful with this around UVPT, VPT, and friends.\n");
225                 cprintf("Usage: setmapperm VIRT_ADDR PERMS\n");
226                 return 1;
227         }
228         pde_t*COUNT(PTSIZE) pgdir = (pde_t*COUNT(PTSIZE))vpd;
229         pte_t *pte, *pde;
230         page_t* page;
231         uintptr_t va;
232         va = ROUNDDOWN(strtol(argv[1], 0, 16), PGSIZE);
233         page = page_lookup(pgdir, (void*SNT)va, &pte);
234         if (!page) {
235                 cprintf("No such mapping\n");
236                 return 1;
237         }
238         pde = &pgdir[PDX(va)];
239         cprintf("   Virtual    Physical  Ps Dr Ac CD WT U W\n");
240         cprintf("------------------------------------------\n");
241         cprintf("%p  %p  %1d  %1d  %1d  %1d  %1d  %1d %1d\n", va, page2pa(page),
242                (*pte & PTE_PS) >> 7, (*pte & PTE_D) >> 6, (*pte & PTE_A) >> 5,
243                (*pte & PTE_PCD) >> 4, (*pte & PTE_PWT) >> 3, (*pte & *pde & PTE_U) >> 2,
244                (*pte & *pde & PTE_W) >> 1);
245         *pte = PTE_ADDR(*pte) | (*pte & PTE_PS) |
246                (PGOFF(strtol(argv[2], 0, 16)) & ~PTE_PS ) | PTE_P;
247         cprintf("%p  %p  %1d  %1d  %1d  %1d  %1d  %1d %1d\n", va, page2pa(page),
248                (*pte & PTE_PS) >> 7, (*pte & PTE_D) >> 6, (*pte & PTE_A) >> 5,
249                (*pte & PTE_PCD) >> 4, (*pte & PTE_PWT) >> 3, (*pte & *pde & PTE_U) >> 2,
250                (*pte & *pde & PTE_W) >> 1);
251         return 0;
252 #endif
253 }
254
255 int mon_cpuinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
256 {
257         cprintf("Number of CPUs detected: %d\n", num_cpus);
258         cprintf("Calling CPU's ID: 0x%08x\n", core_id());
259
260         if (argc < 2)
261                 smp_call_function_self(test_print_info_handler, NULL, 0);
262         else
263                 smp_call_function_single(strtol(argv[1], 0, 10),
264                                          test_print_info_handler, NULL, 0);
265         return 0;
266 }
267
268 int mon_manager(int argc, char** argv, struct hw_trapframe *hw_tf)
269 {
270         manager();
271         panic("should never get here");
272         return 0;
273 }
274
275 int mon_nanwan(int argc, char **argv, struct hw_trapframe *hw_tf)
276 {
277         /* Borrowed with love from http://www.geocities.com/SoHo/7373/zoo.htm
278          * (http://www.ascii-art.com/).  Slightly modified to make it 25 lines tall.
279          */
280         printk("\n");
281         printk("             .-.  .-.\n");
282         printk("             |  \\/  |\n");
283         printk("            /,   ,_  `'-.\n");
284         printk("          .-|\\   /`\\     '. \n");
285         printk("        .'  0/   | 0\\  \\_  `\".  \n");
286         printk("     .-'  _,/    '--'.'|#''---'\n");
287         printk("      `--'  |       /   \\#\n");
288         printk("            |      /     \\#\n");
289         printk("            \\     ;|\\    .\\#\n");
290         printk("            |' ' //  \\   ::\\# \n");
291         printk("            \\   /`    \\   ':\\#\n");
292         printk("             `\"`       \\..   \\#\n");
293         printk("                        \\::.  \\#\n");
294         printk("                         \\::   \\#\n");
295         printk("                          \\'  .:\\#\n");
296         printk("                           \\  :::\\#\n");
297         printk("                            \\  '::\\#\n");
298         printk("                             \\     \\#\n");
299         printk("                              \\:.   \\#\n");
300         printk("                               \\::   \\#\n");
301         printk("                                \\'   .\\#\n");
302         printk("                             jgs \\   ::\\#\n");
303         printk("                                  \\      \n");
304         return 0;
305 }
306
307 int mon_bin_ls(int argc, char **argv, struct hw_trapframe *hw_tf)
308 {
309         struct dirent dir = {0};
310         struct file *bin_dir;
311         int retval = 0;
312
313         bin_dir = do_file_open("/bin", 0, 0);
314         if (!bin_dir) {
315                 printk("No /bin directory!\n");
316                 return 1;
317         }
318         printk("Files in /bin:\n-------------------------------\n");
319         do {
320                 retval = bin_dir->f_op->readdir(bin_dir, &dir); 
321                 printk("%s\n", dir.d_name);
322         } while (retval == 1);
323         kref_put(&bin_dir->f_kref);
324         return 0;
325 }
326
327 int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
328 {
329         if (argc < 2) {
330                 printk("Usage: bin_run FILENAME\n");
331                 return 1;
332         }
333         struct file *program;
334         int retval = 0;
335         char buf[6 + MAX_FILENAME_SZ] = "/bin/";        /* /bin/ + max + \0 */
336         strncpy(buf + 5, argv[1], MAX_FILENAME_SZ);
337         program = do_file_open(buf, 0, 0);
338         if (!program) {
339                 printk("No such program!\n");
340                 return 1;
341         }
342         char **p_argv = kmalloc(sizeof(char*) * argc, 0);       /* bin_run's argc */
343         for (int i = 0; i < argc - 1; i++)
344                 p_argv[i] = argv[i + 1];
345         p_argv[argc - 1] = 0;
346         char *p_envp[] = {"LD_LIBRARY_PATH=/lib", 0};
347         /* super ugly: we need to stash current, so that proc_create doesn't pick up
348          * on random processes running here and assuming they are the parent */
349         struct proc *old_cur = current;
350         current = 0;
351         struct proc *p = proc_create(program, p_argv, p_envp);
352         current = old_cur;
353         kfree(p_argv);
354         proc_wakeup(p);
355         proc_decref(p); /* let go of the reference created in proc_create() */
356         kref_put(&program->f_kref);
357         /* Make a scheduling decision.  You might not get the process you created,
358          * in the event there are others floating around that are runnable */
359         run_scheduler();
360         /* want to idle, so we un the process we just selected.  this is a bit
361          * hackish, but so is the monitor. */
362         smp_idle();
363         assert(0);
364         return 0;
365 }
366
367 int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
368 {
369         int8_t irq_state = 0;
370         if (argc < 2) {
371                 printk("Usage: procinfo OPTION\n");
372                 printk("\tidlecores: show idle core map\n");
373                 printk("\tall: show all active pids\n");
374                 printk("\tsched: scheduler diagnostic report\n");
375                 printk("\tresources: show resources wanted/granted for all procs\n");
376                 printk("\tpid NUM: show a lot of info for proc NUM\n");
377                 printk("\tunlock: unlock the lock for the ADDR (OMG!!!)\n");
378                 printk("\tkill NUM: destroy proc NUM\n");
379                 return 1;
380         }
381         if (!strcmp(argv[1], "idlecores")) {
382                 print_idlecoremap();
383         } else if (!strcmp(argv[1], "all")) {
384                 print_allpids();
385         } else if (!strcmp(argv[1], "sched")) {
386                 sched_diag();
387         } else if (!strcmp(argv[1], "resources")) {
388                 print_all_resources();
389         } else if (!strcmp(argv[1], "pid")) {
390                 if (argc != 3) {
391                         printk("Give me a pid number.\n");
392                         return 1;
393                 }
394                 print_proc_info(strtol(argv[2], 0, 0));
395         } else if (!strcmp(argv[1], "unlock")) {
396                 if (argc != 3) {
397                         printk("Gimme lock address!  Me want lock address!.\n");
398                         return 1;
399                 }
400                 spinlock_t *lock = (spinlock_t*)strtol(argv[2], 0, 16);
401                 if (!lock) {
402                         printk("Null address...\n");
403                         return 1;
404                 }
405                 spin_unlock(lock);
406         } else if (!strcmp(argv[1], "kill")) {
407                 if (argc != 3) {
408                         printk("Give me a pid number.\n");
409                         return 1;
410                 }
411                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
412                 if (!p) {
413                         printk("No such proc\n");
414                         return 1;
415                 }
416                 enable_irqsave(&irq_state);
417                 proc_destroy(p);
418                 disable_irqsave(&irq_state);
419                 proc_decref(p);
420         } else {
421                 printk("Bad option\n");
422                 return 1;
423         }
424         return 0;
425 }
426
427 int mon_kill(int argc, char **argv, struct hw_trapframe *hw_tf)
428 {
429         struct proc *p;
430         int8_t irq_state = 0;
431         if (argc < 2) {
432                 printk("Usage: kill PID\n");
433                 return 1;
434         }
435         p = pid2proc(strtol(argv[1], 0, 0));
436         if (!p) {
437                 printk("No such proc\n");
438                 return 1;
439         }
440         enable_irqsave(&irq_state);
441         proc_destroy(p);
442         disable_irqsave(&irq_state);
443         proc_decref(p);
444         return 0;
445 }
446
447 int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
448 {
449         return -1;
450 }
451
452 int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
453 {
454         void (*func)(void *arg, ...);
455
456         if (argc < 2) {
457                 printk("Usage: kfunc FUNCTION [arg1] [arg2] [etc]\n");
458                 printk("Arguments must be in hex.  Can take 6 args.\n");
459                 return 1;
460         }
461         func = (void*)get_symbol_addr(argv[1]);
462         if (!func) {
463                 printk("Function not found.\n");
464                 return 1;
465         }
466         /* Not elegant, but whatever.  maybe there's a better syntax, or we can do
467          * it with asm magic. */
468         switch (argc) {
469                 case 2: /* have to fake one arg */
470                         func((void*)0);
471                         break;
472                 case 3: /* the real first arg */
473                         func((void*)strtol(argv[2], 0, 16));
474                         break;
475                 case 4:
476                         func((void*)strtol(argv[2], 0, 16),
477                                     strtol(argv[3], 0, 16));
478                         break;
479                 case 5:
480                         func((void*)strtol(argv[2], 0, 16),
481                                     strtol(argv[3], 0, 16),
482                                     strtol(argv[4], 0, 16));
483                         break;
484                 case 6:
485                         func((void*)strtol(argv[2], 0, 16),
486                                     strtol(argv[3], 0, 16),
487                                     strtol(argv[4], 0, 16),
488                                     strtol(argv[5], 0, 16));
489                         break;
490                 case 7:
491                         func((void*)strtol(argv[2], 0, 16),
492                                     strtol(argv[3], 0, 16),
493                                     strtol(argv[4], 0, 16),
494                                     strtol(argv[5], 0, 16),
495                                     strtol(argv[6], 0, 16));
496                         break;
497                 case 8:
498                         func((void*)strtol(argv[2], 0, 16),
499                                     strtol(argv[3], 0, 16),
500                                     strtol(argv[4], 0, 16),
501                                     strtol(argv[5], 0, 16),
502                                     strtol(argv[6], 0, 16),
503                                     strtol(argv[7], 0, 16));
504                         break;
505                 default:
506                         printk("Bad number of arguments.\n");
507                         return -1;
508         }
509         return 0;
510 }
511
512 /* Sending a vcoreid forces an event and an IPI/notification */
513 int mon_notify(int argc, char **argv, struct hw_trapframe *hw_tf)
514 {
515         struct proc *p;
516         uint32_t vcoreid;
517         struct event_msg msg = {0};
518
519         if (argc < 3) {
520                 printk("Usage: notify PID NUM [VCOREID]\n");
521                 return 1;
522         }
523         p = pid2proc(strtol(argv[1], 0, 0));
524         if (!p) {
525                 printk("No such proc\n");
526                 return 1;
527         }
528         msg.ev_type = strtol(argv[2], 0, 0);
529         if (argc == 4) {
530                 vcoreid = strtol(argv[3], 0, 0);
531                 /* This will go to the private mbox */
532                 post_vcore_event(p, &msg, vcoreid, EVENT_VCORE_PRIVATE);
533                 proc_notify(p, vcoreid);
534         } else {
535                 /* o/w, try and do what they want */
536                 send_kernel_event(p, &msg, 0);
537         }
538         proc_decref(p);
539         return 0;
540 }
541
542 /* Micro-benchmarky Measurements.  This is really fragile code that probably
543  * won't work perfectly, esp as the kernel evolves. */
544 int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
545 {
546         uint64_t begin = 0, diff = 0;
547         uint32_t end_refcnt = 0;
548         int8_t irq_state = 0;
549
550         if (argc < 2) {
551                 printk("Usage: measure OPTION\n");
552                 printk("\tkill PID : kill proc PID\n");
553                 printk("\tpreempt PID : preempt proc PID (no delay)\n");
554                 printk("\tpreempt PID [pcore] : preempt PID's pcore (no delay)\n");
555                 printk("\tpreempt-warn PID : warn-preempt proc PID (pending)\n");
556                 printk("\tpreempt-warn PID [pcore] : warn-preempt proc PID's pcore\n");
557                 printk("\tpreempt-raw PID : raw-preempt proc PID\n");
558                 printk("\tpreempt-raw PID [pcore] : raw-preempt proc PID's pcore\n");
559                 return 1;
560         }
561         if (!strcmp(argv[1], "kill")) {
562                 if (argc < 3) {
563                         printk("Give me a pid number.\n");
564                         return 1;
565                 }
566                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
567                 if (!p) {
568                         printk("No such proc\n");
569                         return 1;
570                 }
571                 begin = start_timing();
572 #ifdef CONFIG_APPSERVER
573                 printk("Warning: this will be inaccurate due to the appserver.\n");
574                 end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores - 1;
575 #endif /* CONFIG_APPSERVER */
576                 enable_irqsave(&irq_state);
577                 proc_destroy(p);
578                 disable_irqsave(&irq_state);
579                 proc_decref(p);
580 #ifdef CONFIG_APPSERVER
581                 /* Won't be that accurate, since it's not actually going through the
582                  * __proc_free() path. */
583                 spin_on(kref_refcnt(&p->p_kref) != end_refcnt); 
584 #else
585                 /* this is a little ghetto. it's not fully free yet, but we are also
586                  * slowing it down by messing with it, esp with the busy waiting on a
587                  * hyperthreaded core. */
588                 spin_on(p->env_cr3);
589 #endif /* CONFIG_APPSERVER */
590                 /* No noticeable difference using stop_timing instead of read_tsc() */
591                 diff = stop_timing(begin);
592         } else if (!strcmp(argv[1], "preempt")) {
593                 if (argc < 3) {
594                         printk("Give me a pid number.\n");
595                         return 1;
596                 }
597                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
598                 if (!p) {
599                         printk("No such proc\n");
600                         return 1;
601                 }
602                 if (argc == 4) { /* single core being preempted, warned but no delay */
603                         uint32_t pcoreid = strtol(argv[3], 0, 0);
604                         begin = start_timing();
605                         if (proc_preempt_core(p, pcoreid, 1000000)) {
606                                 __sched_put_idle_core(p, pcoreid);
607                                 /* done when unmapped (right before abandoning) */
608                                 spin_on(p->procinfo->pcoremap[pcoreid].valid);
609                         } else {
610                                 printk("Core %d was not mapped to proc\n", pcoreid);
611                         }
612                         diff = stop_timing(begin);
613                 } else { /* preempt all cores, warned but no delay */
614                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
615                         begin = start_timing();
616                         proc_preempt_all(p, 1000000);
617                         /* a little ghetto, implies no one is using p */
618                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
619                         diff = stop_timing(begin);
620                 }
621                 proc_decref(p);
622         } else if (!strcmp(argv[1], "preempt-warn")) {
623                 if (argc < 3) {
624                         printk("Give me a pid number.\n");
625                         return 1;
626                 }
627                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
628                 if (!p) {
629                         printk("No such proc\n");
630                         return 1;
631                 }
632                 printk("Careful: if this hangs, then the process isn't responding.\n");
633                 if (argc == 4) { /* single core being preempted-warned */
634                         uint32_t pcoreid = strtol(argv[3], 0, 0);
635                         spin_lock(&p->proc_lock);
636                         uint32_t vcoreid = p->procinfo->pcoremap[pcoreid].vcoreid;
637                         if (!p->procinfo->pcoremap[pcoreid].valid) {
638                                 printk("Pick a mapped pcore\n");
639                                 spin_unlock(&p->proc_lock);
640                                 return 1;
641                         }
642                         begin = start_timing();
643                         __proc_preempt_warn(p, vcoreid, 1000000); // 1 sec
644                         spin_unlock(&p->proc_lock);
645                         /* done when unmapped (right before abandoning) */
646                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
647                         diff = stop_timing(begin);
648                 } else { /* preempt-warn all cores */
649                         printk("Warning, this won't work if they can't yield their "
650                                "last vcore, will stop at 1!\n");
651                         spin_lock(&p->proc_lock);
652                         begin = start_timing();
653                         __proc_preempt_warnall(p, 1000000);
654                         spin_unlock(&p->proc_lock);
655                         /* target cores do the unmapping / changing of the num_vcores */
656                         spin_on(p->procinfo->num_vcores > 1);
657                         diff = stop_timing(begin);
658                 }
659                 proc_decref(p);
660         } else if (!strcmp(argv[1], "preempt-raw")) {
661                 if (argc < 3) {
662                         printk("Give me a pid number.\n");
663                         return 1;
664                 }
665                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
666                 if (!p) {
667                         printk("No such proc\n");
668                         return 1;
669                 }
670                 if (argc == 4) { /* single core preempted, no warning or waiting */
671                         uint32_t pcoreid = strtol(argv[3], 0, 0);
672                         spin_lock(&p->proc_lock);
673                         if (!p->procinfo->pcoremap[pcoreid].valid) {
674                                 printk("Pick a mapped pcore\n");
675                                 spin_unlock(&p->proc_lock);
676                                 return 1;
677                         }
678                         begin = start_timing();
679                         __proc_preempt_core(p, pcoreid);
680                         if (!p->procinfo->num_vcores)
681                                 __proc_set_state(p, PROC_RUNNABLE_M);
682                         spin_unlock(&p->proc_lock);
683                         /* ghetto, since the ksched should be calling all of this */
684                         __sched_put_idle_core(p, pcoreid);
685                         /* done when unmapped (right before abandoning) */
686                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
687                         diff = stop_timing(begin);
688                 } else { /* preempt all cores, no warning or waiting */
689                         spin_lock(&p->proc_lock);
690                         uint32_t pc_arr[p->procinfo->num_vcores];
691                         uint32_t num_revoked;
692                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
693                         begin = start_timing();
694                         num_revoked = __proc_preempt_all(p, pc_arr);
695                         __proc_set_state(p, PROC_RUNNABLE_M);
696                         spin_unlock(&p->proc_lock);
697                         if (num_revoked)
698                                 __sched_put_idle_cores(p, pc_arr, num_revoked);
699                         /* a little ghetto, implies no one else is using p */
700                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
701                         diff = stop_timing(begin);
702                 }
703                 proc_decref(p);
704         } else {
705                 printk("Bad option\n");
706                 return 1;
707         }
708         printk("[Tired Giraffe Accent] Took %llu usec (%llu nsec) to finish.\n",
709                tsc2usec(diff), tsc2nsec(diff));
710         return 0;
711 }
712
713 /* Used in various debug locations.  Not a kernel API or anything. */
714 bool mon_verbose_trace = FALSE;
715
716 int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
717 {
718         int core;
719         if (argc < 2) {
720                 printk("Usage: trace OPTION\n");
721                 printk("\tsyscall start [silent] [pid]: starts tracing\n");
722                 printk("\tsyscall stop: stops tracing, prints if it was silent\n");
723                 printk("\tcoretf COREID: prints PC, -1 for all cores, verbose => TF\n");
724                 printk("\tpcpui [type [coreid]]: runs pcpui trace ring handlers\n");
725                 printk("\tpcpui-reset [noclear]: resets/clears pcpui trace ring\n");
726                 printk("\tverbose: toggles verbosity, depends on trace command\n");
727                 return 1;
728         }
729         if (!strcmp(argv[1], "syscall")) {
730                 if (argc < 3) {
731                         printk("Need a start or stop.\n");
732                         return 1;
733                 }
734                 if (!strcmp(argv[2], "start")) {
735                         bool all = TRUE;
736                         bool silent = FALSE;
737                         struct proc *p = NULL;
738                         if (argc >= 4) {
739                                 silent = (bool)strtol(argv[3], 0, 0);
740                         }
741                         if (argc >= 5) {
742                                 all = FALSE;
743                                 p = pid2proc(strtol(argv[4], 0, 0));
744                                 if (!p) {
745                                         printk("No such process\n");
746                                         return 1;
747                                 }
748                         }
749                         systrace_start(silent);
750                         if (systrace_reg(all, p))
751                                 printk("No room to trace more processes\n");
752                 } else if (!strcmp(argv[2], "stop")) {
753                         /* Stop and print for all processes */
754                         systrace_stop();
755                         systrace_print(TRUE, 0);
756                         systrace_clear_buffer();
757                 }
758         } else if (!strcmp(argv[1], "coretf")) {
759                 if (argc != 3) {
760                         printk("Need a coreid, fool.\n");
761                         return 1;
762                 }
763                 core = strtol(argv[2], 0, 0);
764                 if (core < 0) {
765                         printk("Sending NMIs to all cores:\n");
766                         for (int i = 0; i < num_cpus; i++)
767                                 send_nmi(i);
768                 } else {
769                         printk("Sending NMI core %d:\n", core);
770                         if (core >= num_cpus) {
771                                 printk("No such core!  Maybe it's in another cell...\n");
772                                 return 1;
773                         }
774                         send_nmi(core);
775                 }
776                 udelay(1000000);
777         } else if (!strcmp(argv[1], "pcpui")) {
778                 int pcpui_type, pcpui_coreid;
779                 if (argc >= 3)
780                         pcpui_type = strtol(argv[2], 0, 0);
781                 else
782                         pcpui_type = 0;
783                 printk("\nRunning PCPUI Trace Ring handlers for type %d\n", pcpui_type);
784                 if (argc >= 4) {
785                         pcpui_coreid = strtol(argv[3], 0, 0); 
786                         pcpui_tr_foreach(pcpui_coreid, pcpui_type);
787                 } else {
788                         pcpui_tr_foreach_all(pcpui_type);
789                 }
790         } else if (!strcmp(argv[1], "pcpui-reset")) {
791                 if (argc >= 3) {
792                         printk("\nResetting all PCPUI Trace Rings\n");
793                         pcpui_tr_reset_all();
794                 } else {
795                         printk("\nResetting and clearing all PCPUI Trace Rings\n");
796                         pcpui_tr_reset_and_clear_all();
797                 }
798         } else if (!strcmp(argv[1], "verbose")) {
799                 if (mon_verbose_trace) {
800                         printk("Turning trace verbosity off\n");
801                         mon_verbose_trace = FALSE;
802                 } else {
803                         printk("Turning trace verbosity on\n");
804                         mon_verbose_trace = TRUE;
805                 }
806         } else if (!strcmp(argv[1], "opt2")) {
807                 if (argc != 3) {
808                         printk("ERRRRRRRRRR.\n");
809                         return 1;
810                 }
811                 print_proc_info(strtol(argv[2], 0, 0));
812         } else {
813                 printk("Bad option\n");
814                 return 1;
815         }
816         return 0;
817 }
818
819 int mon_monitor(int argc, char **argv, struct hw_trapframe *hw_tf)
820 {
821         if (argc < 2) {
822                 printk("Usage: monitor COREID\n");
823                 return 1;
824         }
825         uint32_t core = strtol(argv[1], 0, 0);
826         if (core >= num_cpus) {
827                 printk("No such core!  Maybe it's in another cell...\n");
828                 return 1;
829         }
830         send_kernel_message(core, __run_mon, 0, 0, 0, KMSG_ROUTINE);
831         return 0;
832 }
833
834 /***** Kernel monitor command interpreter *****/
835
836 #define WHITESPACE "\t\r\n "
837 #define MAXARGS 16
838
839 static int runcmd(char *NTS real_buf, struct hw_trapframe *hw_tf) {
840         char * buf = NTEXPAND(real_buf);
841         int argc;
842         char *NTS argv[MAXARGS];
843         int i;
844
845         // Parse the command buffer into whitespace-separated arguments
846         argc = 0;
847         argv[argc] = 0;
848         while (1) {
849                 // gobble whitespace
850                 while (*buf && strchr(WHITESPACE, *buf))
851                         *buf++ = 0;
852                 if (*buf == 0)
853                         break;
854
855                 // save and scan past next arg
856                 if (argc == MAXARGS-1) {
857                         cprintf("Too many arguments (max %d)\n", MAXARGS);
858                         return 0;
859                 }
860                 //This will get fucked at runtime..... in the ASS
861                 argv[argc++] = buf;
862                 while (*buf && !strchr(WHITESPACE, *buf))
863                         buf++;
864         }
865         argv[argc] = 0;
866
867         // Lookup and invoke the command
868         if (argc == 0)
869                 return 0;
870         for (i = 0; i < NCOMMANDS; i++) {
871                 if (strcmp(argv[0], commands[i].name) == 0)
872                         return commands[i].func(argc, argv, hw_tf);
873         }
874         cprintf("Unknown command '%s'\n", argv[0]);
875         return 0;
876 }
877
878 void monitor(struct hw_trapframe *hw_tf)
879 {
880         #define MON_CMD_LENGTH 256
881         char buf[MON_CMD_LENGTH];
882         int cnt;
883         int coreid = core_id_early();
884
885         /* they are always disabled, since we have this irqsave lock */
886         if (irq_is_enabled())
887                 printk("Entering Nanwan's Dungeon on Core %d (Ints on):\n", coreid);
888         else
889                 printk("Entering Nanwan's Dungeon on Core %d (Ints off):\n", coreid);
890         printk("Type 'help' for a list of commands.\n");
891
892         if (hw_tf != NULL)
893                 print_trapframe(hw_tf);
894
895         while (1) {
896                 /* on occasion, the kernel monitor can migrate (like if you run
897                  * something that blocks / syncs and wakes up on another core) */
898                 cmb();
899                 cnt = readline(buf, MON_CMD_LENGTH, "ROS(Core %d)> ", core_id_early());
900                 if (cnt > 0) {
901                         buf[cnt] = 0;
902                         if (runcmd(buf, hw_tf) < 0)
903                                 break;
904                 }
905         }
906 }
907
908 static void pm_flusher(void *unused)
909 {
910         struct super_block *sb;
911         struct inode *inode;
912         unsigned long nr_pages;
913
914         /* could also put the delay between calls, or even within remove, during the
915          * WB phase. */
916         while (1) {
917                 udelay_sched(5000);
918                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
919                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
920                                 nr_pages = ROUNDUP(inode->i_size, PGSIZE) >> PGSHIFT;
921                                 if (nr_pages)
922                                         pm_remove_contig(inode->i_mapping, 0, nr_pages);
923                         }
924                 }
925         }
926 }
927
928 int mon_fs(int argc, char **argv, struct hw_trapframe *hw_tf)
929 {
930         /* this assumes one mounted FS at the NS root */
931         struct super_block *sb;
932         struct file *file;
933         struct inode *inode;
934         struct dentry *dentry;
935         if (argc < 2) {
936                 printk("Usage: fs OPTION\n");
937                 printk("\topen: show all open files\n");
938                 printk("\tinodes: show all inodes\n");
939                 printk("\tdentries [lru|prune]: show all dentries, opt LRU/prune\n");
940                 printk("\tls DIR: print the dir tree starting with DIR\n");
941                 printk("\tpid: proc PID's fs crap placeholder\n");
942                 printk("\tpmflusher: start a ktask to keep flushing all PMs\n");
943                 return 1;
944         }
945         if (!strcmp(argv[1], "open")) {
946                 printk("Open Files:\n----------------------------\n");
947                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
948                         printk("Superblock for %s\n", sb->s_name);
949                         TAILQ_FOREACH(file, &sb->s_files, f_list)
950                                 printk("File: %p, %s, Refs: %d, Drefs: %d, Irefs: %d PM: %p\n",
951                                        file, file_name(file), kref_refcnt(&file->f_kref),
952                                        kref_refcnt(&file->f_dentry->d_kref),
953                                        kref_refcnt(&file->f_dentry->d_inode->i_kref),
954                                            file->f_mapping);
955                 }
956         } else if (!strcmp(argv[1], "inodes")) {
957                 printk("Mounted FS Inodes:\n----------------------------\n");
958                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
959                         printk("Superblock for %s\n", sb->s_name);
960                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
961                                 printk("Inode: %p, Refs: %d, Nlinks: %d, Size(B): %d\n",
962                                        inode, kref_refcnt(&inode->i_kref), inode->i_nlink,
963                                        inode->i_size);
964                                 TAILQ_FOREACH(dentry, &inode->i_dentry, d_alias)
965                                         printk("\t%s: Dentry: %p, Refs: %d\n",
966                                                dentry->d_name.name, dentry,
967                                                kref_refcnt(&dentry->d_kref));
968                         }
969                 }
970         } else if (!strcmp(argv[1], "dentries")) {
971                 printk("Dentry Cache:\n----------------------------\n");
972                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
973                         printk("Superblock for %s\n", sb->s_name);
974                         printk("DENTRY     FLAGS      REFCNT NAME\n");
975                         printk("--------------------------------\n");
976                         /* Hash helper */
977                         void print_dcache_entry(void *item)
978                         {
979                                 struct dentry *d_i = (struct dentry*)item;
980                                 printk("%p %p %02d     %s\n", d_i, d_i->d_flags,
981                                        kref_refcnt(&d_i->d_kref), d_i->d_name.name);
982                         }
983                         hash_for_each(sb->s_dcache, print_dcache_entry);
984                 }
985                 if (argc < 3)
986                         return 0;
987                 if (!strcmp(argv[2], "lru")) {
988                         printk("LRU lists:\n");
989                         TAILQ_FOREACH(sb, &super_blocks, s_list) {
990                                 printk("Superblock for %s\n", sb->s_name);
991                                 TAILQ_FOREACH(dentry, &sb->s_lru_d, d_lru)
992                                         printk("Dentry: %p, Name: %s\n", dentry,
993                                                dentry->d_name.name);
994                         }
995                 } else if (!strcmp(argv[2], "prune")) {
996                         printk("Pruning unused dentries\n");
997                         TAILQ_FOREACH(sb, &super_blocks, s_list)
998                                 dcache_prune(sb, FALSE);
999                 }
1000         } else if (!strcmp(argv[1], "ls")) {
1001                 if (argc != 3) {
1002                         printk("Give me a dir.\n");
1003                         return 1;
1004                 }
1005                 if (argv[2][0] != '/') {
1006                         printk("Dear fellow giraffe lover, Use absolute paths.\n");
1007                         return 1;
1008                 }
1009                 ls_dash_r(argv[2]);
1010                 /* whatever.  placeholder. */
1011         } else if (!strcmp(argv[1], "pid")) {
1012                 if (argc != 3) {
1013                         printk("Give me a pid number.\n");
1014                         return 1;
1015                 }
1016                 /* whatever.  placeholder. */
1017         } else if (!strcmp(argv[1], "pmflusher")) {
1018                 ktask("pm_flusher", pm_flusher, 0);
1019         } else {
1020                 printk("Bad option\n");
1021                 return 1;
1022         }
1023         return 0;
1024 }
1025
1026 int mon_bb(int argc, char **argv, struct hw_trapframe *hw_tf)
1027 {
1028         char *l_argv[3] = {"", "busybox", "ash"};
1029         return mon_bin_run(3, l_argv, hw_tf);
1030 }
1031
1032 int mon_alarm(int argc, char **argv, struct hw_trapframe *hw_tf)
1033 {
1034         if (argc < 2) {
1035                 printk("Usage: alarm OPTION\n");
1036                 printk("\tpcpu: print full alarm tchains from every core\n");
1037                 return 1;
1038         }
1039         if (!strcmp(argv[1], "pcpu")) {
1040                 print_pcpu_chains();
1041         } else {
1042                 printk("Bad option\n");
1043                 return 1;
1044         }
1045         return 0;
1046 }
1047
1048 static void show_msr(struct hw_trapframe *unused, void *v)
1049 {
1050         int core = core_id();
1051         uint64_t val;
1052         uint32_t msr = *(uint32_t *)v;
1053         val = read_msr(msr);
1054         printk("%d: %08x: %016llx\n", core, msr, val);
1055 }
1056
1057 struct set {
1058         uint32_t msr;
1059         uint64_t val;
1060 };
1061
1062 static void set_msr(struct hw_trapframe *unused, void *v)
1063 {
1064         int core = core_id();
1065         struct set *s = v;
1066         uint32_t msr = s->msr;
1067         uint64_t val = s->val;
1068         write_msr(msr, val);
1069         val = read_msr(msr);
1070         printk("%d: %08x: %016llx\n", core, msr, val);
1071 }
1072
1073 int mon_msr(int argc, char **argv, struct hw_trapframe *hw_tf)
1074 {
1075 #ifndef CONFIG_X86
1076         cprintf("Not on this architecture\n");
1077         return 1;
1078 #else
1079         uint64_t val;
1080         uint32_t msr;
1081         if (argc < 2 || argc > 3) {
1082                 printk("Usage: msr register [value]\n");
1083                 return 1;
1084         }
1085         msr = strtoul(argv[1], 0, 16);
1086         handler_wrapper_t *w;
1087         smp_call_function_all(show_msr, &msr, &w);
1088         smp_call_wait(w);
1089
1090         if (argc < 3)
1091                 return 0;
1092         /* somewhat bogus on 32 bit. */
1093         val = strtoul(argv[2], 0, 16);
1094
1095         struct set set;
1096         set.msr = msr;
1097         set.val = val;
1098         smp_call_function_all(set_msr, &set, &w);
1099         smp_call_wait(w);
1100         return 0;
1101 #endif
1102 }
1103
1104 int mon_db(int argc, char **argv, struct hw_trapframe *hw_tf)
1105 {
1106         if (argc < 2) {
1107                 printk("Usage: db OPTION\n");
1108                 printk("\tsem: print all semaphore info\n");
1109                 return 1;
1110         }
1111         if (!strcmp(argv[1], "sem")) {
1112                 print_all_sem_info();
1113         } else {
1114                 printk("Bad option\n");
1115                 return 1;
1116         }
1117         return 0;
1118 }