Specify a permission for do_file_open() [2/7]
[akaros.git] / kern / src / monitor.c
1 // Simple command-line kernel monitor useful for
2 // controlling the kernel and exploring the system interactively.
3
4 #include <arch/arch.h>
5 #include <stab.h>
6 #include <smp.h>
7 #include <console.h>
8 #include <arch/console.h>
9
10 #include <stdio.h>
11 #include <string.h>
12 #include <assert.h>
13 #include <monitor.h>
14 #include <trap.h>
15 #include <pmap.h>
16 #include <kdebug.h>
17 #include <testing.h>
18 #include <manager.h>
19 #include <schedule.h>
20 #include <kdebug.h>
21 #include <syscall.h>
22 #include <kmalloc.h>
23 #include <elf.h>
24 #include <event.h>
25 #include <trap.h>
26 #include <time.h>
27
28 #include <ros/memlayout.h>
29 #include <ros/event.h>
30
31 #define CMDBUF_SIZE     80      // enough for one VGA text line
32
33 typedef struct command {
34         const char *name;
35         const char *desc;
36         // return -1 to force monitor to exit
37         int (*func)(int argc, char **argv, struct hw_trapframe *hw_tf);
38 } command_t;
39
40 static command_t commands[] = {
41         { "help", "Display this list of commands", mon_help },
42         { "kerninfo", "Display information about the kernel", mon_kerninfo },
43         { "backtrace", "Dump a backtrace", mon_backtrace },
44         { "bt", "Dump a backtrace", mon_bt },
45         { "reboot", "Take a ride to the South Bay", mon_reboot },
46         { "showmapping", "Shows VA->PA mappings", mon_showmapping},
47         { "sm", "Shows VA->PA mappings", mon_sm},
48         { "cpuinfo", "Prints CPU diagnostics", mon_cpuinfo},
49         { "ps", "Prints process list", mon_ps},
50         { "nanwan", "Meet Nanwan!!", mon_nanwan},
51         { "bin_ls", "List files in /bin", mon_bin_ls},
52         { "bin_run", "Create and run a program from /bin", mon_bin_run},
53         { "manager", "Run the manager", mon_manager},
54         { "procinfo", "Show information about processes", mon_procinfo},
55         { "pip", "Shorthand for procinfo pid", mon_pip},
56         { "kill", "Kills a process", mon_kill},
57         { "exit", "Leave the monitor", mon_exit},
58         { "kfunc", "Run a kernel function directly (!!!)", mon_kfunc},
59         { "notify", "Notify a process.  Vcoreid will skip their prefs", mon_notify},
60         { "measure", "Run a specific measurement", mon_measure},
61         { "trace", "Run some tracing functions", mon_trace},
62         { "monitor", "Run the monitor on another core", mon_monitor},
63         { "fs", "Filesystem Diagnostics", mon_fs},
64         { "bb", "Try to run busybox (ash)", mon_bb},
65         { "alarm", "Alarm Diagnostics", mon_alarm},
66         { "msr", "read/write msr: msr msr [value]", mon_msr},
67         { "db", "Misc debugging", mon_db},
68         { "px", "Toggle printx", mon_px},
69         { "kpfret", "Attempt to idle after a kernel fault", mon_kpfret},
70         { "ks", "Kernel scheduler hacks", mon_ks},
71         { "gfp", "Get free pages", mon_gfp },
72 };
73 #define NCOMMANDS (sizeof(commands)/sizeof(commands[0]))
74
75 /***** Implementations of basic kernel monitor commands *****/
76
77 int mon_help(int argc, char **argv, struct hw_trapframe *hw_tf)
78 {
79         int i;
80
81         for (i = 0; i < NCOMMANDS; i++)
82                 cprintf("%s - %s\n", commands[i].name, commands[i].desc);
83         return 0;
84 }
85
86 int mon_ps(int argc, char** argv, struct hw_trapframe *hw_tf)
87 {
88         print_allpids();
89         return 0;
90 }
91
92 int mon_kerninfo(int argc, char **argv, struct hw_trapframe *hw_tf)
93 {
94         extern char _start[], etext[], edata[], end[];
95
96         cprintf("Special kernel symbols:\n");
97         cprintf("  _start %016x (virt)  %016x (phys)\n", _start, (uintptr_t)(_start - KERNBASE));
98         cprintf("  etext  %016x (virt)  %016x (phys)\n", etext, (uintptr_t)(etext - KERNBASE));
99         cprintf("  edata  %016x (virt)  %016x (phys)\n", edata, (uintptr_t)(edata - KERNBASE));
100         cprintf("  end    %016x (virt)  %016x (phys)\n", end, (uintptr_t)(end - KERNBASE));
101         cprintf("Kernel executable memory footprint: %dKB\n",
102                 (uint32_t)(end-_start+1023)/1024);
103         return 0;
104 }
105
106 static int __backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
107 {
108         uintptr_t pc, fp;
109         if (argc == 1) {
110                 backtrace();
111                 return 0;
112         }
113         if (argc != 3) {
114                 printk("Need either no arguments, or two (PC and FP) in hex\n");
115                 return 1;
116         }
117         pc = strtol(argv[1], 0, 16);
118         fp = strtol(argv[2], 0, 16);
119         printk("Backtrace from instruction %p, with frame pointer %p\n", pc, fp);
120         backtrace_frame(pc, fp);
121         return 0;
122 }
123
124 int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
125 {
126         return __backtrace(argc, argv, hw_tf);
127 }
128
129 int mon_bt(int argc, char **argv, struct hw_trapframe *hw_tf)
130 {
131         return __backtrace(argc, argv, hw_tf);
132 }
133
134 int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
135 {
136         cprintf("[Scottish Accent]: She's goin' down, Cap'n!\n");
137         reboot();
138
139         // really, should never see this
140         cprintf("Sigh....\n");
141         return 0;
142 }
143
144 static int __showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
145 {
146         struct proc *p;
147         uintptr_t start;
148         size_t size;
149         pgdir_t pgdir;
150         pid_t pid;
151         if (argc < 3) {
152                 printk("Shows virtual -> physical mappings for a virt addr range.\n");
153                 printk("Usage: showmapping PID START_ADDR [END_ADDR]\n");
154                 printk("    PID == 0 for the boot pgdir\n");
155                 return 1;
156         }
157         pid = strtol(argv[1], 0, 10);
158         if (!pid) {
159                 pgdir = boot_pgdir;
160         } else {
161                 p = pid2proc(pid);
162                 if (!p) {
163                         printk("No proc with pid %d\n", pid);
164                         return 1;
165                 }
166                 pgdir = p->env_pgdir;
167         }
168         start = ROUNDDOWN(strtol(argv[2], 0, 16), PGSIZE);
169         size = (argc == 3) ? 1 : strtol(argv[3], 0, 16) - start;
170         if (size/PGSIZE > 512) {
171                 cprintf("Not going to do this for more than 512 items\n");
172                 return 1;
173         }
174         show_mapping(pgdir, start, size);
175         return 0;
176 }
177
178 int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
179 {
180         return __showmapping(argc, argv, hw_tf);
181 }
182
183 int mon_sm(int argc, char **argv, struct hw_trapframe *hw_tf)
184 {
185         return __showmapping(argc, argv, hw_tf);
186 }
187
188 static spinlock_t print_info_lock = SPINLOCK_INITIALIZER_IRQSAVE;
189
190 static void print_info_handler(struct hw_trapframe *hw_tf, void *data)
191 {
192         uint64_t tsc = read_tsc();
193
194         spin_lock_irqsave(&print_info_lock);
195         cprintf("----------------------------\n");
196         cprintf("This is Core %d\n", core_id());
197         cprintf("Timestamp = %lld\n", tsc);
198 #ifdef CONFIG_X86
199         cprintf("Hardware core %d\n", hw_core_id());
200         cprintf("MTRR_DEF_TYPE = 0x%08x\n", read_msr(IA32_MTRR_DEF_TYPE));
201         cprintf("MTRR Phys0 Base = 0x%016llx, Mask = 0x%016llx\n",
202                 read_msr(0x200), read_msr(0x201));
203         cprintf("MTRR Phys1 Base = 0x%016llx, Mask = 0x%016llx\n",
204                 read_msr(0x202), read_msr(0x203));
205         cprintf("MTRR Phys2 Base = 0x%016llx, Mask = 0x%016llx\n",
206                 read_msr(0x204), read_msr(0x205));
207         cprintf("MTRR Phys3 Base = 0x%016llx, Mask = 0x%016llx\n",
208                 read_msr(0x206), read_msr(0x207));
209         cprintf("MTRR Phys4 Base = 0x%016llx, Mask = 0x%016llx\n",
210                 read_msr(0x208), read_msr(0x209));
211         cprintf("MTRR Phys5 Base = 0x%016llx, Mask = 0x%016llx\n",
212                 read_msr(0x20a), read_msr(0x20b));
213         cprintf("MTRR Phys6 Base = 0x%016llx, Mask = 0x%016llx\n",
214                 read_msr(0x20c), read_msr(0x20d));
215         cprintf("MTRR Phys7 Base = 0x%016llx, Mask = 0x%016llx\n",
216                 read_msr(0x20e), read_msr(0x20f));
217 #endif // CONFIG_X86
218         cprintf("----------------------------\n");
219         spin_unlock_irqsave(&print_info_lock);
220 }
221
222 static bool print_all_info(void)
223 {
224         cprintf("\nCORE 0 asking all cores to print info:\n");
225         smp_call_function_all(print_info_handler, NULL, 0);
226         cprintf("\nDone!\n");
227         return true;
228 }
229
230 int mon_cpuinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
231 {
232         cprintf("Number of Cores detected: %d\n", num_cores);
233         cprintf("Calling CPU's ID: 0x%08x\n", core_id());
234
235         if (argc < 2)
236                 smp_call_function_self(print_info_handler, NULL, 0);
237         else
238                 smp_call_function_single(strtol(argv[1], 0, 10),
239                                          print_info_handler, NULL, 0);
240         return 0;
241 }
242
243 int mon_manager(int argc, char** argv, struct hw_trapframe *hw_tf)
244 {
245         manager();
246         panic("should never get here");
247         return 0;
248 }
249
250 int mon_nanwan(int argc, char **argv, struct hw_trapframe *hw_tf)
251 {
252         /* Borrowed with love from http://www.geocities.com/SoHo/7373/zoo.htm
253          * (http://www.ascii-art.com/).  Slightly modified to make it 25 lines tall.
254          */
255         printk("\n");
256         printk("             .-.  .-.\n");
257         printk("             |  \\/  |\n");
258         printk("            /,   ,_  `'-.\n");
259         printk("          .-|\\   /`\\     '. \n");
260         printk("        .'  0/   | 0\\  \\_  `\".  \n");
261         printk("     .-'  _,/    '--'.'|#''---'\n");
262         printk("      `--'  |       /   \\#\n");
263         printk("            |      /     \\#\n");
264         printk("            \\     ;|\\    .\\#\n");
265         printk("            |' ' //  \\   ::\\# \n");
266         printk("            \\   /`    \\   ':\\#\n");
267         printk("             `\"`       \\..   \\#\n");
268         printk("                        \\::.  \\#\n");
269         printk("                         \\::   \\#\n");
270         printk("                          \\'  .:\\#\n");
271         printk("                           \\  :::\\#\n");
272         printk("                            \\  '::\\#\n");
273         printk("                             \\     \\#\n");
274         printk("                              \\:.   \\#\n");
275         printk("                               \\::   \\#\n");
276         printk("                                \\'   .\\#\n");
277         printk("                             jgs \\   ::\\#\n");
278         printk("                                  \\      \n");
279         return 0;
280 }
281
282 int mon_bin_ls(int argc, char **argv, struct hw_trapframe *hw_tf)
283 {
284         struct dirent dir = {0};
285         struct file *bin_dir;
286         int retval = 0;
287
288         bin_dir = do_file_open("/bin", O_READ, 0);
289         if (!bin_dir) {
290                 printk("No /bin directory!\n");
291                 return 1;
292         }
293         printk("Files in /bin:\n-------------------------------\n");
294         do {
295                 retval = bin_dir->f_op->readdir(bin_dir, &dir); 
296                 printk("%s\n", dir.d_name);
297         } while (retval == 1);
298         kref_put(&bin_dir->f_kref);
299         return 0;
300 }
301
302 int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
303 {
304         if (argc < 2) {
305                 printk("Usage: bin_run FILENAME\n");
306                 return 1;
307         }
308         struct file *program;
309         int retval = 0;
310         char buf[6 + MAX_FILENAME_SZ] = "/bin/";        /* /bin/ + max + \0 */
311         strncpy(buf + 5, argv[1], MAX_FILENAME_SZ);
312         program = do_file_open(buf, O_READ, 0);
313         if (!program) {
314                 printk("No such program!\n");
315                 return 1;
316         }
317         char **p_argv = kmalloc(sizeof(char*) * argc, 0);       /* bin_run's argc */
318         for (int i = 0; i < argc - 1; i++)
319                 p_argv[i] = argv[i + 1];
320         p_argv[argc - 1] = 0;
321         /* super ugly: we need to stash current, so that proc_create doesn't pick up
322          * on random processes running here and assuming they are the parent */
323         struct proc *old_cur = current;
324         current = 0;
325         struct proc *p = proc_create(program, p_argv, NULL);
326         current = old_cur;
327         kfree(p_argv);
328         proc_wakeup(p);
329         proc_decref(p); /* let go of the reference created in proc_create() */
330         kref_put(&program->f_kref);
331         /* Make a scheduling decision.  You might not get the process you created,
332          * in the event there are others floating around that are runnable */
333         run_scheduler();
334         /* want to idle, so we un the process we just selected.  this is a bit
335          * hackish, but so is the monitor. */
336         smp_idle();
337         assert(0);
338         return 0;
339 }
340
341 int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
342 {
343         int8_t irq_state = 0;
344         if (argc < 2) {
345                 printk("Usage: procinfo OPTION\n");
346                 printk("\tall: show all active pids\n");
347                 printk("\tpid NUM: show a lot of info for proc NUM\n");
348                 printk("\tunlock: unlock the lock for the ADDR (OMG!!!)\n");
349                 printk("\tkill NUM: destroy proc NUM\n");
350                 return 1;
351         }
352         if (!strcmp(argv[1], "all")) {
353                 print_allpids();
354         } else if (!strcmp(argv[1], "pid")) {
355                 if (argc != 3) {
356                         printk("Give me a pid number.\n");
357                         return 1;
358                 }
359                 print_proc_info(strtol(argv[2], 0, 0));
360         } else if (!strcmp(argv[1], "unlock")) {
361                 if (argc != 3) {
362                         printk("Gimme lock address!  Me want lock address!.\n");
363                         return 1;
364                 }
365                 spinlock_t *lock = (spinlock_t*)strtol(argv[2], 0, 16);
366                 if (!lock) {
367                         printk("Null address...\n");
368                         return 1;
369                 }
370                 spin_unlock(lock);
371         } else if (!strcmp(argv[1], "kill")) {
372                 if (argc != 3) {
373                         printk("Give me a pid number.\n");
374                         return 1;
375                 }
376                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
377                 if (!p) {
378                         printk("No such proc\n");
379                         return 1;
380                 }
381                 enable_irqsave(&irq_state);
382                 proc_destroy(p);
383                 disable_irqsave(&irq_state);
384                 proc_decref(p);
385         } else {
386                 printk("Bad option\n");
387                 return 1;
388         }
389         return 0;
390 }
391
392 int mon_pip(int argc, char **argv, struct hw_trapframe *hw_tf)
393 {
394         if (argc != 2) {
395                 printk("Give me a pid number.\n");
396                 return 1;
397         }
398         print_proc_info(strtol(argv[1], 0, 0));
399         return 0;
400 }
401
402 int mon_kill(int argc, char **argv, struct hw_trapframe *hw_tf)
403 {
404         struct proc *p;
405         int8_t irq_state = 0;
406         if (argc < 2) {
407                 printk("Usage: kill PID\n");
408                 return 1;
409         }
410         p = pid2proc(strtol(argv[1], 0, 0));
411         if (!p) {
412                 printk("No such proc\n");
413                 return 1;
414         }
415         enable_irqsave(&irq_state);
416         proc_destroy(p);
417         disable_irqsave(&irq_state);
418         proc_decref(p);
419         return 0;
420 }
421
422 int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
423 {
424         return -1;
425 }
426
427 int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
428 {
429         void (*func)(void *arg, ...);
430
431         if (argc < 2) {
432                 printk("Usage: kfunc FUNCTION [arg1] [arg2] [etc]\n");
433                 printk("Arguments must be in hex.  Can take 6 args.\n");
434                 return 1;
435         }
436         func = (void*)get_symbol_addr(argv[1]);
437         if (!func) {
438                 printk("Function not found.\n");
439                 return 1;
440         }
441         /* Not elegant, but whatever.  maybe there's a better syntax, or we can do
442          * it with asm magic. */
443         switch (argc) {
444                 case 2: /* have to fake one arg */
445                         func((void*)0);
446                         break;
447                 case 3: /* the real first arg */
448                         func((void*)strtol(argv[2], 0, 16));
449                         break;
450                 case 4:
451                         func((void*)strtol(argv[2], 0, 16),
452                                     strtol(argv[3], 0, 16));
453                         break;
454                 case 5:
455                         func((void*)strtol(argv[2], 0, 16),
456                                     strtol(argv[3], 0, 16),
457                                     strtol(argv[4], 0, 16));
458                         break;
459                 case 6:
460                         func((void*)strtol(argv[2], 0, 16),
461                                     strtol(argv[3], 0, 16),
462                                     strtol(argv[4], 0, 16),
463                                     strtol(argv[5], 0, 16));
464                         break;
465                 case 7:
466                         func((void*)strtol(argv[2], 0, 16),
467                                     strtol(argv[3], 0, 16),
468                                     strtol(argv[4], 0, 16),
469                                     strtol(argv[5], 0, 16),
470                                     strtol(argv[6], 0, 16));
471                         break;
472                 case 8:
473                         func((void*)strtol(argv[2], 0, 16),
474                                     strtol(argv[3], 0, 16),
475                                     strtol(argv[4], 0, 16),
476                                     strtol(argv[5], 0, 16),
477                                     strtol(argv[6], 0, 16),
478                                     strtol(argv[7], 0, 16));
479                         break;
480                 default:
481                         printk("Bad number of arguments.\n");
482                         return -1;
483         }
484         return 0;
485 }
486
487 /* Sending a vcoreid forces an event and an IPI/notification */
488 int mon_notify(int argc, char **argv, struct hw_trapframe *hw_tf)
489 {
490         struct proc *p;
491         uint32_t vcoreid;
492         struct event_msg msg = {0};
493
494         if (argc < 3) {
495                 printk("Usage: notify PID NUM [VCOREID]\n");
496                 return 1;
497         }
498         p = pid2proc(strtol(argv[1], 0, 0));
499         if (!p) {
500                 printk("No such proc\n");
501                 return 1;
502         }
503         msg.ev_type = strtol(argv[2], 0, 0);
504         if (argc == 4) {
505                 vcoreid = strtol(argv[3], 0, 0);
506                 /* This will go to the private mbox */
507                 post_vcore_event(p, &msg, vcoreid, EVENT_VCORE_PRIVATE);
508                 proc_notify(p, vcoreid);
509         } else {
510                 /* o/w, try and do what they want */
511                 send_kernel_event(p, &msg, 0);
512         }
513         proc_decref(p);
514         return 0;
515 }
516
517 /* Micro-benchmarky Measurements.  This is really fragile code that probably
518  * won't work perfectly, esp as the kernel evolves. */
519 int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
520 {
521         uint64_t begin = 0, diff = 0;
522         uint32_t end_refcnt = 0;
523         int8_t irq_state = 0;
524
525         if (argc < 2) {
526                 printk("Usage: measure OPTION\n");
527                 printk("\tkill PID : kill proc PID\n");
528                 printk("\tpreempt PID : preempt proc PID (no delay)\n");
529                 printk("\tpreempt PID [pcore] : preempt PID's pcore (no delay)\n");
530                 printk("\tpreempt-warn PID : warn-preempt proc PID (pending)\n");
531                 printk("\tpreempt-warn PID [pcore] : warn-preempt proc PID's pcore\n");
532                 printk("\tpreempt-raw PID : raw-preempt proc PID\n");
533                 printk("\tpreempt-raw PID [pcore] : raw-preempt proc PID's pcore\n");
534                 return 1;
535         }
536         if (!strcmp(argv[1], "kill")) {
537                 if (argc < 3) {
538                         printk("Give me a pid number.\n");
539                         return 1;
540                 }
541                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
542                 if (!p) {
543                         printk("No such proc\n");
544                         return 1;
545                 }
546                 begin = start_timing();
547 #ifdef CONFIG_APPSERVER
548                 printk("Warning: this will be inaccurate due to the appserver.\n");
549                 end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores - 1;
550 #endif /* CONFIG_APPSERVER */
551                 enable_irqsave(&irq_state);
552                 proc_destroy(p);
553                 disable_irqsave(&irq_state);
554                 proc_decref(p);
555 #ifdef CONFIG_APPSERVER
556                 /* Won't be that accurate, since it's not actually going through the
557                  * __proc_free() path. */
558                 spin_on(kref_refcnt(&p->p_kref) != end_refcnt); 
559 #else
560                 /* this is a little ghetto. it's not fully free yet, but we are also
561                  * slowing it down by messing with it, esp with the busy waiting on a
562                  * hyperthreaded core. */
563                 spin_on(p->env_cr3);
564 #endif /* CONFIG_APPSERVER */
565                 /* No noticeable difference using stop_timing instead of read_tsc() */
566                 diff = stop_timing(begin);
567         } else if (!strcmp(argv[1], "preempt")) {
568                 if (argc < 3) {
569                         printk("Give me a pid number.\n");
570                         return 1;
571                 }
572                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
573                 if (!p) {
574                         printk("No such proc\n");
575                         return 1;
576                 }
577                 if (argc == 4) { /* single core being preempted, warned but no delay */
578                         uint32_t pcoreid = strtol(argv[3], 0, 0);
579                         begin = start_timing();
580                         if (proc_preempt_core(p, pcoreid, 1000000)) {
581                                 __sched_put_idle_core(p, pcoreid);
582                                 /* done when unmapped (right before abandoning) */
583                                 spin_on(p->procinfo->pcoremap[pcoreid].valid);
584                         } else {
585                                 printk("Core %d was not mapped to proc\n", pcoreid);
586                         }
587                         diff = stop_timing(begin);
588                 } else { /* preempt all cores, warned but no delay */
589                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
590                         begin = start_timing();
591                         proc_preempt_all(p, 1000000);
592                         /* a little ghetto, implies no one is using p */
593                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
594                         diff = stop_timing(begin);
595                 }
596                 proc_decref(p);
597         } else if (!strcmp(argv[1], "preempt-warn")) {
598                 if (argc < 3) {
599                         printk("Give me a pid number.\n");
600                         return 1;
601                 }
602                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
603                 if (!p) {
604                         printk("No such proc\n");
605                         return 1;
606                 }
607                 printk("Careful: if this hangs, then the process isn't responding.\n");
608                 if (argc == 4) { /* single core being preempted-warned */
609                         uint32_t pcoreid = strtol(argv[3], 0, 0);
610                         spin_lock(&p->proc_lock);
611                         uint32_t vcoreid = p->procinfo->pcoremap[pcoreid].vcoreid;
612                         if (!p->procinfo->pcoremap[pcoreid].valid) {
613                                 printk("Pick a mapped pcore\n");
614                                 spin_unlock(&p->proc_lock);
615                                 return 1;
616                         }
617                         begin = start_timing();
618                         __proc_preempt_warn(p, vcoreid, 1000000); // 1 sec
619                         spin_unlock(&p->proc_lock);
620                         /* done when unmapped (right before abandoning) */
621                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
622                         diff = stop_timing(begin);
623                 } else { /* preempt-warn all cores */
624                         printk("Warning, this won't work if they can't yield their "
625                                "last vcore, will stop at 1!\n");
626                         spin_lock(&p->proc_lock);
627                         begin = start_timing();
628                         __proc_preempt_warnall(p, 1000000);
629                         spin_unlock(&p->proc_lock);
630                         /* target cores do the unmapping / changing of the num_vcores */
631                         spin_on(p->procinfo->num_vcores > 1);
632                         diff = stop_timing(begin);
633                 }
634                 proc_decref(p);
635         } else if (!strcmp(argv[1], "preempt-raw")) {
636                 if (argc < 3) {
637                         printk("Give me a pid number.\n");
638                         return 1;
639                 }
640                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
641                 if (!p) {
642                         printk("No such proc\n");
643                         return 1;
644                 }
645                 if (argc == 4) { /* single core preempted, no warning or waiting */
646                         uint32_t pcoreid = strtol(argv[3], 0, 0);
647                         spin_lock(&p->proc_lock);
648                         if (!p->procinfo->pcoremap[pcoreid].valid) {
649                                 printk("Pick a mapped pcore\n");
650                                 spin_unlock(&p->proc_lock);
651                                 return 1;
652                         }
653                         begin = start_timing();
654                         __proc_preempt_core(p, pcoreid);
655                         if (!p->procinfo->num_vcores)
656                                 __proc_set_state(p, PROC_RUNNABLE_M);
657                         spin_unlock(&p->proc_lock);
658                         /* ghetto, since the ksched should be calling all of this */
659                         __sched_put_idle_core(p, pcoreid);
660                         /* done when unmapped (right before abandoning) */
661                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
662                         diff = stop_timing(begin);
663                 } else { /* preempt all cores, no warning or waiting */
664                         spin_lock(&p->proc_lock);
665                         uint32_t pc_arr[p->procinfo->num_vcores];
666                         uint32_t num_revoked;
667                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
668                         begin = start_timing();
669                         num_revoked = __proc_preempt_all(p, pc_arr);
670                         __proc_set_state(p, PROC_RUNNABLE_M);
671                         spin_unlock(&p->proc_lock);
672                         if (num_revoked)
673                                 __sched_put_idle_cores(p, pc_arr, num_revoked);
674                         /* a little ghetto, implies no one else is using p */
675                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
676                         diff = stop_timing(begin);
677                 }
678                 proc_decref(p);
679         } else {
680                 printk("Bad option\n");
681                 return 1;
682         }
683         printk("[Tired Giraffe Accent] Took %llu usec (%llu nsec) to finish.\n",
684                tsc2usec(diff), tsc2nsec(diff));
685         return 0;
686 }
687
688 /* Used in various debug locations.  Not a kernel API or anything. */
689 bool mon_verbose_trace = FALSE;
690
691 int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
692 {
693         int core;
694         if (argc < 2) {
695                 printk("Usage: trace OPTION\n");
696                 printk("\tsyscall start [silent (0 or non-zero, NOT the word silent)] [pid]: starts tracing\n");
697                 printk("\tsyscall stop: stops tracing.\n");
698                 printk("\tcoretf COREID: prints PC, -1 for all cores, verbose => TF\n");
699                 printk("\tpcpui [type [coreid]]: runs pcpui trace ring handlers\n");
700                 printk("\tpcpui-reset [noclear]: resets/clears pcpui trace ring\n");
701                 printk("\tverbose: toggles verbosity, depends on trace command\n");
702                 return 1;
703         }
704         if (!strcmp(argv[1], "syscall")) {
705                 if (argc < 3) {
706                         printk("Need a start or stop.\n");
707                         return 1;
708                 }
709                 if (!strcmp(argv[2], "start")) {
710                         bool all = TRUE;
711                         bool silent = FALSE;
712                         struct proc *p = NULL;
713                         if (argc >= 4) {
714                                 silent = (bool)strtol(argv[3], 0, 0);
715                         }
716                         if (argc >= 5) {
717                                 all = FALSE;
718                                 p = pid2proc(strtol(argv[4], 0, 0));
719                                 if (!p) {
720                                         printk("No such process\n");
721                                         return 1;
722                                 }
723                         }
724                         systrace_start(silent);
725                         if (systrace_reg(all, p))
726                                 printk("No room to trace more processes\n");
727                 } else if (!strcmp(argv[2], "stop")) {
728                         /* Stop. To see the output, kfunc systrace_print and systrace_clear */
729                         /* or cat #K/kptrace or /prof/kptrace */
730                         systrace_stop();
731                 }
732         } else if (!strcmp(argv[1], "coretf")) {
733                 if (argc != 3) {
734                         printk("Need a coreid, fool.\n");
735                         return 1;
736                 }
737                 core = strtol(argv[2], 0, 0);
738                 if (core < 0) {
739                         printk("Sending NMIs to all cores:\n");
740                         for (int i = 0; i < num_cores; i++)
741                                 send_nmi(i);
742                 } else {
743                         printk("Sending NMI core %d:\n", core);
744                         if (core >= num_cores) {
745                                 printk("No such core!  Maybe it's in another cell...\n");
746                                 return 1;
747                         }
748                         send_nmi(core);
749                 }
750                 udelay(1000000);
751         } else if (!strcmp(argv[1], "pcpui")) {
752                 int pcpui_type, pcpui_coreid;
753                 if (argc >= 3)
754                         pcpui_type = strtol(argv[2], 0, 0);
755                 else
756                         pcpui_type = 0;
757                 printk("\nRunning PCPUI Trace Ring handlers for type %d\n", pcpui_type);
758                 if (argc >= 4) {
759                         pcpui_coreid = strtol(argv[3], 0, 0); 
760                         pcpui_tr_foreach(pcpui_coreid, pcpui_type);
761                 } else {
762                         pcpui_tr_foreach_all(pcpui_type);
763                 }
764         } else if (!strcmp(argv[1], "pcpui-reset")) {
765                 if (argc >= 3) {
766                         printk("\nResetting all PCPUI Trace Rings\n");
767                         pcpui_tr_reset_all();
768                 } else {
769                         printk("\nResetting and clearing all PCPUI Trace Rings\n");
770                         pcpui_tr_reset_and_clear_all();
771                 }
772         } else if (!strcmp(argv[1], "verbose")) {
773                 if (mon_verbose_trace) {
774                         printk("Turning trace verbosity off\n");
775                         mon_verbose_trace = FALSE;
776                 } else {
777                         printk("Turning trace verbosity on\n");
778                         mon_verbose_trace = TRUE;
779                 }
780         } else if (!strcmp(argv[1], "opt2")) {
781                 if (argc != 3) {
782                         printk("ERRRRRRRRRR.\n");
783                         return 1;
784                 }
785                 print_proc_info(strtol(argv[2], 0, 0));
786         } else {
787                 printk("Bad option\n");
788                 return 1;
789         }
790         return 0;
791 }
792
793 int mon_monitor(int argc, char **argv, struct hw_trapframe *hw_tf)
794 {
795         if (argc < 2) {
796                 printk("Usage: monitor COREID\n");
797                 return 1;
798         }
799         uint32_t core = strtol(argv[1], 0, 0);
800         if (core >= num_cores) {
801                 printk("No such core!  Maybe it's in another cell...\n");
802                 return 1;
803         }
804         send_kernel_message(core, __run_mon, 0, 0, 0, KMSG_ROUTINE);
805         return 0;
806 }
807
808 /***** Kernel monitor command interpreter *****/
809
810 #define WHITESPACE "\t\r\n "
811 #define MAXARGS 16
812
813
814 int onecmd(int argc, char *argv[], struct hw_trapframe *hw_tf) {
815         int i;
816         if (!argc)
817                 return -1;
818         for (i = 0; i < NCOMMANDS; i++) {
819                 if (strcmp(argv[0], commands[i].name) == 0)
820                         return commands[i].func(argc, argv, hw_tf);
821         }
822         return -1;
823 }
824
825 static int runcmd(char *real_buf, struct hw_trapframe *hw_tf) {
826         char * buf = real_buf;
827         int argc;
828         char *argv[MAXARGS];
829         int i;
830
831         // Parse the command buffer into whitespace-separated arguments
832         argc = 0;
833         argv[argc] = 0;
834         while (1) {
835                 // gobble whitespace
836                 while (*buf && strchr(WHITESPACE, *buf))
837                         *buf++ = 0;
838                 if (*buf == 0)
839                         break;
840
841                 // save and scan past next arg
842                 if (argc == MAXARGS-1) {
843                         cprintf("Too many arguments (max %d)\n", MAXARGS);
844                         return 0;
845                 }
846                 //This will get fucked at runtime..... in the ASS
847                 argv[argc++] = buf;
848                 while (*buf && !strchr(WHITESPACE, *buf))
849                         buf++;
850         }
851         argv[argc] = 0;
852
853         // Lookup and invoke the command
854         if (argc == 0)
855                 return 0;
856         for (i = 0; i < NCOMMANDS; i++) {
857                 if (strcmp(argv[0], commands[i].name) == 0)
858                         return commands[i].func(argc, argv, hw_tf);
859         }
860         cprintf("Unknown command '%s'\n", argv[0]);
861         return 0;
862 }
863
864 void monitor(struct hw_trapframe *hw_tf)
865 {
866         #define MON_CMD_LENGTH 256
867         char buf[MON_CMD_LENGTH];
868         int cnt;
869         int coreid = core_id_early();
870
871         /* they are always disabled, since we have this irqsave lock */
872         if (irq_is_enabled())
873                 printk("Entering Nanwan's Dungeon on Core %d (Ints on):\n", coreid);
874         else
875                 printk("Entering Nanwan's Dungeon on Core %d (Ints off):\n", coreid);
876         printk("Type 'help' for a list of commands.\n");
877
878         if (hw_tf != NULL)
879                 print_trapframe(hw_tf);
880
881         while (1) {
882                 /* on occasion, the kernel monitor can migrate (like if you run
883                  * something that blocks / syncs and wakes up on another core) */
884                 cmb();
885                 cnt = readline(buf, MON_CMD_LENGTH, "ROS(Core %d)> ", core_id_early());
886                 if (cnt > 0) {
887                         buf[cnt] = 0;
888                         if (runcmd(buf, hw_tf) < 0)
889                                 break;
890                 }
891         }
892 }
893
894 static void pm_flusher(void *unused)
895 {
896         struct super_block *sb;
897         struct inode *inode;
898         unsigned long nr_pages;
899
900         /* could also put the delay between calls, or even within remove, during the
901          * WB phase. */
902         while (1) {
903                 kthread_usleep(5000);
904                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
905                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
906                                 nr_pages = ROUNDUP(inode->i_size, PGSIZE) >> PGSHIFT;
907                                 if (nr_pages)
908                                         pm_remove_contig(inode->i_mapping, 0, nr_pages);
909                         }
910                 }
911         }
912 }
913
914 int mon_fs(int argc, char **argv, struct hw_trapframe *hw_tf)
915 {
916         /* this assumes one mounted FS at the NS root */
917         struct super_block *sb;
918         struct file *file;
919         struct inode *inode;
920         struct dentry *dentry;
921         if (argc < 2) {
922                 printk("Usage: fs OPTION\n");
923                 printk("\topen: show all open files\n");
924                 printk("\tinodes: show all inodes\n");
925                 printk("\tdentries [lru|prune]: show all dentries, opt LRU/prune\n");
926                 printk("\tls DIR: print the dir tree starting with DIR\n");
927                 printk("\tpid: proc PID's fs crap placeholder\n");
928                 printk("\tpmflusher: start a ktask to keep flushing all PMs\n");
929                 return 1;
930         }
931         if (!strcmp(argv[1], "open")) {
932                 printk("Open Files:\n----------------------------\n");
933                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
934                         printk("Superblock for %s\n", sb->s_name);
935                         TAILQ_FOREACH(file, &sb->s_files, f_list)
936                                 printk("File: %p, %s, Refs: %d, Drefs: %d, Irefs: %d PM: %p\n",
937                                        file, file_name(file), kref_refcnt(&file->f_kref),
938                                        kref_refcnt(&file->f_dentry->d_kref),
939                                        kref_refcnt(&file->f_dentry->d_inode->i_kref),
940                                            file->f_mapping);
941                 }
942         } else if (!strcmp(argv[1], "inodes")) {
943                 printk("Mounted FS Inodes:\n----------------------------\n");
944                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
945                         printk("Superblock for %s\n", sb->s_name);
946                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
947                                 printk("Inode: %p, Refs: %d, Nlinks: %d, Size(B): %d\n",
948                                        inode, kref_refcnt(&inode->i_kref), inode->i_nlink,
949                                        inode->i_size);
950                                 TAILQ_FOREACH(dentry, &inode->i_dentry, d_alias)
951                                         printk("\t%s: Dentry: %p, Refs: %d\n",
952                                                dentry->d_name.name, dentry,
953                                                kref_refcnt(&dentry->d_kref));
954                         }
955                 }
956         } else if (!strcmp(argv[1], "dentries")) {
957                 printk("Dentry Cache:\n----------------------------\n");
958                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
959                         printk("Superblock for %s\n", sb->s_name);
960                         printk("DENTRY     FLAGS      REFCNT NAME\n");
961                         printk("--------------------------------\n");
962                         /* Hash helper */
963                         void print_dcache_entry(void *item)
964                         {
965                                 struct dentry *d_i = (struct dentry*)item;
966                                 printk("%p %p %02d     %s\n", d_i, d_i->d_flags,
967                                        kref_refcnt(&d_i->d_kref), d_i->d_name.name);
968                         }
969                         hash_for_each(sb->s_dcache, print_dcache_entry);
970                 }
971                 if (argc < 3)
972                         return 0;
973                 if (!strcmp(argv[2], "lru")) {
974                         printk("LRU lists:\n");
975                         TAILQ_FOREACH(sb, &super_blocks, s_list) {
976                                 printk("Superblock for %s\n", sb->s_name);
977                                 TAILQ_FOREACH(dentry, &sb->s_lru_d, d_lru)
978                                         printk("Dentry: %p, Name: %s\n", dentry,
979                                                dentry->d_name.name);
980                         }
981                 } else if (!strcmp(argv[2], "prune")) {
982                         printk("Pruning unused dentries\n");
983                         TAILQ_FOREACH(sb, &super_blocks, s_list)
984                                 dcache_prune(sb, FALSE);
985                 }
986         } else if (!strcmp(argv[1], "ls")) {
987                 if (argc != 3) {
988                         printk("Give me a dir.\n");
989                         return 1;
990                 }
991                 if (argv[2][0] != '/') {
992                         printk("Dear fellow giraffe lover, Use absolute paths.\n");
993                         return 1;
994                 }
995                 ls_dash_r(argv[2]);
996                 /* whatever.  placeholder. */
997         } else if (!strcmp(argv[1], "pid")) {
998                 if (argc != 3) {
999                         printk("Give me a pid number.\n");
1000                         return 1;
1001                 }
1002                 /* whatever.  placeholder. */
1003         } else if (!strcmp(argv[1], "pmflusher")) {
1004                 ktask("pm_flusher", pm_flusher, 0);
1005         } else {
1006                 printk("Bad option\n");
1007                 return 1;
1008         }
1009         return 0;
1010 }
1011
1012 int mon_bb(int argc, char **argv, struct hw_trapframe *hw_tf)
1013 {
1014         char *l_argv[3] = {"", "busybox", "ash"};
1015         return mon_bin_run(3, l_argv, hw_tf);
1016 }
1017
1018 int mon_alarm(int argc, char **argv, struct hw_trapframe *hw_tf)
1019 {
1020         if (argc < 2) {
1021                 printk("Usage: alarm OPTION\n");
1022                 printk("\tpcpu: print full alarm tchains from every core\n");
1023                 return 1;
1024         }
1025         if (!strcmp(argv[1], "pcpu")) {
1026                 print_pcpu_chains();
1027         } else {
1028                 printk("Bad option\n");
1029                 return 1;
1030         }
1031         return 0;
1032 }
1033
1034 static void show_msr(struct hw_trapframe *unused, void *v)
1035 {
1036         int core = core_id();
1037         uint64_t val;
1038         uint32_t msr = *(uint32_t *)v;
1039         val = read_msr(msr);
1040         printk("%d: %08x: %016llx\n", core, msr, val);
1041 }
1042
1043 struct set {
1044         uint32_t msr;
1045         uint64_t val;
1046 };
1047
1048 static void set_msr(struct hw_trapframe *unused, void *v)
1049 {
1050         int core = core_id();
1051         struct set *s = v;
1052         uint32_t msr = s->msr;
1053         uint64_t val = s->val;
1054         write_msr(msr, val);
1055         val = read_msr(msr);
1056         printk("%d: %08x: %016llx\n", core, msr, val);
1057 }
1058
1059 int mon_msr(int argc, char **argv, struct hw_trapframe *hw_tf)
1060 {
1061 #ifndef CONFIG_X86
1062         cprintf("Not on this architecture\n");
1063         return 1;
1064 #else
1065         uint64_t val;
1066         uint32_t msr;
1067         if (argc < 2 || argc > 3) {
1068                 printk("Usage: msr register [value]\n");
1069                 return 1;
1070         }
1071         msr = strtoul(argv[1], 0, 16);
1072         handler_wrapper_t *w;
1073         smp_call_function_all(show_msr, &msr, &w);
1074         smp_call_wait(w);
1075
1076         if (argc < 3)
1077                 return 0;
1078         /* somewhat bogus on 32 bit. */
1079         val = strtoul(argv[2], 0, 16);
1080
1081         struct set set;
1082         set.msr = msr;
1083         set.val = val;
1084         smp_call_function_all(set_msr, &set, &w);
1085         smp_call_wait(w);
1086         return 0;
1087 #endif
1088 }
1089
1090 int mon_db(int argc, char **argv, struct hw_trapframe *hw_tf)
1091 {
1092         if (argc < 2) {
1093                 printk("Usage: db OPTION\n");
1094                 printk("\tsem: print all semaphore info\n");
1095                 printk("\taddr: for PID lookup ADDR's file/vmr info\n");
1096                 return 1;
1097         }
1098         if (!strcmp(argv[1], "sem")) {
1099                 print_all_sem_info();
1100         } else if (!strcmp(argv[1], "addr")) {
1101                 if (argc < 4) {
1102                         printk("Usage: db addr PID 0xADDR\n");
1103                         return 1;
1104                 }
1105                 debug_addr_pid(strtol(argv[2], 0, 10), strtol(argv[3], 0, 16));
1106         } else {
1107                 printk("Bad option\n");
1108                 return 1;
1109         }
1110         return 0;
1111 }
1112
1113 int mon_px(int argc, char **argv, struct hw_trapframe *hw_tf)
1114 {
1115         set_printx(2);
1116         printk("Printxing is now %sabled\n", printx_on ? "en" : "dis");
1117         return 0;
1118 }
1119
1120 /* Super hack.  Given a kernel hw_tf, we hack the RIP to smp_idle, then return
1121  * to it.  Any locks or other stuff being done is completely lost, so you could
1122  * deadlock.  This gets out of the "we're totall screwed, but don't want to
1123  * reboot right now", typically caused by screw-ups from the monitor. */
1124 int mon_kpfret(int argc, char **argv, struct hw_trapframe *hw_tf)
1125 {
1126         struct per_cpu_info *pcpui = &per_cpu_info[core_id()];
1127
1128         /* if monitor had a TF, try to use that */
1129         if (!hw_tf) {
1130                 if (argc < 2) {
1131                         printk("Usage: kpfret HW_TF\n");
1132                         return 1;
1133                 }
1134                 /* the hw_tf passed in is the one we got from monitor, which is 0 from
1135                  * panics. */
1136                 hw_tf = (struct hw_trapframe*)strtol(argv[1], 0, 16);
1137         }
1138
1139         if (!in_kernel(hw_tf)) {
1140                 printk("hw_tf %p was not a kernel tf!\n", hw_tf);
1141                 return -1;
1142         }
1143
1144 #ifdef CONFIG_X86
1145         hw_tf->tf_rip = (uintptr_t)smp_idle;
1146         dec_ktrap_depth(pcpui);
1147
1148         asm volatile("mov %0, %%rsp;"
1149                      "addq $0x10, %%rsp;"
1150                      "popq %%rax;"
1151                      "popq %%rbx;"
1152                      "popq %%rcx;"
1153                      "popq %%rdx;"
1154                      "popq %%rbp;"
1155                      "popq %%rsi;"
1156                      "popq %%rdi;"
1157                      "popq %%r8;"
1158                      "popq %%r9;"
1159                      "popq %%r10;"
1160                      "popq %%r11;"
1161                      "popq %%r12;"
1162                      "popq %%r13;"
1163                      "popq %%r14;"
1164                      "popq %%r15;"
1165                      "addq $0x10, %%rsp;"
1166                      "iretq;"
1167                                  : : "r"(hw_tf));
1168         assert(0);
1169 #else
1170         printk("KPF return not supported\n");
1171         return -1;
1172 #endif /* CONFIG_X86 */
1173 }
1174
1175 int mon_ks(int argc, char **argv, struct hw_trapframe *hw_tf)
1176 {
1177         if (argc < 2) {
1178 usage:
1179                 printk("Usage: ks OPTION\n");
1180                 printk("\tidles: show idle core map\n");
1181                 printk("\tdiag: scheduler diagnostic report\n");
1182                 printk("\tresources: show resources wanted/granted for all procs\n");
1183                 printk("\tsort: sorts the idlecoremap, 1..n\n");
1184                 printk("\tnc PCOREID: sets the next CG core allocated\n");
1185                 return 1;
1186         }
1187         if (!strcmp(argv[1], "idles")) {
1188                 print_idlecoremap();
1189         } else if (!strcmp(argv[1], "diag")) {
1190                 sched_diag();
1191         } else if (!strcmp(argv[1], "resources")) {
1192                 print_all_resources();
1193         } else if (!strcmp(argv[1], "sort")) {
1194                 sort_idles();
1195         } else if (!strcmp(argv[1], "nc")) {
1196                 if (argc != 3) {
1197                         printk("Need a pcore number.\n");
1198                         return 1;
1199                 }
1200                 next_core(strtol(argv[2], 0, 0));
1201         } else {
1202                 printk("Bad option %s\n", argv[1]);
1203                 goto usage;
1204         }
1205         return 0;
1206 }
1207
1208 int mon_gfp(int argc, char **argv, struct hw_trapframe *hw_tf)
1209 {
1210         size_t naddrpages = max_paddr / PGSIZE;
1211         spin_lock_irqsave(&colored_page_free_list_lock);
1212         printk("%9s %9s %9s\n", "start", "end", "size");
1213         for (int i = 0; i < naddrpages; i++) {
1214                 int j;
1215                 for (j = i; j < naddrpages; j++) {
1216                         if (!page_is_free(j))
1217                                 break;
1218                 }
1219                 if (j > i) {
1220                         printk("%9d %9d %9d\n", i, j, j - i);
1221                         i = j;
1222                 }
1223         }
1224         spin_unlock_irqsave(&colored_page_free_list_lock);
1225         return 0;
1226 }