Serialize printing during panic()
[akaros.git] / kern / src / monitor.c
1 // Simple command-line kernel monitor useful for
2 // controlling the kernel and exploring the system interactively.
3
4 #include <arch/arch.h>
5 #include <stab.h>
6 #include <smp.h>
7 #include <arch/console.h>
8
9 #include <stdio.h>
10 #include <string.h>
11 #include <assert.h>
12 #include <monitor.h>
13 #include <trap.h>
14 #include <pmap.h>
15 #include <kdebug.h>
16 #include <testing.h>
17 #include <manager.h>
18 #include <schedule.h>
19 #include <kdebug.h>
20 #include <syscall.h>
21 #include <kmalloc.h>
22 #include <elf.h>
23 #include <event.h>
24 #include <trap.h>
25 #include <time.h>
26 #include <percpu.h>
27
28 #include <ros/memlayout.h>
29 #include <ros/event.h>
30
31 #define CMDBUF_SIZE     80      // enough for one VGA text line
32
33 typedef struct command {
34         const char *name;
35         const char *desc;
36         // return -1 to force monitor to exit
37         int (*func)(int argc, char **argv, struct hw_trapframe *hw_tf);
38 } command_t;
39
40 static command_t commands[] = {
41         { "help", "Display this list of commands", mon_help },
42         { "kerninfo", "Display information about the kernel", mon_kerninfo },
43         { "backtrace", "Dump a backtrace", mon_backtrace },
44         { "bt", "Dump a backtrace", mon_backtrace },
45         { "reboot", "Take a ride to the South Bay", mon_reboot },
46         { "showmapping", "Shows VA->PA mappings", mon_showmapping},
47         { "sm", "Shows VA->PA mappings", mon_sm},
48         { "cpuinfo", "Prints CPU diagnostics", mon_cpuinfo},
49         { "ps", "Prints process list", mon_ps},
50         { "nanwan", "Meet Nanwan!!", mon_nanwan},
51         { "bin_run", "Create and run a program from /bin", mon_bin_run},
52         { "manager", "Run the manager", mon_manager},
53         { "procinfo", "Show information about processes", mon_procinfo},
54         { "pip", "Shorthand for procinfo pid", mon_pip},
55         { "kill", "Kills a process", mon_kill},
56         { "exit", "Leave the monitor", mon_exit},
57         { "e", "Leave the monitor", mon_exit},
58         { "kfunc", "Run a kernel function directly (!!!)", mon_kfunc},
59         { "notify", "Notify a process.  Vcoreid will skip their prefs", mon_notify},
60         { "measure", "Run a specific measurement", mon_measure},
61         { "trace", "Run some tracing functions", mon_trace},
62         { "monitor", "Run the monitor on another core", mon_monitor},
63         { "sh", "Try to run a shell (bash)", mon_shell},
64         { "bash", "Try to run a shell (bash)", mon_shell},
65         { "bb", "Try to run a shell (bash)", mon_shell},
66         { "alarm", "Alarm Diagnostics", mon_alarm},
67         { "msr", "read/write msr: msr msr [value]", mon_msr},
68         { "db", "Misc debugging", mon_db},
69         { "px", "Toggle printx", mon_px},
70         { "kpfret", "Attempt to idle after a kernel fault", mon_kpfret},
71         { "ks", "Kernel scheduler hacks", mon_ks},
72         { "coreinfo", "Print diagnostics for a core", mon_coreinfo},
73         { "hexdump", "Hexdump PID's memory (0 for kernel)", mon_hexdump},
74         { "hd", "Hexdump PID's memory (0 for kernel)", mon_hexdump},
75         { "pahexdump", "Hexdump physical memory", mon_pahexdump},
76         { "phd", "Hexdump physical memory", mon_pahexdump},
77 };
78 #define NCOMMANDS (sizeof(commands)/sizeof(commands[0]))
79
80 /***** Implementations of basic kernel monitor commands *****/
81
82 int mon_help(int argc, char **argv, struct hw_trapframe *hw_tf)
83 {
84         int i;
85
86         for (i = 0; i < NCOMMANDS; i++)
87                 cprintf("%s - %s\n", commands[i].name, commands[i].desc);
88         return 0;
89 }
90
91 int mon_ps(int argc, char** argv, struct hw_trapframe *hw_tf)
92 {
93         print_allpids();
94         return 0;
95 }
96
97 int mon_kerninfo(int argc, char **argv, struct hw_trapframe *hw_tf)
98 {
99         extern char _start[], etext[], end[];
100
101         cprintf("Special kernel symbols:\n");
102         cprintf("  _start %016x (virt)  %016x (phys)\n", _start, (uintptr_t)(_start - KERNBASE));
103         cprintf("  etext  %016x (virt)  %016x (phys)\n", etext, (uintptr_t)(etext - KERNBASE));
104         cprintf("  end    %016x (virt)  %016x (phys)\n", end, (uintptr_t)(end - KERNBASE));
105         cprintf("Kernel executable memory footprint: %dKB\n",
106                 (uint32_t)(end-_start+1023)/1024);
107         return 0;
108 }
109
110 static int __backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
111 {
112         uintptr_t pc, fp;
113         if (argc == 1) {
114                 backtrace();
115                 return 0;
116         }
117         if (argc != 3) {
118                 printk("Need either no arguments, or two (PC and FP) in hex\n");
119                 return 1;
120         }
121         pc = strtol(argv[1], 0, 16);
122         fp = strtol(argv[2], 0, 16);
123         printk("Backtrace from instruction %p, with frame pointer %p\n", pc, fp);
124         backtrace_frame(pc, fp);
125         return 0;
126 }
127
128 int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
129 {
130         return __backtrace(argc, argv, hw_tf);
131 }
132
133 int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
134 {
135         cprintf("[Scottish Accent]: She's goin' down, Cap'n!\n");
136         reboot();
137
138         // really, should never see this
139         cprintf("Sigh....\n");
140         return 0;
141 }
142
143 static int __showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
144 {
145         struct proc *p = NULL;
146         uintptr_t start;
147         size_t size;
148         pgdir_t pgdir;
149         pid_t pid;
150
151         if (argc < 3) {
152                 printk("Shows virtual -> physical mappings for a virt addr range.\n");
153                 printk("Usage: showmapping PID START_ADDR [END_ADDR]\n");
154                 printk("    PID == 0 for the boot pgdir\n");
155                 return 1;
156         }
157         pid = strtol(argv[1], 0, 10);
158         if (!pid) {
159                 pgdir = boot_pgdir;
160         } else {
161                 p = pid2proc(pid);
162                 if (!p) {
163                         printk("No proc with pid %d\n", pid);
164                         return 1;
165                 }
166                 pgdir = p->env_pgdir;
167         }
168         start = ROUNDDOWN(strtol(argv[2], 0, 16), PGSIZE);
169         size = (argc == 3) ? 1 : strtol(argv[3], 0, 16) - start;
170         if (size/PGSIZE > 512) {
171                 cprintf("Not going to do this for more than 512 items\n");
172                 return 1;
173         }
174         show_mapping(pgdir, start, size);
175         if (p)
176                 proc_decref(p);
177         return 0;
178 }
179
180 int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
181 {
182         return __showmapping(argc, argv, hw_tf);
183 }
184
185 int mon_sm(int argc, char **argv, struct hw_trapframe *hw_tf)
186 {
187         return __showmapping(argc, argv, hw_tf);
188 }
189
190 static spinlock_t print_info_lock = SPINLOCK_INITIALIZER_IRQSAVE;
191
192 static void print_info_handler(struct hw_trapframe *hw_tf, void *data)
193 {
194         uint64_t tsc = read_tsc();
195
196         spin_lock_irqsave(&print_info_lock);
197         cprintf("----------------------------\n");
198         cprintf("This is Core %d\n", core_id());
199         cprintf("Timestamp = %lld\n", tsc);
200 #ifdef CONFIG_X86
201         cprintf("Hardware core %d\n", hw_core_id());
202         cprintf("MTRR_DEF_TYPE = 0x%08x\n", read_msr(IA32_MTRR_DEF_TYPE));
203         cprintf("MTRR Phys0 Base = 0x%016llx, Mask = 0x%016llx\n",
204                 read_msr(0x200), read_msr(0x201));
205         cprintf("MTRR Phys1 Base = 0x%016llx, Mask = 0x%016llx\n",
206                 read_msr(0x202), read_msr(0x203));
207         cprintf("MTRR Phys2 Base = 0x%016llx, Mask = 0x%016llx\n",
208                 read_msr(0x204), read_msr(0x205));
209         cprintf("MTRR Phys3 Base = 0x%016llx, Mask = 0x%016llx\n",
210                 read_msr(0x206), read_msr(0x207));
211         cprintf("MTRR Phys4 Base = 0x%016llx, Mask = 0x%016llx\n",
212                 read_msr(0x208), read_msr(0x209));
213         cprintf("MTRR Phys5 Base = 0x%016llx, Mask = 0x%016llx\n",
214                 read_msr(0x20a), read_msr(0x20b));
215         cprintf("MTRR Phys6 Base = 0x%016llx, Mask = 0x%016llx\n",
216                 read_msr(0x20c), read_msr(0x20d));
217         cprintf("MTRR Phys7 Base = 0x%016llx, Mask = 0x%016llx\n",
218                 read_msr(0x20e), read_msr(0x20f));
219 #endif // CONFIG_X86
220         cprintf("----------------------------\n");
221         spin_unlock_irqsave(&print_info_lock);
222 }
223
224 static bool print_all_info(void)
225 {
226         cprintf("\nCORE 0 asking all cores to print info:\n");
227         smp_call_function_all(print_info_handler, NULL, 0);
228         cprintf("\nDone!\n");
229         return true;
230 }
231
232 int mon_cpuinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
233 {
234         cprintf("Number of Cores detected: %d\n", num_cores);
235         cprintf("Calling CPU's ID: 0x%08x\n", core_id());
236
237         if (argc < 2)
238                 smp_call_function_self(print_info_handler, NULL, 0);
239         else
240                 smp_call_function_single(strtol(argv[1], 0, 10),
241                                          print_info_handler, NULL, 0);
242         return 0;
243 }
244
245 int mon_manager(int argc, char** argv, struct hw_trapframe *hw_tf)
246 {
247         manager();
248         panic("should never get here");
249         return 0;
250 }
251
252 int mon_nanwan(int argc, char **argv, struct hw_trapframe *hw_tf)
253 {
254         /* Borrowed with love from http://www.geocities.com/SoHo/7373/zoo.htm
255          * (http://www.ascii-art.com/).  Slightly modified to make it 25 lines tall.
256          */
257         printk("\n");
258         printk("             .-.  .-.\n");
259         printk("             |  \\/  |\n");
260         printk("            /,   ,_  `'-.\n");
261         printk("          .-|\\   /`\\     '. \n");
262         printk("        .'  0/   | 0\\  \\_  `\".  \n");
263         printk("     .-'  _,/    '--'.'|#''---'\n");
264         printk("      `--'  |       /   \\#\n");
265         printk("            |      /     \\#\n");
266         printk("            \\     ;|\\    .\\#\n");
267         printk("            |' ' //  \\   ::\\# \n");
268         printk("            \\   /`    \\   ':\\#\n");
269         printk("             `\"`       \\..   \\#\n");
270         printk("                        \\::.  \\#\n");
271         printk("                         \\::   \\#\n");
272         printk("                          \\'  .:\\#\n");
273         printk("                           \\  :::\\#\n");
274         printk("                            \\  '::\\#\n");
275         printk("                             \\     \\#\n");
276         printk("                              \\:.   \\#\n");
277         printk("                               \\::   \\#\n");
278         printk("                                \\'   .\\#\n");
279         printk("                             jgs \\   ::\\#\n");
280         printk("                                  \\      \n");
281         return 0;
282 }
283
284 int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
285 {
286         if (argc < 2) {
287                 printk("Usage: bin_run FILENAME\n");
288                 return 1;
289         }
290         struct file_or_chan *program;
291         int retval = 0;
292         char buf[5 + MAX_FILENAME_SZ + 1] = "/bin/";    /* /bin/ + max + \0 */
293
294         strlcpy(buf, "/bin/", sizeof(buf));
295         if (strlcat(buf, argv[1], sizeof(buf)) > sizeof(buf)) {
296                 printk("Filename '%s' too long!\n", argv[1]);
297                 return 1;
298         }
299         program = foc_open(buf, O_EXEC | O_READ, 0);
300         if (!program) {
301                 printk("No such program!\n");
302                 return 1;
303         }
304         char **p_argv = kmalloc(sizeof(char*) * argc, 0);       /* bin_run's argc */
305         for (int i = 0; i < argc - 1; i++)
306                 p_argv[i] = argv[i + 1];
307         p_argv[argc - 1] = 0;
308         /* super ugly: we need to stash current, so that proc_create doesn't pick up
309          * on random processes running here and assuming they are the parent */
310         struct proc *old_cur = current;
311         current = 0;
312         struct proc *p = proc_create(program, p_argv, NULL);
313         current = old_cur;
314         kfree(p_argv);
315         proc_wakeup(p);
316         proc_decref(p); /* let go of the reference created in proc_create() */
317         foc_decref(program);
318         /* Make a scheduling decision.  You might not get the process you created,
319          * in the event there are others floating around that are runnable */
320         run_scheduler();
321         /* want to idle, so we un the process we just selected.  this is a bit
322          * hackish, but so is the monitor. */
323         smp_idle();
324         assert(0);
325         return 0;
326 }
327
328 int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
329 {
330         int verbosity = 0;
331
332         if (argc < 2) {
333                 printk("Usage: procinfo OPTION\n");
334                 printk("\tall: show all active pids\n");
335                 printk("\tpid NUM: show a lot of info for proc NUM\n");
336                 printk("\tunlock: unlock the lock for the ADDR (OMG!!!)\n");
337                 printk("\tkill NUM: destroy proc NUM\n");
338                 return 1;
339         }
340         if (!strcmp(argv[1], "all")) {
341                 print_allpids();
342         } else if (!strcmp(argv[1], "pid")) {
343                 if (argc < 3) {
344                         printk("Give me a pid number.\n");
345                         return 1;
346                 }
347                 if (argc >= 4)
348                         verbosity = strtol(argv[3], 0, 0);
349                 print_proc_info(strtol(argv[2], 0, 0), verbosity);
350         } else if (!strcmp(argv[1], "unlock")) {
351                 if (argc != 3) {
352                         printk("Gimme lock address!  Me want lock address!.\n");
353                         return 1;
354                 }
355                 spinlock_t *lock = (spinlock_t*)strtol(argv[2], 0, 16);
356                 if (!lock) {
357                         printk("Null address...\n");
358                         return 1;
359                 }
360                 spin_unlock(lock);
361         } else if (!strcmp(argv[1], "kill")) {
362                 if (argc != 3) {
363                         printk("Give me a pid number.\n");
364                         return 1;
365                 }
366                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
367                 if (!p) {
368                         printk("No such proc\n");
369                         return 1;
370                 }
371                 proc_destroy(p);
372                 proc_decref(p);
373         } else {
374                 printk("Bad option\n");
375                 return 1;
376         }
377         return 0;
378 }
379
380 int mon_pip(int argc, char **argv, struct hw_trapframe *hw_tf)
381 {
382         int verbosity = 0;
383
384         if (argc < 2) {
385                 printk("Give me a pid number.\n");
386                 return 1;
387         }
388         if (argc >= 3)
389                 verbosity = strtol(argv[2], 0, 0);
390         print_proc_info(strtol(argv[1], 0, 0), verbosity);
391         return 0;
392 }
393
394 int mon_kill(int argc, char **argv, struct hw_trapframe *hw_tf)
395 {
396         struct proc *p;
397
398         if (argc < 2) {
399                 printk("Usage: kill PID\n");
400                 return 1;
401         }
402         p = pid2proc(strtol(argv[1], 0, 0));
403         if (!p) {
404                 printk("No such proc\n");
405                 return 1;
406         }
407         p->exitcode = 1;        /* typical EXIT_FAILURE */
408         proc_destroy(p);
409         proc_decref(p);
410         return 0;
411 }
412
413 int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
414 {
415         return -1;
416 }
417
418 int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
419 {
420         long ret;
421         long (*func)(void *arg, ...);
422
423         if (argc < 2) {
424                 printk("Usage: kfunc FUNCTION [arg1] [arg2] [etc]\n");
425                 printk("Use 0x with hex arguments.  Can take 6 args.\n");
426                 return 1;
427         }
428         func = (void*)get_symbol_addr(argv[1]);
429         if (!func) {
430                 printk("Function not found.\n");
431                 return 1;
432         }
433         /* Not elegant, but whatever.  maybe there's a better syntax, or we can do
434          * it with asm magic. */
435         switch (argc) {
436         case 2: /* have to fake one arg */
437                 ret = func((void*)0);
438                 break;
439         case 3: /* the real first arg */
440                 ret = func((void*)strtol(argv[2], 0, 0));
441                 break;
442         case 4:
443                 ret = func((void*)strtol(argv[2], 0, 0),
444                                   strtol(argv[3], 0, 0));
445                 break;
446         case 5:
447                 ret = func((void*)strtol(argv[2], 0, 0),
448                                   strtol(argv[3], 0, 0),
449                                   strtol(argv[4], 0, 0));
450                 break;
451         case 6:
452                 ret = func((void*)strtol(argv[2], 0, 0),
453                                   strtol(argv[3], 0, 0),
454                                   strtol(argv[4], 0, 0),
455                                   strtol(argv[5], 0, 0));
456                 break;
457         case 7:
458                 ret = func((void*)strtol(argv[2], 0, 0),
459                                   strtol(argv[3], 0, 0),
460                                   strtol(argv[4], 0, 0),
461                                   strtol(argv[5], 0, 0),
462                                   strtol(argv[6], 0, 0));
463                 break;
464         case 8:
465                 ret = func((void*)strtol(argv[2], 0, 0),
466                                   strtol(argv[3], 0, 0),
467                                   strtol(argv[4], 0, 0),
468                                   strtol(argv[5], 0, 0),
469                                   strtol(argv[6], 0, 0),
470                                   strtol(argv[7], 0, 0));
471                 break;
472         default:
473                 printk("Bad number of arguments.\n");
474                 return -1;
475         }
476         printk("%s (might have) returned %p\n", argv[1], ret);
477         return 0;
478 }
479
480 /* Sending a vcoreid forces an event and an IPI/notification */
481 int mon_notify(int argc, char **argv, struct hw_trapframe *hw_tf)
482 {
483         struct proc *p;
484         uint32_t vcoreid;
485         struct event_msg msg = {0};
486
487         if (argc < 3) {
488                 printk("Usage: notify PID NUM [VCOREID]\n");
489                 return 1;
490         }
491         p = pid2proc(strtol(argv[1], 0, 0));
492         if (!p) {
493                 printk("No such proc\n");
494                 return 1;
495         }
496         msg.ev_type = strtol(argv[2], 0, 0);
497         if (argc == 4) {
498                 vcoreid = strtol(argv[3], 0, 0);
499                 /* This will go to the private mbox */
500                 post_vcore_event(p, &msg, vcoreid, EVENT_VCORE_PRIVATE);
501                 proc_notify(p, vcoreid);
502         } else {
503                 /* o/w, try and do what they want */
504                 send_kernel_event(p, &msg, 0);
505         }
506         proc_decref(p);
507         return 0;
508 }
509
510 /* Micro-benchmarky Measurements.  This is really fragile code that probably
511  * won't work perfectly, esp as the kernel evolves. */
512 int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
513 {
514         uint64_t begin = 0, diff = 0;
515         uint32_t end_refcnt = 0;
516
517         if (argc < 2) {
518                 printk("Usage: measure OPTION\n");
519                 printk("\tkill PID : kill proc PID\n");
520                 printk("\tpreempt PID : preempt proc PID (no delay)\n");
521                 printk("\tpreempt PID [pcore] : preempt PID's pcore (no delay)\n");
522                 printk("\tpreempt-warn PID : warn-preempt proc PID (pending)\n");
523                 printk("\tpreempt-warn PID [pcore] : warn-preempt proc PID's pcore\n");
524                 printk("\tpreempt-raw PID : raw-preempt proc PID\n");
525                 printk("\tpreempt-raw PID [pcore] : raw-preempt proc PID's pcore\n");
526                 return 1;
527         }
528         if (!strcmp(argv[1], "kill")) {
529                 if (argc < 3) {
530                         printk("Give me a pid number.\n");
531                         return 1;
532                 }
533                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
534                 if (!p) {
535                         printk("No such proc\n");
536                         return 1;
537                 }
538                 begin = start_timing();
539 #ifdef CONFIG_APPSERVER
540                 printk("Warning: this will be inaccurate due to the appserver.\n");
541                 end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores - 1;
542 #endif /* CONFIG_APPSERVER */
543                 proc_destroy(p);
544                 proc_decref(p);
545 #ifdef CONFIG_APPSERVER
546                 /* Won't be that accurate, since it's not actually going through the
547                  * __proc_free() path. */
548                 spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
549 #else
550                 /* this is a little ghetto. it's not fully free yet, but we are also
551                  * slowing it down by messing with it, esp with the busy waiting on a
552                  * hyperthreaded core. */
553                 spin_on(p->env_cr3);
554 #endif /* CONFIG_APPSERVER */
555                 /* No noticeable difference using stop_timing instead of read_tsc() */
556                 diff = stop_timing(begin);
557         } else if (!strcmp(argv[1], "preempt")) {
558                 if (argc < 3) {
559                         printk("Give me a pid number.\n");
560                         return 1;
561                 }
562                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
563                 if (!p) {
564                         printk("No such proc\n");
565                         return 1;
566                 }
567                 if (argc == 4) { /* single core being preempted, warned but no delay */
568                         uint32_t pcoreid = strtol(argv[3], 0, 0);
569                         begin = start_timing();
570                         if (proc_preempt_core(p, pcoreid, 1000000)) {
571                                 __sched_put_idle_core(p, pcoreid);
572                                 /* done when unmapped (right before abandoning) */
573                                 spin_on(p->procinfo->pcoremap[pcoreid].valid);
574                         } else {
575                                 printk("Core %d was not mapped to proc\n", pcoreid);
576                         }
577                         diff = stop_timing(begin);
578                 } else { /* preempt all cores, warned but no delay */
579                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
580                         begin = start_timing();
581                         proc_preempt_all(p, 1000000);
582                         /* a little ghetto, implies no one is using p */
583                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
584                         diff = stop_timing(begin);
585                 }
586                 proc_decref(p);
587         } else if (!strcmp(argv[1], "preempt-warn")) {
588                 if (argc < 3) {
589                         printk("Give me a pid number.\n");
590                         return 1;
591                 }
592                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
593                 if (!p) {
594                         printk("No such proc\n");
595                         return 1;
596                 }
597                 printk("Careful: if this hangs, then the process isn't responding.\n");
598                 if (argc == 4) { /* single core being preempted-warned */
599                         uint32_t pcoreid = strtol(argv[3], 0, 0);
600                         spin_lock(&p->proc_lock);
601                         uint32_t vcoreid = p->procinfo->pcoremap[pcoreid].vcoreid;
602                         if (!p->procinfo->pcoremap[pcoreid].valid) {
603                                 printk("Pick a mapped pcore\n");
604                                 spin_unlock(&p->proc_lock);
605                                 return 1;
606                         }
607                         begin = start_timing();
608                         __proc_preempt_warn(p, vcoreid, 1000000); // 1 sec
609                         spin_unlock(&p->proc_lock);
610                         /* done when unmapped (right before abandoning) */
611                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
612                         diff = stop_timing(begin);
613                 } else { /* preempt-warn all cores */
614                         printk("Warning, this won't work if they can't yield their "
615                                "last vcore, will stop at 1!\n");
616                         spin_lock(&p->proc_lock);
617                         begin = start_timing();
618                         __proc_preempt_warnall(p, 1000000);
619                         spin_unlock(&p->proc_lock);
620                         /* target cores do the unmapping / changing of the num_vcores */
621                         spin_on(p->procinfo->num_vcores > 1);
622                         diff = stop_timing(begin);
623                 }
624                 proc_decref(p);
625         } else if (!strcmp(argv[1], "preempt-raw")) {
626                 if (argc < 3) {
627                         printk("Give me a pid number.\n");
628                         return 1;
629                 }
630                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
631                 if (!p) {
632                         printk("No such proc\n");
633                         return 1;
634                 }
635                 if (argc == 4) { /* single core preempted, no warning or waiting */
636                         uint32_t pcoreid = strtol(argv[3], 0, 0);
637                         spin_lock(&p->proc_lock);
638                         if (!p->procinfo->pcoremap[pcoreid].valid) {
639                                 printk("Pick a mapped pcore\n");
640                                 spin_unlock(&p->proc_lock);
641                                 return 1;
642                         }
643                         begin = start_timing();
644                         __proc_preempt_core(p, pcoreid);
645                         if (!p->procinfo->num_vcores)
646                                 __proc_set_state(p, PROC_RUNNABLE_M);
647                         spin_unlock(&p->proc_lock);
648                         /* ghetto, since the ksched should be calling all of this */
649                         __sched_put_idle_core(p, pcoreid);
650                         /* done when unmapped (right before abandoning) */
651                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
652                         diff = stop_timing(begin);
653                 } else { /* preempt all cores, no warning or waiting */
654                         spin_lock(&p->proc_lock);
655                         uint32_t pc_arr[p->procinfo->num_vcores];
656                         uint32_t num_revoked;
657                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
658                         begin = start_timing();
659                         num_revoked = __proc_preempt_all(p, pc_arr);
660                         __proc_set_state(p, PROC_RUNNABLE_M);
661                         spin_unlock(&p->proc_lock);
662                         if (num_revoked)
663                                 __sched_put_idle_cores(p, pc_arr, num_revoked);
664                         /* a little ghetto, implies no one else is using p */
665                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
666                         diff = stop_timing(begin);
667                 }
668                 proc_decref(p);
669         } else {
670                 printk("Bad option\n");
671                 return 1;
672         }
673         printk("[Tired Giraffe Accent] Took %llu usec (%llu nsec) to finish.\n",
674                tsc2usec(diff), tsc2nsec(diff));
675         return 0;
676 }
677
678 static bool mon_verbose_trace = FALSE;
679 static DEFINE_PERCPU(bool, mon_nmi_trace);
680
681 static void emit_hwtf_backtrace(struct hw_trapframe *hw_tf)
682 {
683         if (mon_verbose_trace) {
684                 print_trapframe(hw_tf);
685                 backtrace_hwtf(hw_tf);
686         }
687         printk("Core %d is at %p (%s)\n", core_id(), get_hwtf_pc(hw_tf),
688                get_fn_name(get_hwtf_pc(hw_tf)));
689 }
690
691 static void emit_vmtf_backtrace(struct vm_trapframe *vm_tf)
692 {
693         if (mon_verbose_trace)
694                 print_vmtrapframe(vm_tf);
695         printk("Core %d is at %p\n", core_id(), get_vmtf_pc(vm_tf));
696 }
697
698 /* This is dangerous and could cause a deadlock, since it runs in NMI context.
699  * It's only for monitor debugging, so YMMV.  We pass the type since the kernel
700  * doesn't deal in contexts (yet) */
701 void emit_monitor_backtrace(int type, void *tf)
702 {
703         struct per_cpu_info *pcpui = &per_cpu_info[core_id()];
704
705         if (!PERCPU_VAR(mon_nmi_trace))
706                 return;
707         /* To prevent a spew of output during a lot of perf NMIs, we'll turn off the
708          * monitor output as soon as any NMI hits our core. */
709         PERCPU_VAR(mon_nmi_trace) = FALSE;
710         /* Temporarily disable deadlock detection when we print.  We could
711          * deadlock if we were printing when we NMIed. */
712         pcpui->__lock_checking_enabled--;
713         if (type == ROS_HW_CTX)
714                 emit_hwtf_backtrace((struct hw_trapframe*)tf);
715         else
716                 emit_vmtf_backtrace((struct vm_trapframe*)tf);
717         print_kmsgs(core_id());
718         pcpui->__lock_checking_enabled++;
719 }
720
721
722 int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
723 {
724         int core;
725         if (argc < 2) {
726                 printk("Usage: trace OPTION\n");
727                 printk("\tsyscall start [silent (0 or non-zero, NOT the word silent)] [pid]: starts tracing\n");
728                 printk("\tsyscall stop: stops tracing.\n");
729                 printk("\tcoretf COREID: prints PC, -1 for all cores, verbose => TF\n");
730                 printk("\tpcpui [type [coreid]]: runs pcpui trace ring handlers\n");
731                 printk("\tpcpui-reset [noclear]: resets/clears pcpui trace ring\n");
732                 printk("\tverbose: toggles verbosity, depends on trace command\n");
733                 return 1;
734         }
735         if (!strcmp(argv[1], "syscall")) {
736                 if (argc < 3) {
737                         printk("Need a start or stop.\n");
738                         return 1;
739                 }
740                 if (!strcmp(argv[2], "start")) {
741                         systrace_loud = TRUE;
742                 } else if (!strcmp(argv[2], "stop")) {
743                         systrace_loud = FALSE;
744                 } else {
745                         printk("Need a start or stop.\n");
746                         return 1;
747                 }
748         } else if (!strcmp(argv[1], "coretf")) {
749                 if (argc != 3) {
750                         printk("Need a coreid, fool.\n");
751                         return 1;
752                 }
753                 core = strtol(argv[2], 0, 0);
754                 if (core < 0) {
755                         printk("Sending NMIs to all cores:\n");
756                         for (int i = 0; i < num_cores; i++) {
757                                 _PERCPU_VAR(mon_nmi_trace, i) = TRUE;
758                                 send_nmi(i);
759                                 udelay(1000000);
760                         }
761                 } else {
762                         printk("Sending NMI core %d:\n", core);
763                         if (core >= num_cores) {
764                                 printk("No such core!  Maybe it's in another cell...\n");
765                                 return 1;
766                         }
767                         _PERCPU_VAR(mon_nmi_trace, core) = TRUE;
768                         send_nmi(core);
769                 }
770                 udelay(1000000);
771         } else if (!strcmp(argv[1], "pcpui")) {
772                 int pcpui_type, pcpui_coreid;
773                 if (argc >= 3)
774                         pcpui_type = strtol(argv[2], 0, 0);
775                 else
776                         pcpui_type = 0;
777                 printk("\nRunning PCPUI Trace Ring handlers for type %d\n", pcpui_type);
778                 if (argc >= 4) {
779                         pcpui_coreid = strtol(argv[3], 0, 0);
780                         pcpui_tr_foreach(pcpui_coreid, pcpui_type);
781                 } else {
782                         pcpui_tr_foreach_all(pcpui_type);
783                 }
784         } else if (!strcmp(argv[1], "pcpui-reset")) {
785                 if (argc >= 3) {
786                         printk("\nResetting all PCPUI Trace Rings\n");
787                         pcpui_tr_reset_all();
788                 } else {
789                         printk("\nResetting and clearing all PCPUI Trace Rings\n");
790                         pcpui_tr_reset_and_clear_all();
791                 }
792         } else if (!strcmp(argv[1], "verbose")) {
793                 if (mon_verbose_trace) {
794                         printk("Turning trace verbosity off\n");
795                         mon_verbose_trace = FALSE;
796                 } else {
797                         printk("Turning trace verbosity on\n");
798                         mon_verbose_trace = TRUE;
799                 }
800         } else if (!strcmp(argv[1], "opt2")) {
801                 if (argc != 3) {
802                         printk("ERRRRRRRRRR.\n");
803                         return 1;
804                 }
805                 print_proc_info(strtol(argv[2], 0, 0), 0);
806         } else {
807                 printk("Bad option\n");
808                 return 1;
809         }
810         return 0;
811 }
812
813 int mon_monitor(int argc, char **argv, struct hw_trapframe *hw_tf)
814 {
815         if (argc < 2) {
816                 printk("Usage: monitor COREID\n");
817                 return 1;
818         }
819         uint32_t core = strtol(argv[1], 0, 0);
820         if (core >= num_cores) {
821                 printk("No such core!  Maybe it's in another cell...\n");
822                 return 1;
823         }
824         send_kernel_message(core, __run_mon, 0, 0, 0, KMSG_ROUTINE);
825         return 0;
826 }
827
828 /***** Kernel monitor command interpreter *****/
829
830 #define WHITESPACE "\t\r\n "
831 #define MAXARGS 16
832
833
834 int onecmd(int argc, char *argv[], struct hw_trapframe *hw_tf) {
835         int i;
836         if (!argc)
837                 return -1;
838         for (i = 0; i < NCOMMANDS; i++) {
839                 if (strcmp(argv[0], commands[i].name) == 0)
840                         return commands[i].func(argc, argv, hw_tf);
841         }
842         return -1;
843 }
844
845 void __run_mon(uint32_t srcid, long a0, long a1, long a2)
846 {
847         monitor(0);
848 }
849
850 static int runcmd(char *real_buf, struct hw_trapframe *hw_tf) {
851         char * buf = real_buf;
852         int argc;
853         char *argv[MAXARGS];
854         int i;
855
856         // Parse the command buffer into whitespace-separated arguments
857         argc = 0;
858         argv[argc] = 0;
859         /* Discard initial 'm ', which is a common mistake when using 'm' a lot */
860         if ((buf[0] == 'm') && (buf[1] == ' '))
861                 buf += 2;
862         while (1) {
863                 // gobble whitespace
864                 while (*buf && strchr(WHITESPACE, *buf))
865                         *buf++ = 0;
866                 if (*buf == 0)
867                         break;
868
869                 // save and scan past next arg
870                 if (argc == MAXARGS-1) {
871                         cprintf("Too many arguments (max %d)\n", MAXARGS);
872                         return 0;
873                 }
874                 //This will get fucked at runtime..... in the ASS
875                 argv[argc++] = buf;
876                 while (*buf && !strchr(WHITESPACE, *buf))
877                         buf++;
878         }
879         argv[argc] = 0;
880
881         // Lookup and invoke the command
882         if (argc == 0)
883                 return 0;
884         for (i = 0; i < NCOMMANDS; i++) {
885                 if (strcmp(argv[0], commands[i].name) == 0)
886                         return commands[i].func(argc, argv, hw_tf);
887         }
888         cprintf("Unknown command '%s'\n", argv[0]);
889         return 0;
890 }
891
892 void monitor(struct hw_trapframe *hw_tf)
893 {
894         #define MON_CMD_LENGTH 256
895         char buf[MON_CMD_LENGTH];
896         int cnt;
897         int coreid = core_id_early();
898
899         /* they are always disabled, since we have this irqsave lock */
900         if (irq_is_enabled())
901                 printk("Entering Nanwan's Dungeon on Core %d (Ints on):\n", coreid);
902         else
903                 printk("Entering Nanwan's Dungeon on Core %d (Ints off):\n", coreid);
904         printk("Type 'help' for a list of commands.\n");
905
906         if (hw_tf != NULL)
907                 print_trapframe(hw_tf);
908
909         while (1) {
910                 /* on occasion, the kernel monitor can migrate (like if you run
911                  * something that blocks / syncs and wakes up on another core) */
912                 cmb();
913                 cnt = readline(buf, MON_CMD_LENGTH, "ROS(Core %d)> ", core_id_early());
914                 if (cnt > 0) {
915                         buf[cnt] = 0;
916                         if (runcmd(buf, hw_tf) < 0)
917                                 break;
918                 }
919         }
920 }
921
922 int mon_shell(int argc, char **argv, struct hw_trapframe *hw_tf)
923 {
924         char *l_argv[2] = {"/bin/bash", "bash"};
925         return mon_bin_run(2, l_argv, hw_tf);
926 }
927
928 int mon_alarm(int argc, char **argv, struct hw_trapframe *hw_tf)
929 {
930         if (argc < 2) {
931                 printk("Usage: alarm OPTION\n");
932                 printk("\tpcpu: print full alarm tchains from every core\n");
933                 return 1;
934         }
935         if (!strcmp(argv[1], "pcpu")) {
936                 print_pcpu_chains();
937         } else {
938                 printk("Bad option\n");
939                 return 1;
940         }
941         return 0;
942 }
943
944 static void show_msr(struct hw_trapframe *unused, void *v)
945 {
946         int core = core_id();
947         uint64_t val;
948         uint32_t msr = *(uint32_t *)v;
949         val = read_msr(msr);
950         printk("%d: %08x: %016llx\n", core, msr, val);
951 }
952
953 struct set {
954         uint32_t msr;
955         uint64_t val;
956 };
957
958 static void set_msr(struct hw_trapframe *unused, void *v)
959 {
960         int core = core_id();
961         struct set *s = v;
962         uint32_t msr = s->msr;
963         uint64_t val = s->val;
964         write_msr(msr, val);
965         val = read_msr(msr);
966         printk("%d: %08x: %016llx\n", core, msr, val);
967 }
968
969 int mon_msr(int argc, char **argv, struct hw_trapframe *hw_tf)
970 {
971 #ifndef CONFIG_X86
972         cprintf("Not on this architecture\n");
973         return 1;
974 #else
975         uint64_t val;
976         uint32_t msr;
977         if (argc < 2 || argc > 3) {
978                 printk("Usage: msr register [value]\n");
979                 return 1;
980         }
981         msr = strtoul(argv[1], 0, 16);
982         handler_wrapper_t *w;
983         smp_call_function_all(show_msr, &msr, &w);
984         smp_call_wait(w);
985
986         if (argc < 3)
987                 return 0;
988         /* somewhat bogus on 32 bit. */
989         val = strtoul(argv[2], 0, 16);
990
991         struct set set;
992         set.msr = msr;
993         set.val = val;
994         smp_call_function_all(set_msr, &set, &w);
995         smp_call_wait(w);
996         return 0;
997 #endif
998 }
999
1000 int mon_db(int argc, char **argv, struct hw_trapframe *hw_tf)
1001 {
1002         pid_t pid = -1;
1003
1004         if (argc < 2) {
1005                 printk("Usage: db OPTION\n");
1006                 printk("\tsem [PID]: print all semaphore info\n");
1007                 printk("\taddr PID 0xADDR: for PID lookup ADDR's file/vmr info\n");
1008                 return 1;
1009         }
1010         if (!strcmp(argv[1], "sem")) {
1011                 if (argc > 2)
1012                         pid = strtol(argv[2], 0, 0);
1013                 print_all_sem_info(pid);
1014         } else if (!strcmp(argv[1], "addr")) {
1015                 if (argc < 4) {
1016                         printk("Usage: db addr PID 0xADDR\n");
1017                         return 1;
1018                 }
1019                 debug_addr_pid(strtol(argv[2], 0, 10), strtol(argv[3], 0, 16));
1020         } else {
1021                 printk("Bad option\n");
1022                 return 1;
1023         }
1024         return 0;
1025 }
1026
1027 int mon_px(int argc, char **argv, struct hw_trapframe *hw_tf)
1028 {
1029         pid_t pid = 0;
1030         struct proc *p;
1031
1032         if (argc == 2)
1033                 pid = strtol(argv[1], 0, 0);
1034         if (!pid) {
1035                 set_printx(2);
1036                 printk("Printxing is now %sabled\n", printx_on ? "en" : "dis");
1037                 return 0;
1038         }
1039         p = pid2proc(pid);
1040         if (!p) {
1041                 printk("No proc with pid %d\n", pid);
1042                 return 1;
1043         }
1044         p->procdata->printx_on = !p->procdata->printx_on;
1045         proc_decref(p);
1046         return 0;
1047 }
1048
1049 /* Super hack.  Given a kernel hw_tf, we hack the RIP to smp_idle, then return
1050  * to it.  Any locks or other stuff being done is completely lost, so you could
1051  * deadlock.  This gets out of the "we're totall screwed, but don't want to
1052  * reboot right now", typically caused by screw-ups from the monitor. */
1053 int mon_kpfret(int argc, char **argv, struct hw_trapframe *hw_tf)
1054 {
1055         struct per_cpu_info *pcpui = &per_cpu_info[core_id()];
1056
1057         /* if monitor had a TF, try to use that */
1058         if (!hw_tf) {
1059                 if (argc < 2) {
1060                         printk("Usage: kpfret HW_TF\n");
1061                         return 1;
1062                 }
1063                 /* the hw_tf passed in is the one we got from monitor, which is 0 from
1064                  * panics. */
1065                 hw_tf = (struct hw_trapframe*)strtol(argv[1], 0, 16);
1066         }
1067
1068         if (!in_kernel(hw_tf)) {
1069                 printk("hw_tf %p was not a kernel tf!\n", hw_tf);
1070                 return -1;
1071         }
1072
1073 #ifdef CONFIG_X86
1074         hw_tf->tf_rip = (uintptr_t)smp_idle;
1075         dec_ktrap_depth(pcpui);
1076
1077         asm volatile("mov %0, %%rsp;"
1078                      "addq $0x10, %%rsp;"
1079                      "popq %%rax;"
1080                      "popq %%rbx;"
1081                      "popq %%rcx;"
1082                      "popq %%rdx;"
1083                      "popq %%rbp;"
1084                      "popq %%rsi;"
1085                      "popq %%rdi;"
1086                      "popq %%r8;"
1087                      "popq %%r9;"
1088                      "popq %%r10;"
1089                      "popq %%r11;"
1090                      "popq %%r12;"
1091                      "popq %%r13;"
1092                      "popq %%r14;"
1093                      "popq %%r15;"
1094                      "addq $0x10, %%rsp;"
1095                      "iretq;"
1096                                  : : "r"(hw_tf));
1097         assert(0);
1098 #else
1099         printk("KPF return not supported\n");
1100         return -1;
1101 #endif /* CONFIG_X86 */
1102 }
1103
1104 int mon_ks(int argc, char **argv, struct hw_trapframe *hw_tf)
1105 {
1106         if (argc < 2) {
1107 usage:
1108                 printk("Usage: ks OPTION\n");
1109                 printk("\tidles: show idle core map\n");
1110                 printk("\tdiag: scheduler diagnostic report\n");
1111                 printk("\tresources: show resources wanted/granted for all procs\n");
1112                 printk("\tsort: sorts the idlecoremap, 1..n\n");
1113                 printk("\tnc PCOREID: sets the next CG core allocated\n");
1114                 return 1;
1115         }
1116         if (!strcmp(argv[1], "idles")) {
1117                 print_idle_core_map();
1118         } else if (!strcmp(argv[1], "diag")) {
1119                 sched_diag();
1120         } else if (!strcmp(argv[1], "resources")) {
1121                 print_all_resources();
1122         } else if (!strcmp(argv[1], "sort")) {
1123                 sort_idle_cores();
1124         } else if (!strcmp(argv[1], "nc")) {
1125                 if (argc != 3) {
1126                         printk("Need a pcore number.\n");
1127                         return 1;
1128                 }
1129                 next_core_to_alloc(strtol(argv[2], 0, 0));
1130         } else {
1131                 printk("Bad option %s\n", argv[1]);
1132                 goto usage;
1133         }
1134         return 0;
1135 }
1136
1137 /* Prints info about a core.  Optional first arg == coreid. */
1138 int mon_coreinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
1139 {
1140         struct per_cpu_info *pcpui;
1141         struct kthread *kth;
1142         int coreid = core_id();
1143
1144         if (argc >= 2)
1145                 coreid = strtol(argv[1], 0, 0);
1146         pcpui = &per_cpu_info[coreid];
1147         printk("Core %d:\n\tcur_proc %d\n\towning proc %d, owning vc %d\n",
1148                coreid, pcpui->cur_proc ? pcpui->cur_proc->pid : 0,
1149                pcpui->owning_proc ? pcpui->owning_proc->pid : 0,
1150                pcpui->owning_vcoreid != 0xdeadbeef ? pcpui->owning_vcoreid : 0);
1151         kth = pcpui->cur_kthread;
1152         if (kth) {
1153                 /* kth->proc is only used when the kthread is sleeping.  when it's
1154                  * running, we care about cur_proc.  if we're here, proc should be 0
1155                  * unless the kth is concurrently sleeping (we called this remotely) */
1156                 printk("\tkthread %p (%s), sysc %p (%d)\n", kth, kth->name,
1157                        kth->sysc, kth->sysc ? kth->sysc->num : -1);
1158         } else {
1159                 /* Can happen during early boot */
1160                 printk("\tNo kthread!\n");
1161         }
1162         return 0;
1163 }
1164
1165 int mon_hexdump(int argc, char **argv, struct hw_trapframe *hw_tf)
1166 {
1167         struct proc *p = NULL;
1168         uintptr_t switch_state;
1169         pid_t pid;
1170         uintptr_t start;
1171         size_t len;
1172
1173         assert(argc >= 1);
1174         if (argc < 4) {
1175                 printk("Usage: %s PID ADDR LEN\n", argv[0]);
1176                 printk("    PID == 0 for kernel / don't care\n");
1177                 return 1;
1178         }
1179         pid = strtol(argv[1], 0, 0);
1180         start = strtoul(argv[2], 0, 0);
1181         len = strtoul(argv[3], 0, 0);
1182         if (pid) {
1183                 p = pid2proc(pid);
1184                 if (!p) {
1185                         printk("No proc with pid %d\n", pid);
1186                         return 1;
1187                 }
1188                 switch_state = switch_to(p);
1189         }
1190         hexdump((void*)start, len);
1191         if (p) {
1192                 switch_back(p, switch_state);
1193                 proc_decref(p);
1194         }
1195         return 0;
1196 }
1197
1198 int mon_pahexdump(int argc, char **argv, struct hw_trapframe *hw_tf)
1199 {
1200         uintptr_t start;
1201         size_t len;
1202
1203         assert(argc >= 1);
1204         if (argc < 3) {
1205                 printk("Usage: %s PHYS_ADDR LEN\n", argv[0]);
1206                 return 1;
1207         }
1208         start = strtoul(argv[1], 0, 0);
1209         len = strtoul(argv[2], 0, 0);
1210         pahexdump(start, len);
1211         return 0;
1212 }