Rename RCU CB context to 'cannot block' context
[akaros.git] / kern / src / monitor.c
1 // Simple command-line kernel monitor useful for
2 // controlling the kernel and exploring the system interactively.
3
4 #include <arch/arch.h>
5 #include <smp.h>
6 #include <arch/console.h>
7
8 #include <stdio.h>
9 #include <string.h>
10 #include <assert.h>
11 #include <monitor.h>
12 #include <trap.h>
13 #include <pmap.h>
14 #include <kdebug.h>
15 #include <testing.h>
16 #include <manager.h>
17 #include <schedule.h>
18 #include <kdebug.h>
19 #include <syscall.h>
20 #include <kmalloc.h>
21 #include <elf.h>
22 #include <event.h>
23 #include <trap.h>
24 #include <time.h>
25 #include <percpu.h>
26 #include <kprof.h>
27
28 #include <ros/memlayout.h>
29 #include <ros/event.h>
30
31 #define CMDBUF_SIZE     80      // enough for one VGA text line
32
33 typedef struct command {
34         const char *name;
35         const char *desc;
36         // return -1 to force monitor to exit
37         int (*func)(int argc, char **argv, struct hw_trapframe *hw_tf);
38 } command_t;
39
40 static command_t commands[] = {
41         { "help", "Display this list of commands", mon_help },
42         { "kerninfo", "Display information about the kernel", mon_kerninfo },
43         { "backtrace", "Dump a backtrace", mon_backtrace },
44         { "bt", "Dump a backtrace", mon_backtrace },
45         { "reboot", "Take a ride to the South Bay", mon_reboot },
46         { "showmapping", "Shows VA->PA mappings", mon_showmapping},
47         { "sm", "Shows VA->PA mappings", mon_sm},
48         { "cpuinfo", "Prints CPU diagnostics", mon_cpuinfo},
49         { "ps", "Prints process list", mon_ps},
50         { "nanwan", "Meet Nanwan!!", mon_nanwan},
51         { "bin_run", "Create and run a program from /bin", mon_bin_run},
52         { "manager", "Run the manager", mon_manager},
53         { "procinfo", "Show information about processes", mon_procinfo},
54         { "pip", "Shorthand for procinfo pid", mon_pip},
55         { "kill", "Kills a process", mon_kill},
56         { "exit", "Leave the monitor", mon_exit},
57         { "e", "Leave the monitor", mon_exit},
58         { "kfunc", "Run a kernel function directly (!!!)", mon_kfunc},
59         { "notify", "Notify a process.  Vcoreid will skip their prefs", mon_notify},
60         { "measure", "Run a specific measurement", mon_measure},
61         { "trace", "Run some tracing functions", mon_trace},
62         { "monitor", "Run the monitor on another core", mon_monitor},
63         { "sh", "Try to run a shell (bash)", mon_shell},
64         { "bash", "Try to run a shell (bash)", mon_shell},
65         { "bb", "Try to run a shell (bash)", mon_shell},
66         { "alarm", "Alarm Diagnostics", mon_alarm},
67         { "msr", "read/write msr: msr msr [value]", mon_msr},
68         { "db", "Misc debugging", mon_db},
69         { "px", "Toggle printx", mon_px},
70         { "kpfret", "Attempt to idle after a kernel fault", mon_kpfret},
71         { "ks", "Kernel scheduler hacks", mon_ks},
72         { "coreinfo", "Print diagnostics for a core", mon_coreinfo},
73         { "hexdump", "Hexdump PID's memory (0 for kernel)", mon_hexdump},
74         { "hd", "Hexdump PID's memory (0 for kernel)", mon_hexdump},
75         { "pahexdump", "Hexdump physical memory", mon_pahexdump},
76         { "phd", "Hexdump physical memory", mon_pahexdump},
77         { "dmesg", "Dump the dmesg buffer", mon_dmesg},
78 };
79 #define NCOMMANDS (sizeof(commands)/sizeof(commands[0]))
80
81 /***** Implementations of basic kernel monitor commands *****/
82
83 int mon_help(int argc, char **argv, struct hw_trapframe *hw_tf)
84 {
85         int i;
86
87         for (i = 0; i < NCOMMANDS; i++)
88                 cprintf("%s - %s\n", commands[i].name, commands[i].desc);
89         return 0;
90 }
91
92 int mon_ps(int argc, char** argv, struct hw_trapframe *hw_tf)
93 {
94         print_allpids();
95         return 0;
96 }
97
98 int mon_kerninfo(int argc, char **argv, struct hw_trapframe *hw_tf)
99 {
100         extern char _start[], etext[], end[];
101
102         cprintf("Special kernel symbols:\n");
103         cprintf("  _start %016x (virt)  %016x (phys)\n", _start, (uintptr_t)(_start - KERNBASE));
104         cprintf("  etext  %016x (virt)  %016x (phys)\n", etext, (uintptr_t)(etext - KERNBASE));
105         cprintf("  end    %016x (virt)  %016x (phys)\n", end, (uintptr_t)(end - KERNBASE));
106         cprintf("Kernel executable memory footprint: %dKB\n",
107                 (uint32_t)(end-_start+1023)/1024);
108         return 0;
109 }
110
111 static int __backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
112 {
113         uintptr_t pc, fp;
114         if (argc == 1) {
115                 backtrace();
116                 return 0;
117         }
118         if (argc != 3) {
119                 printk("Need either no arguments, or two (PC and FP) in hex\n");
120                 return 1;
121         }
122         pc = strtol(argv[1], 0, 16);
123         fp = strtol(argv[2], 0, 16);
124         print_lock();
125         printk("Backtrace from instruction %p, with frame pointer %p\n", pc, fp);
126         backtrace_frame(pc, fp);
127         print_unlock();
128         return 0;
129 }
130
131 int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
132 {
133         return __backtrace(argc, argv, hw_tf);
134 }
135
136 int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
137 {
138         cprintf("[Scottish Accent]: She's goin' down, Cap'n!\n");
139         reboot();
140
141         // really, should never see this
142         cprintf("Sigh....\n");
143         return 0;
144 }
145
146 static int __showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
147 {
148         struct proc *p = NULL;
149         uintptr_t start;
150         size_t size;
151         pgdir_t pgdir;
152         pid_t pid;
153
154         if (argc < 3) {
155                 printk("Shows virtual -> physical mappings for a virt addr range.\n");
156                 printk("Usage: showmapping PID START_ADDR [END_ADDR]\n");
157                 printk("    PID == 0 for the boot pgdir\n");
158                 return 1;
159         }
160         pid = strtol(argv[1], 0, 10);
161         if (!pid) {
162                 pgdir = boot_pgdir;
163         } else {
164                 p = pid2proc(pid);
165                 if (!p) {
166                         printk("No proc with pid %d\n", pid);
167                         return 1;
168                 }
169                 pgdir = p->env_pgdir;
170         }
171         start = ROUNDDOWN(strtol(argv[2], 0, 16), PGSIZE);
172         size = (argc == 3) ? 1 : strtol(argv[3], 0, 16) - start;
173         if (size/PGSIZE > 512) {
174                 cprintf("Not going to do this for more than 512 items\n");
175                 return 1;
176         }
177         show_mapping(pgdir, start, size);
178         if (p)
179                 proc_decref(p);
180         return 0;
181 }
182
183 int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
184 {
185         return __showmapping(argc, argv, hw_tf);
186 }
187
188 int mon_sm(int argc, char **argv, struct hw_trapframe *hw_tf)
189 {
190         return __showmapping(argc, argv, hw_tf);
191 }
192
193 static void print_info_handler(struct hw_trapframe *hw_tf, void *data)
194 {
195         uint64_t tsc = read_tsc();
196
197         print_lock();
198         cprintf("----------------------------\n");
199         cprintf("This is Core %d\n", core_id());
200         cprintf("Timestamp = %lld\n", tsc);
201 #ifdef CONFIG_X86
202         cprintf("Hardware core %d\n", hw_core_id());
203         cprintf("MTRR_DEF_TYPE = 0x%08x\n", read_msr(IA32_MTRR_DEF_TYPE));
204         cprintf("MTRR Phys0 Base = 0x%016llx, Mask = 0x%016llx\n",
205                 read_msr(0x200), read_msr(0x201));
206         cprintf("MTRR Phys1 Base = 0x%016llx, Mask = 0x%016llx\n",
207                 read_msr(0x202), read_msr(0x203));
208         cprintf("MTRR Phys2 Base = 0x%016llx, Mask = 0x%016llx\n",
209                 read_msr(0x204), read_msr(0x205));
210         cprintf("MTRR Phys3 Base = 0x%016llx, Mask = 0x%016llx\n",
211                 read_msr(0x206), read_msr(0x207));
212         cprintf("MTRR Phys4 Base = 0x%016llx, Mask = 0x%016llx\n",
213                 read_msr(0x208), read_msr(0x209));
214         cprintf("MTRR Phys5 Base = 0x%016llx, Mask = 0x%016llx\n",
215                 read_msr(0x20a), read_msr(0x20b));
216         cprintf("MTRR Phys6 Base = 0x%016llx, Mask = 0x%016llx\n",
217                 read_msr(0x20c), read_msr(0x20d));
218         cprintf("MTRR Phys7 Base = 0x%016llx, Mask = 0x%016llx\n",
219                 read_msr(0x20e), read_msr(0x20f));
220 #endif // CONFIG_X86
221         cprintf("----------------------------\n");
222         print_unlock();
223 }
224
225 static bool print_all_info(void)
226 {
227         cprintf("\nCORE 0 asking all cores to print info:\n");
228         smp_call_function_all(print_info_handler, NULL, 0);
229         cprintf("\nDone!\n");
230         return true;
231 }
232
233 int mon_cpuinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
234 {
235         cprintf("Number of Cores detected: %d\n", num_cores);
236         cprintf("Calling CPU's ID: 0x%08x\n", core_id());
237
238         if (argc < 2)
239                 smp_call_function_self(print_info_handler, NULL, 0);
240         else
241                 smp_call_function_single(strtol(argv[1], 0, 10),
242                                          print_info_handler, NULL, 0);
243         return 0;
244 }
245
246 int mon_manager(int argc, char** argv, struct hw_trapframe *hw_tf)
247 {
248         manager();
249         panic("should never get here");
250         return 0;
251 }
252
253 int mon_nanwan(int argc, char **argv, struct hw_trapframe *hw_tf)
254 {
255         /* Borrowed with love from http://www.geocities.com/SoHo/7373/zoo.htm
256          * (http://www.ascii-art.com/).  Slightly modified to make it 25 lines tall.
257          */
258         print_lock();
259         printk("\n");
260         printk("             .-.  .-.\n");
261         printk("             |  \\/  |\n");
262         printk("            /,   ,_  `'-.\n");
263         printk("          .-|\\   /`\\     '. \n");
264         printk("        .'  0/   | 0\\  \\_  `\".  \n");
265         printk("     .-'  _,/    '--'.'|#''---'\n");
266         printk("      `--'  |       /   \\#\n");
267         printk("            |      /     \\#\n");
268         printk("            \\     ;|\\    .\\#\n");
269         printk("            |' ' //  \\   ::\\# \n");
270         printk("            \\   /`    \\   ':\\#\n");
271         printk("             `\"`       \\..   \\#\n");
272         printk("                        \\::.  \\#\n");
273         printk("                         \\::   \\#\n");
274         printk("                          \\'  .:\\#\n");
275         printk("                           \\  :::\\#\n");
276         printk("                            \\  '::\\#\n");
277         printk("                             \\     \\#\n");
278         printk("                              \\:.   \\#\n");
279         printk("                               \\::   \\#\n");
280         printk("                                \\'   .\\#\n");
281         printk("                             jgs \\   ::\\#\n");
282         printk("                                  \\      \n");
283         print_unlock();
284         return 0;
285 }
286
287 int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
288 {
289         if (argc < 2) {
290                 printk("Usage: bin_run FILENAME\n");
291                 return 1;
292         }
293         struct file_or_chan *program;
294         int retval = 0;
295         char buf[5 + MAX_FILENAME_SZ + 1] = "/bin/";    /* /bin/ + max + \0 */
296
297         strlcpy(buf, "/bin/", sizeof(buf));
298         if (strlcat(buf, argv[1], sizeof(buf)) > sizeof(buf)) {
299                 printk("Filename '%s' too long!\n", argv[1]);
300                 return 1;
301         }
302         program = foc_open(buf, O_EXEC | O_READ, 0);
303         if (!program) {
304                 printk("No such program!\n");
305                 return 1;
306         }
307         char **p_argv = kmalloc(sizeof(char*) * argc, 0);       /* bin_run's argc */
308         for (int i = 0; i < argc - 1; i++)
309                 p_argv[i] = argv[i + 1];
310         p_argv[argc - 1] = 0;
311         /* super ugly: we need to stash current, so that proc_create doesn't pick up
312          * on random processes running here and assuming they are the parent */
313         struct proc *old_cur = current;
314         current = 0;
315         struct proc *p = proc_create(program, p_argv, NULL);
316         current = old_cur;
317         kfree(p_argv);
318         proc_wakeup(p);
319         proc_decref(p); /* let go of the reference created in proc_create() */
320         foc_decref(program);
321         /* Make a scheduling decision.  You might not get the process you created,
322          * in the event there are others floating around that are runnable */
323         run_scheduler();
324         /* want to idle, so we un the process we just selected.  this is a bit
325          * hackish, but so is the monitor. */
326         smp_idle();
327         assert(0);
328         return 0;
329 }
330
331 int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
332 {
333         int verbosity = 0;
334
335         if (argc < 2) {
336                 printk("Usage: procinfo OPTION\n");
337                 printk("\tall: show all active pids\n");
338                 printk("\tpid NUM: show a lot of info for proc NUM\n");
339                 printk("\tunlock: unlock the lock for the ADDR (OMG!!!)\n");
340                 printk("\tkill NUM: destroy proc NUM\n");
341                 return 1;
342         }
343         if (!strcmp(argv[1], "all")) {
344                 print_allpids();
345         } else if (!strcmp(argv[1], "pid")) {
346                 if (argc < 3) {
347                         printk("Give me a pid number.\n");
348                         return 1;
349                 }
350                 if (argc >= 4)
351                         verbosity = strtol(argv[3], 0, 0);
352                 print_proc_info(strtol(argv[2], 0, 0), verbosity);
353         } else if (!strcmp(argv[1], "unlock")) {
354                 if (argc != 3) {
355                         printk("Gimme lock address!  Me want lock address!.\n");
356                         return 1;
357                 }
358                 spinlock_t *lock = (spinlock_t*)strtol(argv[2], 0, 16);
359                 if (!lock) {
360                         printk("Null address...\n");
361                         return 1;
362                 }
363                 spin_unlock(lock);
364         } else if (!strcmp(argv[1], "kill")) {
365                 if (argc != 3) {
366                         printk("Give me a pid number.\n");
367                         return 1;
368                 }
369                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
370                 if (!p) {
371                         printk("No such proc\n");
372                         return 1;
373                 }
374                 proc_destroy(p);
375                 proc_decref(p);
376         } else {
377                 printk("Bad option\n");
378                 return 1;
379         }
380         return 0;
381 }
382
383 int mon_pip(int argc, char **argv, struct hw_trapframe *hw_tf)
384 {
385         int verbosity = 0;
386
387         if (argc < 2) {
388                 printk("Give me a pid number.\n");
389                 return 1;
390         }
391         if (argc >= 3)
392                 verbosity = strtol(argv[2], 0, 0);
393         print_proc_info(strtol(argv[1], 0, 0), verbosity);
394         return 0;
395 }
396
397 int mon_kill(int argc, char **argv, struct hw_trapframe *hw_tf)
398 {
399         struct proc *p;
400
401         if (argc < 2) {
402                 printk("Usage: kill PID\n");
403                 return 1;
404         }
405         p = pid2proc(strtol(argv[1], 0, 0));
406         if (!p) {
407                 printk("No such proc\n");
408                 return 1;
409         }
410         p->exitcode = 1;        /* typical EXIT_FAILURE */
411         proc_destroy(p);
412         proc_decref(p);
413         return 0;
414 }
415
416 int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
417 {
418         return -1;
419 }
420
421 int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
422 {
423         long ret;
424         long (*func)(void *arg, ...);
425
426         if (argc < 2) {
427                 printk("Usage: kfunc FUNCTION [arg1] [arg2] [etc]\n");
428                 printk("Use 0x with hex arguments.  Can take 6 args.\n");
429                 return 1;
430         }
431         func = (void*)get_symbol_addr(argv[1]);
432         if (!func) {
433                 printk("Function not found.\n");
434                 return 1;
435         }
436         /* Not elegant, but whatever.  maybe there's a better syntax, or we can do
437          * it with asm magic. */
438         switch (argc) {
439         case 2: /* have to fake one arg */
440                 ret = func((void*)0);
441                 break;
442         case 3: /* the real first arg */
443                 ret = func((void*)strtol(argv[2], 0, 0));
444                 break;
445         case 4:
446                 ret = func((void*)strtol(argv[2], 0, 0),
447                                   strtol(argv[3], 0, 0));
448                 break;
449         case 5:
450                 ret = func((void*)strtol(argv[2], 0, 0),
451                                   strtol(argv[3], 0, 0),
452                                   strtol(argv[4], 0, 0));
453                 break;
454         case 6:
455                 ret = func((void*)strtol(argv[2], 0, 0),
456                                   strtol(argv[3], 0, 0),
457                                   strtol(argv[4], 0, 0),
458                                   strtol(argv[5], 0, 0));
459                 break;
460         case 7:
461                 ret = func((void*)strtol(argv[2], 0, 0),
462                                   strtol(argv[3], 0, 0),
463                                   strtol(argv[4], 0, 0),
464                                   strtol(argv[5], 0, 0),
465                                   strtol(argv[6], 0, 0));
466                 break;
467         case 8:
468                 ret = func((void*)strtol(argv[2], 0, 0),
469                                   strtol(argv[3], 0, 0),
470                                   strtol(argv[4], 0, 0),
471                                   strtol(argv[5], 0, 0),
472                                   strtol(argv[6], 0, 0),
473                                   strtol(argv[7], 0, 0));
474                 break;
475         default:
476                 printk("Bad number of arguments.\n");
477                 return -1;
478         }
479         printk("%s (might have) returned %p\n", argv[1], ret);
480         return 0;
481 }
482
483 /* Sending a vcoreid forces an event and an IPI/notification */
484 int mon_notify(int argc, char **argv, struct hw_trapframe *hw_tf)
485 {
486         struct proc *p;
487         uint32_t vcoreid;
488         struct event_msg msg = {0};
489
490         if (argc < 3) {
491                 printk("Usage: notify PID NUM [VCOREID]\n");
492                 return 1;
493         }
494         p = pid2proc(strtol(argv[1], 0, 0));
495         if (!p) {
496                 printk("No such proc\n");
497                 return 1;
498         }
499         msg.ev_type = strtol(argv[2], 0, 0);
500         if (argc == 4) {
501                 vcoreid = strtol(argv[3], 0, 0);
502                 /* This will go to the private mbox */
503                 post_vcore_event(p, &msg, vcoreid, EVENT_VCORE_PRIVATE);
504                 proc_notify(p, vcoreid);
505         } else {
506                 /* o/w, try and do what they want */
507                 send_kernel_event(p, &msg, 0);
508         }
509         proc_decref(p);
510         return 0;
511 }
512
513 /* Micro-benchmarky Measurements.  This is really fragile code that probably
514  * won't work perfectly, esp as the kernel evolves. */
515 int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
516 {
517         uint64_t begin = 0, diff = 0;
518         uint32_t end_refcnt = 0;
519
520         if (argc < 2) {
521                 printk("Usage: measure OPTION\n");
522                 printk("\tkill PID : kill proc PID\n");
523                 printk("\tpreempt PID : preempt proc PID (no delay)\n");
524                 printk("\tpreempt PID [pcore] : preempt PID's pcore (no delay)\n");
525                 printk("\tpreempt-warn PID : warn-preempt proc PID (pending)\n");
526                 printk("\tpreempt-warn PID [pcore] : warn-preempt proc PID's pcore\n");
527                 printk("\tpreempt-raw PID : raw-preempt proc PID\n");
528                 printk("\tpreempt-raw PID [pcore] : raw-preempt proc PID's pcore\n");
529                 return 1;
530         }
531         if (!strcmp(argv[1], "kill")) {
532                 if (argc < 3) {
533                         printk("Give me a pid number.\n");
534                         return 1;
535                 }
536                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
537                 if (!p) {
538                         printk("No such proc\n");
539                         return 1;
540                 }
541                 begin = start_timing();
542 #ifdef CONFIG_APPSERVER
543                 printk("Warning: this will be inaccurate due to the appserver.\n");
544                 end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores - 1;
545 #endif /* CONFIG_APPSERVER */
546                 proc_destroy(p);
547                 proc_decref(p);
548 #ifdef CONFIG_APPSERVER
549                 /* Won't be that accurate, since it's not actually going through the
550                  * __proc_free() path. */
551                 spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
552 #else
553                 /* this is a little ghetto. it's not fully free yet, but we are also
554                  * slowing it down by messing with it, esp with the busy waiting on a
555                  * hyperthreaded core. */
556                 spin_on(p->env_cr3);
557 #endif /* CONFIG_APPSERVER */
558                 /* No noticeable difference using stop_timing instead of read_tsc() */
559                 diff = stop_timing(begin);
560         } else if (!strcmp(argv[1], "preempt")) {
561                 if (argc < 3) {
562                         printk("Give me a pid number.\n");
563                         return 1;
564                 }
565                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
566                 if (!p) {
567                         printk("No such proc\n");
568                         return 1;
569                 }
570                 if (argc == 4) { /* single core being preempted, warned but no delay */
571                         uint32_t pcoreid = strtol(argv[3], 0, 0);
572                         begin = start_timing();
573                         if (proc_preempt_core(p, pcoreid, 1000000)) {
574                                 __sched_put_idle_core(p, pcoreid);
575                                 /* done when unmapped (right before abandoning) */
576                                 spin_on(p->procinfo->pcoremap[pcoreid].valid);
577                         } else {
578                                 printk("Core %d was not mapped to proc\n", pcoreid);
579                         }
580                         diff = stop_timing(begin);
581                 } else { /* preempt all cores, warned but no delay */
582                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
583                         begin = start_timing();
584                         proc_preempt_all(p, 1000000);
585                         /* a little ghetto, implies no one is using p */
586                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
587                         diff = stop_timing(begin);
588                 }
589                 proc_decref(p);
590         } else if (!strcmp(argv[1], "preempt-warn")) {
591                 if (argc < 3) {
592                         printk("Give me a pid number.\n");
593                         return 1;
594                 }
595                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
596                 if (!p) {
597                         printk("No such proc\n");
598                         return 1;
599                 }
600                 printk("Careful: if this hangs, then the process isn't responding.\n");
601                 if (argc == 4) { /* single core being preempted-warned */
602                         uint32_t pcoreid = strtol(argv[3], 0, 0);
603                         spin_lock(&p->proc_lock);
604                         uint32_t vcoreid = p->procinfo->pcoremap[pcoreid].vcoreid;
605                         if (!p->procinfo->pcoremap[pcoreid].valid) {
606                                 printk("Pick a mapped pcore\n");
607                                 spin_unlock(&p->proc_lock);
608                                 return 1;
609                         }
610                         begin = start_timing();
611                         __proc_preempt_warn(p, vcoreid, 1000000); // 1 sec
612                         spin_unlock(&p->proc_lock);
613                         /* done when unmapped (right before abandoning) */
614                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
615                         diff = stop_timing(begin);
616                 } else { /* preempt-warn all cores */
617                         printk("Warning, this won't work if they can't yield their "
618                                "last vcore, will stop at 1!\n");
619                         spin_lock(&p->proc_lock);
620                         begin = start_timing();
621                         __proc_preempt_warnall(p, 1000000);
622                         spin_unlock(&p->proc_lock);
623                         /* target cores do the unmapping / changing of the num_vcores */
624                         spin_on(p->procinfo->num_vcores > 1);
625                         diff = stop_timing(begin);
626                 }
627                 proc_decref(p);
628         } else if (!strcmp(argv[1], "preempt-raw")) {
629                 if (argc < 3) {
630                         printk("Give me a pid number.\n");
631                         return 1;
632                 }
633                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
634                 if (!p) {
635                         printk("No such proc\n");
636                         return 1;
637                 }
638                 if (argc == 4) { /* single core preempted, no warning or waiting */
639                         uint32_t pcoreid = strtol(argv[3], 0, 0);
640                         spin_lock(&p->proc_lock);
641                         if (!p->procinfo->pcoremap[pcoreid].valid) {
642                                 printk("Pick a mapped pcore\n");
643                                 spin_unlock(&p->proc_lock);
644                                 return 1;
645                         }
646                         begin = start_timing();
647                         __proc_preempt_core(p, pcoreid);
648                         if (!p->procinfo->num_vcores)
649                                 __proc_set_state(p, PROC_RUNNABLE_M);
650                         spin_unlock(&p->proc_lock);
651                         /* ghetto, since the ksched should be calling all of this */
652                         __sched_put_idle_core(p, pcoreid);
653                         /* done when unmapped (right before abandoning) */
654                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
655                         diff = stop_timing(begin);
656                 } else { /* preempt all cores, no warning or waiting */
657                         spin_lock(&p->proc_lock);
658                         uint32_t pc_arr[p->procinfo->num_vcores];
659                         uint32_t num_revoked;
660                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
661                         begin = start_timing();
662                         num_revoked = __proc_preempt_all(p, pc_arr);
663                         __proc_set_state(p, PROC_RUNNABLE_M);
664                         spin_unlock(&p->proc_lock);
665                         if (num_revoked)
666                                 __sched_put_idle_cores(p, pc_arr, num_revoked);
667                         /* a little ghetto, implies no one else is using p */
668                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
669                         diff = stop_timing(begin);
670                 }
671                 proc_decref(p);
672         } else {
673                 printk("Bad option\n");
674                 return 1;
675         }
676         printk("[Tired Giraffe Accent] Took %llu usec (%llu nsec) to finish.\n",
677                tsc2usec(diff), tsc2nsec(diff));
678         return 0;
679 }
680
681 static bool mon_verbose_trace = FALSE;
682 static DEFINE_PERCPU(bool, mon_nmi_trace);
683
684 static void emit_hwtf_backtrace(struct hw_trapframe *hw_tf)
685 {
686         if (mon_verbose_trace) {
687                 printk("\n");
688                 print_trapframe(hw_tf);
689                 backtrace_hwtf(hw_tf);
690         }
691         printk("Core %d is at %p (%s)\n", core_id(), get_hwtf_pc(hw_tf),
692                get_fn_name(get_hwtf_pc(hw_tf)));
693 }
694
695 static void emit_vmtf_backtrace(struct vm_trapframe *vm_tf)
696 {
697         if (mon_verbose_trace) {
698                 printk("\n");
699                 print_vmtrapframe(vm_tf);
700         }
701         printk("Core %d is at %p\n", core_id(), get_vmtf_pc(vm_tf));
702 }
703
704 /* This is dangerous and could cause a deadlock, since it runs in NMI context.
705  * It's only for monitor debugging, so YMMV.  We pass the type since the kernel
706  * doesn't deal in contexts (yet) */
707 void emit_monitor_backtrace(int type, void *tf)
708 {
709         if (!PERCPU_VAR(mon_nmi_trace))
710                 return;
711         /* To prevent a spew of output during a lot of perf NMIs, we'll turn off the
712          * monitor output as soon as any NMI hits our core. */
713         PERCPU_VAR(mon_nmi_trace) = FALSE;
714         print_lock();
715         if (type == ROS_HW_CTX)
716                 emit_hwtf_backtrace((struct hw_trapframe*)tf);
717         else
718                 emit_vmtf_backtrace((struct vm_trapframe*)tf);
719         print_kmsgs(core_id());
720         print_unlock();
721 }
722
723
724 int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
725 {
726         int core;
727         if (argc < 2) {
728                 printk("Usage: trace OPTION\n");
729                 printk("\tsyscall start [silent (0 or non-zero, NOT the word silent)] [pid]: starts tracing\n");
730                 printk("\tsyscall stop: stops tracing.\n");
731                 printk("\tcoretf COREID: prints PC, -1 for all cores, verbose => TF\n");
732                 printk("\tpcpui [type [coreid]]: runs pcpui trace ring handlers\n");
733                 printk("\tpcpui-reset [noclear]: resets/clears pcpui trace ring\n");
734                 printk("\tverbose: toggles verbosity, depends on trace command\n");
735                 return 1;
736         }
737         if (!strcmp(argv[1], "syscall")) {
738                 if (argc < 3) {
739                         printk("Need a start or stop.\n");
740                         return 1;
741                 }
742                 if (!strcmp(argv[2], "start")) {
743                         systrace_loud = TRUE;
744                 } else if (!strcmp(argv[2], "stop")) {
745                         systrace_loud = FALSE;
746                 } else {
747                         printk("Need a start or stop.\n");
748                         return 1;
749                 }
750         } else if (!strcmp(argv[1], "coretf")) {
751                 if (argc != 3) {
752                         printk("Need a coreid, fool.\n");
753                         return 1;
754                 }
755                 core = strtol(argv[2], 0, 0);
756                 if (core < 0) {
757                         printk("Sending NMIs to all cores:\n");
758                         for (int i = 0; i < num_cores; i++) {
759                                 _PERCPU_VAR(mon_nmi_trace, i) = TRUE;
760                                 send_nmi(i);
761                                 udelay(1000000);
762                         }
763                 } else {
764                         printk("Sending NMI core %d:\n", core);
765                         if (core >= num_cores) {
766                                 printk("No such core!  Maybe it's in another cell...\n");
767                                 return 1;
768                         }
769                         _PERCPU_VAR(mon_nmi_trace, core) = TRUE;
770                         send_nmi(core);
771                 }
772                 udelay(1000000);
773         } else if (!strcmp(argv[1], "pcpui")) {
774                 int pcpui_type, pcpui_coreid;
775                 if (argc >= 3)
776                         pcpui_type = strtol(argv[2], 0, 0);
777                 else
778                         pcpui_type = 0;
779                 printk("\nRunning PCPUI Trace Ring handlers for type %d\n", pcpui_type);
780                 if (argc >= 4) {
781                         pcpui_coreid = strtol(argv[3], 0, 0);
782                         pcpui_tr_foreach(pcpui_coreid, pcpui_type);
783                 } else {
784                         pcpui_tr_foreach_all(pcpui_type);
785                 }
786         } else if (!strcmp(argv[1], "pcpui-reset")) {
787                 if (argc >= 3) {
788                         printk("\nResetting all PCPUI Trace Rings\n");
789                         pcpui_tr_reset_all();
790                 } else {
791                         printk("\nResetting and clearing all PCPUI Trace Rings\n");
792                         pcpui_tr_reset_and_clear_all();
793                 }
794         } else if (!strcmp(argv[1], "verbose")) {
795                 if (mon_verbose_trace) {
796                         printk("Turning trace verbosity off\n");
797                         mon_verbose_trace = FALSE;
798                 } else {
799                         printk("Turning trace verbosity on\n");
800                         mon_verbose_trace = TRUE;
801                 }
802         } else if (!strcmp(argv[1], "opt2")) {
803                 if (argc != 3) {
804                         printk("ERRRRRRRRRR.\n");
805                         return 1;
806                 }
807                 print_proc_info(strtol(argv[2], 0, 0), 0);
808         } else {
809                 printk("Bad option\n");
810                 return 1;
811         }
812         return 0;
813 }
814
815 int mon_monitor(int argc, char **argv, struct hw_trapframe *hw_tf)
816 {
817         if (argc < 2) {
818                 printk("Usage: monitor COREID\n");
819                 return 1;
820         }
821         uint32_t core = strtol(argv[1], 0, 0);
822         if (core >= num_cores) {
823                 printk("No such core!  Maybe it's in another cell...\n");
824                 return 1;
825         }
826         send_kernel_message(core, __run_mon, 0, 0, 0, KMSG_ROUTINE);
827         return 0;
828 }
829
830 /***** Kernel monitor command interpreter *****/
831
832 #define WHITESPACE "\t\r\n "
833 #define MAXARGS 16
834
835
836 int onecmd(int argc, char *argv[], struct hw_trapframe *hw_tf) {
837         int i;
838         if (!argc)
839                 return -1;
840         for (i = 0; i < NCOMMANDS; i++) {
841                 if (strcmp(argv[0], commands[i].name) == 0)
842                         return commands[i].func(argc, argv, hw_tf);
843         }
844         return -1;
845 }
846
847 void __run_mon(uint32_t srcid, long a0, long a1, long a2)
848 {
849         monitor(0);
850 }
851
852 static int runcmd(char *real_buf, struct hw_trapframe *hw_tf) {
853         char * buf = real_buf;
854         int argc;
855         char *argv[MAXARGS];
856         int i;
857
858         // Parse the command buffer into whitespace-separated arguments
859         argc = 0;
860         argv[argc] = 0;
861         /* Discard initial 'm ', which is a common mistake when using 'm' a lot */
862         if ((buf[0] == 'm') && (buf[1] == ' '))
863                 buf += 2;
864         while (1) {
865                 // gobble whitespace
866                 while (*buf && strchr(WHITESPACE, *buf))
867                         *buf++ = 0;
868                 if (*buf == 0)
869                         break;
870
871                 // save and scan past next arg
872                 if (argc == MAXARGS-1) {
873                         cprintf("Too many arguments (max %d)\n", MAXARGS);
874                         return 0;
875                 }
876                 //This will get fucked at runtime..... in the ASS
877                 argv[argc++] = buf;
878                 while (*buf && !strchr(WHITESPACE, *buf))
879                         buf++;
880         }
881         argv[argc] = 0;
882
883         // Lookup and invoke the command
884         if (argc == 0)
885                 return 0;
886         for (i = 0; i < NCOMMANDS; i++) {
887                 if (strcmp(argv[0], commands[i].name) == 0)
888                         return commands[i].func(argc, argv, hw_tf);
889         }
890         cprintf("Unknown command '%s'\n", argv[0]);
891         return 0;
892 }
893
894 void monitor(struct hw_trapframe *hw_tf)
895 {
896         #define MON_CMD_LENGTH 256
897         char buf[MON_CMD_LENGTH];
898         int cnt;
899         int coreid = core_id_early();
900
901         /* they are always disabled, since we have this irqsave lock */
902         if (irq_is_enabled())
903                 printk("Entering Nanwan's Dungeon on Core %d (Ints on):\n", coreid);
904         else
905                 printk("Entering Nanwan's Dungeon on Core %d (Ints off):\n", coreid);
906         printk("Type 'help' for a list of commands.\n");
907
908         if (hw_tf != NULL)
909                 print_trapframe(hw_tf);
910
911         while (1) {
912                 /* on occasion, the kernel monitor can migrate (like if you run
913                  * something that blocks / syncs and wakes up on another core) */
914                 cmb();
915                 cnt = readline(buf, MON_CMD_LENGTH, "ROS(Core %d)> ", core_id_early());
916                 if (cnt > 0) {
917                         buf[cnt] = 0;
918                         if (runcmd(buf, hw_tf) < 0)
919                                 break;
920                 }
921         }
922 }
923
924 int mon_shell(int argc, char **argv, struct hw_trapframe *hw_tf)
925 {
926         char *l_argv[2] = {"/bin/bash", "bash"};
927         return mon_bin_run(2, l_argv, hw_tf);
928 }
929
930 int mon_alarm(int argc, char **argv, struct hw_trapframe *hw_tf)
931 {
932         if (argc < 2) {
933                 printk("Usage: alarm OPTION\n");
934                 printk("\tpcpu: print full alarm tchains from every core\n");
935                 return 1;
936         }
937         if (!strcmp(argv[1], "pcpu")) {
938                 print_pcpu_chains();
939         } else {
940                 printk("Bad option\n");
941                 return 1;
942         }
943         return 0;
944 }
945
946 static void show_msr(struct hw_trapframe *unused, void *v)
947 {
948         int core = core_id();
949         uint64_t val;
950         uint32_t msr = *(uint32_t *)v;
951         val = read_msr(msr);
952         printk("%d: %08x: %016llx\n", core, msr, val);
953 }
954
955 struct set {
956         uint32_t msr;
957         uint64_t val;
958 };
959
960 static void set_msr(struct hw_trapframe *unused, void *v)
961 {
962         int core = core_id();
963         struct set *s = v;
964         uint32_t msr = s->msr;
965         uint64_t val = s->val;
966         write_msr(msr, val);
967         val = read_msr(msr);
968         printk("%d: %08x: %016llx\n", core, msr, val);
969 }
970
971 int mon_msr(int argc, char **argv, struct hw_trapframe *hw_tf)
972 {
973 #ifndef CONFIG_X86
974         cprintf("Not on this architecture\n");
975         return 1;
976 #else
977         uint64_t val;
978         uint32_t msr;
979         if (argc < 2 || argc > 3) {
980                 printk("Usage: msr register [value]\n");
981                 return 1;
982         }
983         msr = strtoul(argv[1], 0, 16);
984         handler_wrapper_t *w;
985         smp_call_function_all(show_msr, &msr, &w);
986         smp_call_wait(w);
987
988         if (argc < 3)
989                 return 0;
990         /* somewhat bogus on 32 bit. */
991         val = strtoul(argv[2], 0, 16);
992
993         struct set set;
994         set.msr = msr;
995         set.val = val;
996         smp_call_function_all(set_msr, &set, &w);
997         smp_call_wait(w);
998         return 0;
999 #endif
1000 }
1001
1002 int mon_db(int argc, char **argv, struct hw_trapframe *hw_tf)
1003 {
1004         pid_t pid = -1;
1005
1006         if (argc < 2) {
1007                 printk("Usage: db OPTION\n");
1008                 printk("\tsem [PID]: print all semaphore info\n");
1009                 printk("\taddr PID 0xADDR: for PID lookup ADDR's file/vmr info\n");
1010                 return 1;
1011         }
1012         if (!strcmp(argv[1], "sem")) {
1013                 if (argc > 2)
1014                         pid = strtol(argv[2], 0, 0);
1015                 print_all_sem_info(pid);
1016         } else if (!strcmp(argv[1], "addr")) {
1017                 if (argc < 4) {
1018                         printk("Usage: db addr PID 0xADDR\n");
1019                         return 1;
1020                 }
1021                 debug_addr_pid(strtol(argv[2], 0, 10), strtol(argv[3], 0, 16));
1022         } else {
1023                 printk("Bad option\n");
1024                 return 1;
1025         }
1026         return 0;
1027 }
1028
1029 int mon_px(int argc, char **argv, struct hw_trapframe *hw_tf)
1030 {
1031         pid_t pid = 0;
1032         struct proc *p;
1033
1034         if (argc == 2)
1035                 pid = strtol(argv[1], 0, 0);
1036         if (!pid) {
1037                 set_printx(2);
1038                 printk("Printxing is now %sabled\n", printx_on ? "en" : "dis");
1039                 return 0;
1040         }
1041         p = pid2proc(pid);
1042         if (!p) {
1043                 printk("No proc with pid %d\n", pid);
1044                 return 1;
1045         }
1046         p->procdata->printx_on = !p->procdata->printx_on;
1047         proc_decref(p);
1048         return 0;
1049 }
1050
1051 /* Super hack.  Given a kernel hw_tf, we hack the RIP to smp_idle, then return
1052  * to it.  Any locks or other stuff being done is completely lost, so you could
1053  * deadlock.  This gets out of the "we're totall screwed, but don't want to
1054  * reboot right now", typically caused by screw-ups from the monitor. */
1055 int mon_kpfret(int argc, char **argv, struct hw_trapframe *hw_tf)
1056 {
1057         struct per_cpu_info *pcpui = &per_cpu_info[core_id()];
1058
1059         /* if monitor had a TF, try to use that */
1060         if (!hw_tf) {
1061                 if (argc < 2) {
1062                         printk("Usage: kpfret HW_TF\n");
1063                         return 1;
1064                 }
1065                 /* the hw_tf passed in is the one we got from monitor, which is 0 from
1066                  * panics. */
1067                 hw_tf = (struct hw_trapframe*)strtol(argv[1], 0, 16);
1068         }
1069
1070         if (!in_kernel(hw_tf)) {
1071                 printk("hw_tf %p was not a kernel tf!\n", hw_tf);
1072                 return -1;
1073         }
1074
1075 #ifdef CONFIG_X86
1076         hw_tf->tf_rip = (uintptr_t)smp_idle;
1077         dec_ktrap_depth(pcpui);
1078
1079         asm volatile("mov %0, %%rsp;"
1080                      "addq $0x10, %%rsp;"
1081                      "popq %%rax;"
1082                      "popq %%rbx;"
1083                      "popq %%rcx;"
1084                      "popq %%rdx;"
1085                      "popq %%rbp;"
1086                      "popq %%rsi;"
1087                      "popq %%rdi;"
1088                      "popq %%r8;"
1089                      "popq %%r9;"
1090                      "popq %%r10;"
1091                      "popq %%r11;"
1092                      "popq %%r12;"
1093                      "popq %%r13;"
1094                      "popq %%r14;"
1095                      "popq %%r15;"
1096                      "addq $0x10, %%rsp;"
1097                      "iretq;"
1098                                  : : "r"(hw_tf));
1099         assert(0);
1100 #else
1101         printk("KPF return not supported\n");
1102         return -1;
1103 #endif /* CONFIG_X86 */
1104 }
1105
1106 int mon_ks(int argc, char **argv, struct hw_trapframe *hw_tf)
1107 {
1108         if (argc < 2) {
1109 usage:
1110                 printk("Usage: ks OPTION\n");
1111                 printk("\tidles: show idle core map\n");
1112                 printk("\tdiag: scheduler diagnostic report\n");
1113                 printk("\tresources: show resources wanted/granted for all procs\n");
1114                 printk("\tsort: sorts the idlecoremap, 1..n\n");
1115                 printk("\tnc PCOREID: sets the next CG core allocated\n");
1116                 return 1;
1117         }
1118         if (!strcmp(argv[1], "idles")) {
1119                 print_idle_core_map();
1120         } else if (!strcmp(argv[1], "diag")) {
1121                 sched_diag();
1122         } else if (!strcmp(argv[1], "resources")) {
1123                 print_all_resources();
1124         } else if (!strcmp(argv[1], "sort")) {
1125                 sort_idle_cores();
1126         } else if (!strcmp(argv[1], "nc")) {
1127                 if (argc != 3) {
1128                         printk("Need a pcore number.\n");
1129                         return 1;
1130                 }
1131                 next_core_to_alloc(strtol(argv[2], 0, 0));
1132         } else {
1133                 printk("Bad option %s\n", argv[1]);
1134                 goto usage;
1135         }
1136         return 0;
1137 }
1138
1139 /* Prints info about a core.  Optional first arg == coreid. */
1140 int mon_coreinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
1141 {
1142         struct per_cpu_info *pcpui;
1143         struct kthread *kth;
1144         int coreid = core_id();
1145
1146         if (argc >= 2)
1147                 coreid = strtol(argv[1], 0, 0);
1148         pcpui = &per_cpu_info[coreid];
1149         printk("Core %d:\n\tcur_proc %d\n\towning proc %d, owning vc %d\n",
1150                coreid, pcpui->cur_proc ? pcpui->cur_proc->pid : 0,
1151                pcpui->owning_proc ? pcpui->owning_proc->pid : 0,
1152                pcpui->owning_vcoreid != 0xdeadbeef ? pcpui->owning_vcoreid : 0);
1153         kth = pcpui->cur_kthread;
1154         if (kth) {
1155                 /* kth->proc is only used when the kthread is sleeping.  when it's
1156                  * running, we care about cur_proc.  if we're here, proc should be 0
1157                  * unless the kth is concurrently sleeping (we called this remotely) */
1158                 printk("\tkthread %p (%s), sysc %p (%d)\n", kth, kth->name,
1159                        kth->sysc, kth->sysc ? kth->sysc->num : -1);
1160         } else {
1161                 /* Can happen during early boot */
1162                 printk("\tNo kthread!\n");
1163         }
1164         return 0;
1165 }
1166
1167 int mon_hexdump(int argc, char **argv, struct hw_trapframe *hw_tf)
1168 {
1169         struct proc *p = NULL;
1170         uintptr_t switch_state;
1171         pid_t pid;
1172         uintptr_t start;
1173         size_t len;
1174
1175         assert(argc >= 1);
1176         if (argc < 4) {
1177                 printk("Usage: %s PID ADDR LEN\n", argv[0]);
1178                 printk("    PID == 0 for kernel / don't care\n");
1179                 return 1;
1180         }
1181         pid = strtol(argv[1], 0, 0);
1182         start = strtoul(argv[2], 0, 0);
1183         len = strtoul(argv[3], 0, 0);
1184         if (pid) {
1185                 p = pid2proc(pid);
1186                 if (!p) {
1187                         printk("No proc with pid %d\n", pid);
1188                         return 1;
1189                 }
1190                 switch_state = switch_to(p);
1191         }
1192         hexdump((void*)start, len);
1193         if (p) {
1194                 switch_back(p, switch_state);
1195                 proc_decref(p);
1196         }
1197         return 0;
1198 }
1199
1200 int mon_pahexdump(int argc, char **argv, struct hw_trapframe *hw_tf)
1201 {
1202         uintptr_t start;
1203         size_t len;
1204
1205         assert(argc >= 1);
1206         if (argc < 3) {
1207                 printk("Usage: %s PHYS_ADDR LEN\n", argv[0]);
1208                 return 1;
1209         }
1210         start = strtoul(argv[1], 0, 0);
1211         len = strtoul(argv[2], 0, 0);
1212         pahexdump(start, len);
1213         return 0;
1214 }
1215
1216 int mon_dmesg(int argc, char **argv, struct hw_trapframe *hw_tf)
1217 {
1218         kprof_dump_data();
1219         return 0;
1220 }