Removes mon_setmapperm
[akaros.git] / kern / src / monitor.c
1 // Simple command-line kernel monitor useful for
2 // controlling the kernel and exploring the system interactively.
3
4 #include <arch/arch.h>
5 #include <stab.h>
6 #include <smp.h>
7 #include <console.h>
8 #include <arch/console.h>
9
10 #include <stdio.h>
11 #include <string.h>
12 #include <assert.h>
13 #include <monitor.h>
14 #include <trap.h>
15 #include <pmap.h>
16 #include <kdebug.h>
17 #include <testing.h>
18 #include <manager.h>
19 #include <schedule.h>
20 #include <kdebug.h>
21 #include <syscall.h>
22 #include <kmalloc.h>
23 #include <elf.h>
24 #include <event.h>
25 #include <trap.h>
26 #include <time.h>
27
28 #include <ros/memlayout.h>
29 #include <ros/event.h>
30
31 #define CMDBUF_SIZE     80      // enough for one VGA text line
32
33 typedef struct command {
34         const char *name;
35         const char *desc;
36         // return -1 to force monitor to exit
37         int (*func)(int argc, char **argv, struct hw_trapframe *hw_tf);
38 } command_t;
39
40 static command_t commands[] = {
41         { "help", "Display this list of commands", mon_help },
42         { "kerninfo", "Display information about the kernel", mon_kerninfo },
43         { "backtrace", "Dump a backtrace", mon_backtrace },
44         { "bt", "Dump a backtrace", mon_bt },
45         { "reboot", "Take a ride to the South Bay", mon_reboot },
46         { "showmapping", "Shows VA->PA mappings", mon_showmapping},
47         { "sm", "Shows VA->PA mappings", mon_sm},
48         { "cpuinfo", "Prints CPU diagnostics", mon_cpuinfo},
49         { "ps", "Prints process list", mon_ps},
50         { "nanwan", "Meet Nanwan!!", mon_nanwan},
51         { "bin_ls", "List files in /bin", mon_bin_ls},
52         { "bin_run", "Create and run a program from /bin", mon_bin_run},
53         { "manager", "Run the manager", mon_manager},
54         { "procinfo", "Show information about processes", mon_procinfo},
55         { "pip", "Shorthand for procinfo pid", mon_pip},
56         { "kill", "Kills a process", mon_kill},
57         { "exit", "Leave the monitor", mon_exit},
58         { "kfunc", "Run a kernel function directly (!!!)", mon_kfunc},
59         { "notify", "Notify a process.  Vcoreid will skip their prefs", mon_notify},
60         { "measure", "Run a specific measurement", mon_measure},
61         { "trace", "Run some tracing functions", mon_trace},
62         { "monitor", "Run the monitor on another core", mon_monitor},
63         { "fs", "Filesystem Diagnostics", mon_fs},
64         { "bb", "Try to run busybox (ash)", mon_bb},
65         { "alarm", "Alarm Diagnostics", mon_alarm},
66         { "msr", "read/write msr: msr msr [value]", mon_msr},
67         { "db", "Misc debugging", mon_db},
68         { "px", "Toggle printx", mon_px},
69         { "kpfret", "Attempt to idle after a kernel fault", mon_kpfret},
70         { "ks", "Kernel scheduler hacks", mon_ks},
71 };
72 #define NCOMMANDS (sizeof(commands)/sizeof(commands[0]))
73
74 /***** Implementations of basic kernel monitor commands *****/
75
76 int mon_help(int argc, char **argv, struct hw_trapframe *hw_tf)
77 {
78         int i;
79
80         for (i = 0; i < NCOMMANDS; i++)
81                 cprintf("%s - %s\n", commands[i].name, commands[i].desc);
82         return 0;
83 }
84
85 int mon_ps(int argc, char** argv, struct hw_trapframe *hw_tf)
86 {
87         print_allpids();
88         return 0;
89 }
90
91 int mon_kerninfo(int argc, char **argv, struct hw_trapframe *hw_tf)
92 {
93         extern char _start[], etext[], edata[], end[];
94
95         cprintf("Special kernel symbols:\n");
96         cprintf("  _start %016x (virt)  %016x (phys)\n", _start, (uintptr_t)(_start - KERNBASE));
97         cprintf("  etext  %016x (virt)  %016x (phys)\n", etext, (uintptr_t)(etext - KERNBASE));
98         cprintf("  edata  %016x (virt)  %016x (phys)\n", edata, (uintptr_t)(edata - KERNBASE));
99         cprintf("  end    %016x (virt)  %016x (phys)\n", end, (uintptr_t)(end - KERNBASE));
100         cprintf("Kernel executable memory footprint: %dKB\n",
101                 (uint32_t)(end-_start+1023)/1024);
102         return 0;
103 }
104
105 static int __backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
106 {
107         uintptr_t pc, fp;
108         if (argc == 1) {
109                 backtrace();
110                 return 0;
111         }
112         if (argc != 3) {
113                 printk("Need either no arguments, or two (PC and FP) in hex\n");
114                 return 1;
115         }
116         pc = strtol(argv[1], 0, 16);
117         fp = strtol(argv[2], 0, 16);
118         printk("Backtrace from instruction %p, with frame pointer %p\n", pc, fp);
119         backtrace_frame(pc, fp);
120         return 0;
121 }
122
123 int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
124 {
125         return __backtrace(argc, argv, hw_tf);
126 }
127
128 int mon_bt(int argc, char **argv, struct hw_trapframe *hw_tf)
129 {
130         return __backtrace(argc, argv, hw_tf);
131 }
132
133 int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
134 {
135         cprintf("[Scottish Accent]: She's goin' down, Cap'n!\n");
136         reboot();
137
138         // really, should never see this
139         cprintf("Sigh....\n");
140         return 0;
141 }
142
143 static int __showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
144 {
145         struct proc *p;
146         uintptr_t start;
147         size_t size;
148         pgdir_t pgdir;
149         pid_t pid;
150         if (argc < 3) {
151                 printk("Shows virtual -> physical mappings for a virt addr range.\n");
152                 printk("Usage: showmapping PID START_ADDR [END_ADDR]\n");
153                 printk("    PID == 0 for the boot pgdir\n");
154                 return 1;
155         }
156         pid = strtol(argv[1], 0, 10);
157         if (!pid) {
158                 pgdir = boot_pgdir;
159         } else {
160                 p = pid2proc(pid);
161                 if (!p) {
162                         printk("No proc with pid %d\n", pid);
163                         return 1;
164                 }
165                 pgdir = p->env_pgdir;
166         }
167         start = ROUNDDOWN(strtol(argv[2], 0, 16), PGSIZE);
168         size = (argc == 3) ? 1 : strtol(argv[3], 0, 16) - start;
169         if (size/PGSIZE > 512) {
170                 cprintf("Not going to do this for more than 512 items\n");
171                 return 1;
172         }
173         show_mapping(pgdir, start, size);
174         return 0;
175 }
176
177 int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
178 {
179         return __showmapping(argc, argv, hw_tf);
180 }
181
182 int mon_sm(int argc, char **argv, struct hw_trapframe *hw_tf)
183 {
184         return __showmapping(argc, argv, hw_tf);
185 }
186
187 static spinlock_t print_info_lock = SPINLOCK_INITIALIZER_IRQSAVE;
188
189 static void print_info_handler(struct hw_trapframe *hw_tf, void *data)
190 {
191         uint64_t tsc = read_tsc();
192
193         spin_lock_irqsave(&print_info_lock);
194         cprintf("----------------------------\n");
195         cprintf("This is Core %d\n", core_id());
196         cprintf("Timestamp = %lld\n", tsc);
197 #ifdef CONFIG_X86
198         cprintf("Hardware core %d\n", hw_core_id());
199         cprintf("MTRR_DEF_TYPE = 0x%08x\n", read_msr(IA32_MTRR_DEF_TYPE));
200         cprintf("MTRR Phys0 Base = 0x%016llx, Mask = 0x%016llx\n",
201                 read_msr(0x200), read_msr(0x201));
202         cprintf("MTRR Phys1 Base = 0x%016llx, Mask = 0x%016llx\n",
203                 read_msr(0x202), read_msr(0x203));
204         cprintf("MTRR Phys2 Base = 0x%016llx, Mask = 0x%016llx\n",
205                 read_msr(0x204), read_msr(0x205));
206         cprintf("MTRR Phys3 Base = 0x%016llx, Mask = 0x%016llx\n",
207                 read_msr(0x206), read_msr(0x207));
208         cprintf("MTRR Phys4 Base = 0x%016llx, Mask = 0x%016llx\n",
209                 read_msr(0x208), read_msr(0x209));
210         cprintf("MTRR Phys5 Base = 0x%016llx, Mask = 0x%016llx\n",
211                 read_msr(0x20a), read_msr(0x20b));
212         cprintf("MTRR Phys6 Base = 0x%016llx, Mask = 0x%016llx\n",
213                 read_msr(0x20c), read_msr(0x20d));
214         cprintf("MTRR Phys7 Base = 0x%016llx, Mask = 0x%016llx\n",
215                 read_msr(0x20e), read_msr(0x20f));
216 #endif // CONFIG_X86
217         cprintf("----------------------------\n");
218         spin_unlock_irqsave(&print_info_lock);
219 }
220
221 static bool print_all_info(void)
222 {
223         cprintf("\nCORE 0 asking all cores to print info:\n");
224         smp_call_function_all(print_info_handler, NULL, 0);
225         cprintf("\nDone!\n");
226         return true;
227 }
228
229 int mon_cpuinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
230 {
231         cprintf("Number of CPUs detected: %d\n", num_cpus);
232         cprintf("Calling CPU's ID: 0x%08x\n", core_id());
233
234         if (argc < 2)
235                 smp_call_function_self(print_info_handler, NULL, 0);
236         else
237                 smp_call_function_single(strtol(argv[1], 0, 10),
238                                          print_info_handler, NULL, 0);
239         return 0;
240 }
241
242 int mon_manager(int argc, char** argv, struct hw_trapframe *hw_tf)
243 {
244         manager();
245         panic("should never get here");
246         return 0;
247 }
248
249 int mon_nanwan(int argc, char **argv, struct hw_trapframe *hw_tf)
250 {
251         /* Borrowed with love from http://www.geocities.com/SoHo/7373/zoo.htm
252          * (http://www.ascii-art.com/).  Slightly modified to make it 25 lines tall.
253          */
254         printk("\n");
255         printk("             .-.  .-.\n");
256         printk("             |  \\/  |\n");
257         printk("            /,   ,_  `'-.\n");
258         printk("          .-|\\   /`\\     '. \n");
259         printk("        .'  0/   | 0\\  \\_  `\".  \n");
260         printk("     .-'  _,/    '--'.'|#''---'\n");
261         printk("      `--'  |       /   \\#\n");
262         printk("            |      /     \\#\n");
263         printk("            \\     ;|\\    .\\#\n");
264         printk("            |' ' //  \\   ::\\# \n");
265         printk("            \\   /`    \\   ':\\#\n");
266         printk("             `\"`       \\..   \\#\n");
267         printk("                        \\::.  \\#\n");
268         printk("                         \\::   \\#\n");
269         printk("                          \\'  .:\\#\n");
270         printk("                           \\  :::\\#\n");
271         printk("                            \\  '::\\#\n");
272         printk("                             \\     \\#\n");
273         printk("                              \\:.   \\#\n");
274         printk("                               \\::   \\#\n");
275         printk("                                \\'   .\\#\n");
276         printk("                             jgs \\   ::\\#\n");
277         printk("                                  \\      \n");
278         return 0;
279 }
280
281 int mon_bin_ls(int argc, char **argv, struct hw_trapframe *hw_tf)
282 {
283         struct dirent dir = {0};
284         struct file *bin_dir;
285         int retval = 0;
286
287         bin_dir = do_file_open("/bin", 0, 0);
288         if (!bin_dir) {
289                 printk("No /bin directory!\n");
290                 return 1;
291         }
292         printk("Files in /bin:\n-------------------------------\n");
293         do {
294                 retval = bin_dir->f_op->readdir(bin_dir, &dir); 
295                 printk("%s\n", dir.d_name);
296         } while (retval == 1);
297         kref_put(&bin_dir->f_kref);
298         return 0;
299 }
300
301 int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
302 {
303         if (argc < 2) {
304                 printk("Usage: bin_run FILENAME\n");
305                 return 1;
306         }
307         struct file *program;
308         int retval = 0;
309         char buf[6 + MAX_FILENAME_SZ] = "/bin/";        /* /bin/ + max + \0 */
310         strncpy(buf + 5, argv[1], MAX_FILENAME_SZ);
311         program = do_file_open(buf, 0, 0);
312         if (!program) {
313                 printk("No such program!\n");
314                 return 1;
315         }
316         char **p_argv = kmalloc(sizeof(char*) * argc, 0);       /* bin_run's argc */
317         for (int i = 0; i < argc - 1; i++)
318                 p_argv[i] = argv[i + 1];
319         p_argv[argc - 1] = 0;
320         /* super ugly: we need to stash current, so that proc_create doesn't pick up
321          * on random processes running here and assuming they are the parent */
322         struct proc *old_cur = current;
323         current = 0;
324         struct proc *p = proc_create(program, p_argv, NULL);
325         current = old_cur;
326         kfree(p_argv);
327         proc_wakeup(p);
328         proc_decref(p); /* let go of the reference created in proc_create() */
329         kref_put(&program->f_kref);
330         /* Make a scheduling decision.  You might not get the process you created,
331          * in the event there are others floating around that are runnable */
332         run_scheduler();
333         /* want to idle, so we un the process we just selected.  this is a bit
334          * hackish, but so is the monitor. */
335         smp_idle();
336         assert(0);
337         return 0;
338 }
339
340 int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
341 {
342         int8_t irq_state = 0;
343         if (argc < 2) {
344                 printk("Usage: procinfo OPTION\n");
345                 printk("\tall: show all active pids\n");
346                 printk("\tpid NUM: show a lot of info for proc NUM\n");
347                 printk("\tunlock: unlock the lock for the ADDR (OMG!!!)\n");
348                 printk("\tkill NUM: destroy proc NUM\n");
349                 return 1;
350         }
351         if (!strcmp(argv[1], "all")) {
352                 print_allpids();
353         } else if (!strcmp(argv[1], "pid")) {
354                 if (argc != 3) {
355                         printk("Give me a pid number.\n");
356                         return 1;
357                 }
358                 print_proc_info(strtol(argv[2], 0, 0));
359         } else if (!strcmp(argv[1], "unlock")) {
360                 if (argc != 3) {
361                         printk("Gimme lock address!  Me want lock address!.\n");
362                         return 1;
363                 }
364                 spinlock_t *lock = (spinlock_t*)strtol(argv[2], 0, 16);
365                 if (!lock) {
366                         printk("Null address...\n");
367                         return 1;
368                 }
369                 spin_unlock(lock);
370         } else if (!strcmp(argv[1], "kill")) {
371                 if (argc != 3) {
372                         printk("Give me a pid number.\n");
373                         return 1;
374                 }
375                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
376                 if (!p) {
377                         printk("No such proc\n");
378                         return 1;
379                 }
380                 enable_irqsave(&irq_state);
381                 proc_destroy(p);
382                 disable_irqsave(&irq_state);
383                 proc_decref(p);
384         } else {
385                 printk("Bad option\n");
386                 return 1;
387         }
388         return 0;
389 }
390
391 int mon_pip(int argc, char **argv, struct hw_trapframe *hw_tf)
392 {
393         if (argc != 2) {
394                 printk("Give me a pid number.\n");
395                 return 1;
396         }
397         print_proc_info(strtol(argv[1], 0, 0));
398         return 0;
399 }
400
401 int mon_kill(int argc, char **argv, struct hw_trapframe *hw_tf)
402 {
403         struct proc *p;
404         int8_t irq_state = 0;
405         if (argc < 2) {
406                 printk("Usage: kill PID\n");
407                 return 1;
408         }
409         p = pid2proc(strtol(argv[1], 0, 0));
410         if (!p) {
411                 printk("No such proc\n");
412                 return 1;
413         }
414         enable_irqsave(&irq_state);
415         proc_destroy(p);
416         disable_irqsave(&irq_state);
417         proc_decref(p);
418         return 0;
419 }
420
421 int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
422 {
423         return -1;
424 }
425
426 int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
427 {
428         void (*func)(void *arg, ...);
429
430         if (argc < 2) {
431                 printk("Usage: kfunc FUNCTION [arg1] [arg2] [etc]\n");
432                 printk("Arguments must be in hex.  Can take 6 args.\n");
433                 return 1;
434         }
435         func = (void*)get_symbol_addr(argv[1]);
436         if (!func) {
437                 printk("Function not found.\n");
438                 return 1;
439         }
440         /* Not elegant, but whatever.  maybe there's a better syntax, or we can do
441          * it with asm magic. */
442         switch (argc) {
443                 case 2: /* have to fake one arg */
444                         func((void*)0);
445                         break;
446                 case 3: /* the real first arg */
447                         func((void*)strtol(argv[2], 0, 16));
448                         break;
449                 case 4:
450                         func((void*)strtol(argv[2], 0, 16),
451                                     strtol(argv[3], 0, 16));
452                         break;
453                 case 5:
454                         func((void*)strtol(argv[2], 0, 16),
455                                     strtol(argv[3], 0, 16),
456                                     strtol(argv[4], 0, 16));
457                         break;
458                 case 6:
459                         func((void*)strtol(argv[2], 0, 16),
460                                     strtol(argv[3], 0, 16),
461                                     strtol(argv[4], 0, 16),
462                                     strtol(argv[5], 0, 16));
463                         break;
464                 case 7:
465                         func((void*)strtol(argv[2], 0, 16),
466                                     strtol(argv[3], 0, 16),
467                                     strtol(argv[4], 0, 16),
468                                     strtol(argv[5], 0, 16),
469                                     strtol(argv[6], 0, 16));
470                         break;
471                 case 8:
472                         func((void*)strtol(argv[2], 0, 16),
473                                     strtol(argv[3], 0, 16),
474                                     strtol(argv[4], 0, 16),
475                                     strtol(argv[5], 0, 16),
476                                     strtol(argv[6], 0, 16),
477                                     strtol(argv[7], 0, 16));
478                         break;
479                 default:
480                         printk("Bad number of arguments.\n");
481                         return -1;
482         }
483         return 0;
484 }
485
486 /* Sending a vcoreid forces an event and an IPI/notification */
487 int mon_notify(int argc, char **argv, struct hw_trapframe *hw_tf)
488 {
489         struct proc *p;
490         uint32_t vcoreid;
491         struct event_msg msg = {0};
492
493         if (argc < 3) {
494                 printk("Usage: notify PID NUM [VCOREID]\n");
495                 return 1;
496         }
497         p = pid2proc(strtol(argv[1], 0, 0));
498         if (!p) {
499                 printk("No such proc\n");
500                 return 1;
501         }
502         msg.ev_type = strtol(argv[2], 0, 0);
503         if (argc == 4) {
504                 vcoreid = strtol(argv[3], 0, 0);
505                 /* This will go to the private mbox */
506                 post_vcore_event(p, &msg, vcoreid, EVENT_VCORE_PRIVATE);
507                 proc_notify(p, vcoreid);
508         } else {
509                 /* o/w, try and do what they want */
510                 send_kernel_event(p, &msg, 0);
511         }
512         proc_decref(p);
513         return 0;
514 }
515
516 /* Micro-benchmarky Measurements.  This is really fragile code that probably
517  * won't work perfectly, esp as the kernel evolves. */
518 int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
519 {
520         uint64_t begin = 0, diff = 0;
521         uint32_t end_refcnt = 0;
522         int8_t irq_state = 0;
523
524         if (argc < 2) {
525                 printk("Usage: measure OPTION\n");
526                 printk("\tkill PID : kill proc PID\n");
527                 printk("\tpreempt PID : preempt proc PID (no delay)\n");
528                 printk("\tpreempt PID [pcore] : preempt PID's pcore (no delay)\n");
529                 printk("\tpreempt-warn PID : warn-preempt proc PID (pending)\n");
530                 printk("\tpreempt-warn PID [pcore] : warn-preempt proc PID's pcore\n");
531                 printk("\tpreempt-raw PID : raw-preempt proc PID\n");
532                 printk("\tpreempt-raw PID [pcore] : raw-preempt proc PID's pcore\n");
533                 return 1;
534         }
535         if (!strcmp(argv[1], "kill")) {
536                 if (argc < 3) {
537                         printk("Give me a pid number.\n");
538                         return 1;
539                 }
540                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
541                 if (!p) {
542                         printk("No such proc\n");
543                         return 1;
544                 }
545                 begin = start_timing();
546 #ifdef CONFIG_APPSERVER
547                 printk("Warning: this will be inaccurate due to the appserver.\n");
548                 end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores - 1;
549 #endif /* CONFIG_APPSERVER */
550                 enable_irqsave(&irq_state);
551                 proc_destroy(p);
552                 disable_irqsave(&irq_state);
553                 proc_decref(p);
554 #ifdef CONFIG_APPSERVER
555                 /* Won't be that accurate, since it's not actually going through the
556                  * __proc_free() path. */
557                 spin_on(kref_refcnt(&p->p_kref) != end_refcnt); 
558 #else
559                 /* this is a little ghetto. it's not fully free yet, but we are also
560                  * slowing it down by messing with it, esp with the busy waiting on a
561                  * hyperthreaded core. */
562                 spin_on(p->env_cr3);
563 #endif /* CONFIG_APPSERVER */
564                 /* No noticeable difference using stop_timing instead of read_tsc() */
565                 diff = stop_timing(begin);
566         } else if (!strcmp(argv[1], "preempt")) {
567                 if (argc < 3) {
568                         printk("Give me a pid number.\n");
569                         return 1;
570                 }
571                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
572                 if (!p) {
573                         printk("No such proc\n");
574                         return 1;
575                 }
576                 if (argc == 4) { /* single core being preempted, warned but no delay */
577                         uint32_t pcoreid = strtol(argv[3], 0, 0);
578                         begin = start_timing();
579                         if (proc_preempt_core(p, pcoreid, 1000000)) {
580                                 __sched_put_idle_core(p, pcoreid);
581                                 /* done when unmapped (right before abandoning) */
582                                 spin_on(p->procinfo->pcoremap[pcoreid].valid);
583                         } else {
584                                 printk("Core %d was not mapped to proc\n", pcoreid);
585                         }
586                         diff = stop_timing(begin);
587                 } else { /* preempt all cores, warned but no delay */
588                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
589                         begin = start_timing();
590                         proc_preempt_all(p, 1000000);
591                         /* a little ghetto, implies no one is using p */
592                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
593                         diff = stop_timing(begin);
594                 }
595                 proc_decref(p);
596         } else if (!strcmp(argv[1], "preempt-warn")) {
597                 if (argc < 3) {
598                         printk("Give me a pid number.\n");
599                         return 1;
600                 }
601                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
602                 if (!p) {
603                         printk("No such proc\n");
604                         return 1;
605                 }
606                 printk("Careful: if this hangs, then the process isn't responding.\n");
607                 if (argc == 4) { /* single core being preempted-warned */
608                         uint32_t pcoreid = strtol(argv[3], 0, 0);
609                         spin_lock(&p->proc_lock);
610                         uint32_t vcoreid = p->procinfo->pcoremap[pcoreid].vcoreid;
611                         if (!p->procinfo->pcoremap[pcoreid].valid) {
612                                 printk("Pick a mapped pcore\n");
613                                 spin_unlock(&p->proc_lock);
614                                 return 1;
615                         }
616                         begin = start_timing();
617                         __proc_preempt_warn(p, vcoreid, 1000000); // 1 sec
618                         spin_unlock(&p->proc_lock);
619                         /* done when unmapped (right before abandoning) */
620                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
621                         diff = stop_timing(begin);
622                 } else { /* preempt-warn all cores */
623                         printk("Warning, this won't work if they can't yield their "
624                                "last vcore, will stop at 1!\n");
625                         spin_lock(&p->proc_lock);
626                         begin = start_timing();
627                         __proc_preempt_warnall(p, 1000000);
628                         spin_unlock(&p->proc_lock);
629                         /* target cores do the unmapping / changing of the num_vcores */
630                         spin_on(p->procinfo->num_vcores > 1);
631                         diff = stop_timing(begin);
632                 }
633                 proc_decref(p);
634         } else if (!strcmp(argv[1], "preempt-raw")) {
635                 if (argc < 3) {
636                         printk("Give me a pid number.\n");
637                         return 1;
638                 }
639                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
640                 if (!p) {
641                         printk("No such proc\n");
642                         return 1;
643                 }
644                 if (argc == 4) { /* single core preempted, no warning or waiting */
645                         uint32_t pcoreid = strtol(argv[3], 0, 0);
646                         spin_lock(&p->proc_lock);
647                         if (!p->procinfo->pcoremap[pcoreid].valid) {
648                                 printk("Pick a mapped pcore\n");
649                                 spin_unlock(&p->proc_lock);
650                                 return 1;
651                         }
652                         begin = start_timing();
653                         __proc_preempt_core(p, pcoreid);
654                         if (!p->procinfo->num_vcores)
655                                 __proc_set_state(p, PROC_RUNNABLE_M);
656                         spin_unlock(&p->proc_lock);
657                         /* ghetto, since the ksched should be calling all of this */
658                         __sched_put_idle_core(p, pcoreid);
659                         /* done when unmapped (right before abandoning) */
660                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
661                         diff = stop_timing(begin);
662                 } else { /* preempt all cores, no warning or waiting */
663                         spin_lock(&p->proc_lock);
664                         uint32_t pc_arr[p->procinfo->num_vcores];
665                         uint32_t num_revoked;
666                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
667                         begin = start_timing();
668                         num_revoked = __proc_preempt_all(p, pc_arr);
669                         __proc_set_state(p, PROC_RUNNABLE_M);
670                         spin_unlock(&p->proc_lock);
671                         if (num_revoked)
672                                 __sched_put_idle_cores(p, pc_arr, num_revoked);
673                         /* a little ghetto, implies no one else is using p */
674                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
675                         diff = stop_timing(begin);
676                 }
677                 proc_decref(p);
678         } else {
679                 printk("Bad option\n");
680                 return 1;
681         }
682         printk("[Tired Giraffe Accent] Took %llu usec (%llu nsec) to finish.\n",
683                tsc2usec(diff), tsc2nsec(diff));
684         return 0;
685 }
686
687 /* Used in various debug locations.  Not a kernel API or anything. */
688 bool mon_verbose_trace = FALSE;
689
690 int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
691 {
692         int core;
693         if (argc < 2) {
694                 printk("Usage: trace OPTION\n");
695                 printk("\tsyscall start [silent (0 or non-zero, NOT the word silent)] [pid]: starts tracing\n");
696                 printk("\tsyscall stop: stops tracing.\n");
697                 printk("\tcoretf COREID: prints PC, -1 for all cores, verbose => TF\n");
698                 printk("\tpcpui [type [coreid]]: runs pcpui trace ring handlers\n");
699                 printk("\tpcpui-reset [noclear]: resets/clears pcpui trace ring\n");
700                 printk("\tverbose: toggles verbosity, depends on trace command\n");
701                 return 1;
702         }
703         if (!strcmp(argv[1], "syscall")) {
704                 if (argc < 3) {
705                         printk("Need a start or stop.\n");
706                         return 1;
707                 }
708                 if (!strcmp(argv[2], "start")) {
709                         bool all = TRUE;
710                         bool silent = FALSE;
711                         struct proc *p = NULL;
712                         if (argc >= 4) {
713                                 silent = (bool)strtol(argv[3], 0, 0);
714                         }
715                         if (argc >= 5) {
716                                 all = FALSE;
717                                 p = pid2proc(strtol(argv[4], 0, 0));
718                                 if (!p) {
719                                         printk("No such process\n");
720                                         return 1;
721                                 }
722                         }
723                         systrace_start(silent);
724                         if (systrace_reg(all, p))
725                                 printk("No room to trace more processes\n");
726                 } else if (!strcmp(argv[2], "stop")) {
727                         /* Stop. To see the output, kfunc systrace_print and systrace_clear */
728                         /* or cat #K/kptrace or /prof/kptrace */
729                         systrace_stop();
730                 }
731         } else if (!strcmp(argv[1], "coretf")) {
732                 if (argc != 3) {
733                         printk("Need a coreid, fool.\n");
734                         return 1;
735                 }
736                 core = strtol(argv[2], 0, 0);
737                 if (core < 0) {
738                         printk("Sending NMIs to all cores:\n");
739                         for (int i = 0; i < num_cpus; i++)
740                                 send_nmi(i);
741                 } else {
742                         printk("Sending NMI core %d:\n", core);
743                         if (core >= num_cpus) {
744                                 printk("No such core!  Maybe it's in another cell...\n");
745                                 return 1;
746                         }
747                         send_nmi(core);
748                 }
749                 udelay(1000000);
750         } else if (!strcmp(argv[1], "pcpui")) {
751                 int pcpui_type, pcpui_coreid;
752                 if (argc >= 3)
753                         pcpui_type = strtol(argv[2], 0, 0);
754                 else
755                         pcpui_type = 0;
756                 printk("\nRunning PCPUI Trace Ring handlers for type %d\n", pcpui_type);
757                 if (argc >= 4) {
758                         pcpui_coreid = strtol(argv[3], 0, 0); 
759                         pcpui_tr_foreach(pcpui_coreid, pcpui_type);
760                 } else {
761                         pcpui_tr_foreach_all(pcpui_type);
762                 }
763         } else if (!strcmp(argv[1], "pcpui-reset")) {
764                 if (argc >= 3) {
765                         printk("\nResetting all PCPUI Trace Rings\n");
766                         pcpui_tr_reset_all();
767                 } else {
768                         printk("\nResetting and clearing all PCPUI Trace Rings\n");
769                         pcpui_tr_reset_and_clear_all();
770                 }
771         } else if (!strcmp(argv[1], "verbose")) {
772                 if (mon_verbose_trace) {
773                         printk("Turning trace verbosity off\n");
774                         mon_verbose_trace = FALSE;
775                 } else {
776                         printk("Turning trace verbosity on\n");
777                         mon_verbose_trace = TRUE;
778                 }
779         } else if (!strcmp(argv[1], "opt2")) {
780                 if (argc != 3) {
781                         printk("ERRRRRRRRRR.\n");
782                         return 1;
783                 }
784                 print_proc_info(strtol(argv[2], 0, 0));
785         } else {
786                 printk("Bad option\n");
787                 return 1;
788         }
789         return 0;
790 }
791
792 int mon_monitor(int argc, char **argv, struct hw_trapframe *hw_tf)
793 {
794         if (argc < 2) {
795                 printk("Usage: monitor COREID\n");
796                 return 1;
797         }
798         uint32_t core = strtol(argv[1], 0, 0);
799         if (core >= num_cpus) {
800                 printk("No such core!  Maybe it's in another cell...\n");
801                 return 1;
802         }
803         send_kernel_message(core, __run_mon, 0, 0, 0, KMSG_ROUTINE);
804         return 0;
805 }
806
807 /***** Kernel monitor command interpreter *****/
808
809 #define WHITESPACE "\t\r\n "
810 #define MAXARGS 16
811
812
813 int onecmd(int argc, char *argv[], struct hw_trapframe *hw_tf) {
814         int i;
815         if (!argc)
816                 return -1;
817         for (i = 0; i < NCOMMANDS; i++) {
818                 if (strcmp(argv[0], commands[i].name) == 0)
819                         return commands[i].func(argc, argv, hw_tf);
820         }
821         return -1;
822 }
823
824 static int runcmd(char *real_buf, struct hw_trapframe *hw_tf) {
825         char * buf = real_buf;
826         int argc;
827         char *argv[MAXARGS];
828         int i;
829
830         // Parse the command buffer into whitespace-separated arguments
831         argc = 0;
832         argv[argc] = 0;
833         while (1) {
834                 // gobble whitespace
835                 while (*buf && strchr(WHITESPACE, *buf))
836                         *buf++ = 0;
837                 if (*buf == 0)
838                         break;
839
840                 // save and scan past next arg
841                 if (argc == MAXARGS-1) {
842                         cprintf("Too many arguments (max %d)\n", MAXARGS);
843                         return 0;
844                 }
845                 //This will get fucked at runtime..... in the ASS
846                 argv[argc++] = buf;
847                 while (*buf && !strchr(WHITESPACE, *buf))
848                         buf++;
849         }
850         argv[argc] = 0;
851
852         // Lookup and invoke the command
853         if (argc == 0)
854                 return 0;
855         for (i = 0; i < NCOMMANDS; i++) {
856                 if (strcmp(argv[0], commands[i].name) == 0)
857                         return commands[i].func(argc, argv, hw_tf);
858         }
859         cprintf("Unknown command '%s'\n", argv[0]);
860         return 0;
861 }
862
863 void monitor(struct hw_trapframe *hw_tf)
864 {
865         #define MON_CMD_LENGTH 256
866         char buf[MON_CMD_LENGTH];
867         int cnt;
868         int coreid = core_id_early();
869
870         /* they are always disabled, since we have this irqsave lock */
871         if (irq_is_enabled())
872                 printk("Entering Nanwan's Dungeon on Core %d (Ints on):\n", coreid);
873         else
874                 printk("Entering Nanwan's Dungeon on Core %d (Ints off):\n", coreid);
875         printk("Type 'help' for a list of commands.\n");
876
877         if (hw_tf != NULL)
878                 print_trapframe(hw_tf);
879
880         while (1) {
881                 /* on occasion, the kernel monitor can migrate (like if you run
882                  * something that blocks / syncs and wakes up on another core) */
883                 cmb();
884                 cnt = readline(buf, MON_CMD_LENGTH, "ROS(Core %d)> ", core_id_early());
885                 if (cnt > 0) {
886                         buf[cnt] = 0;
887                         if (runcmd(buf, hw_tf) < 0)
888                                 break;
889                 }
890         }
891 }
892
893 static void pm_flusher(void *unused)
894 {
895         struct super_block *sb;
896         struct inode *inode;
897         unsigned long nr_pages;
898
899         /* could also put the delay between calls, or even within remove, during the
900          * WB phase. */
901         while (1) {
902                 udelay_sched(5000);
903                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
904                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
905                                 nr_pages = ROUNDUP(inode->i_size, PGSIZE) >> PGSHIFT;
906                                 if (nr_pages)
907                                         pm_remove_contig(inode->i_mapping, 0, nr_pages);
908                         }
909                 }
910         }
911 }
912
913 int mon_fs(int argc, char **argv, struct hw_trapframe *hw_tf)
914 {
915         /* this assumes one mounted FS at the NS root */
916         struct super_block *sb;
917         struct file *file;
918         struct inode *inode;
919         struct dentry *dentry;
920         if (argc < 2) {
921                 printk("Usage: fs OPTION\n");
922                 printk("\topen: show all open files\n");
923                 printk("\tinodes: show all inodes\n");
924                 printk("\tdentries [lru|prune]: show all dentries, opt LRU/prune\n");
925                 printk("\tls DIR: print the dir tree starting with DIR\n");
926                 printk("\tpid: proc PID's fs crap placeholder\n");
927                 printk("\tpmflusher: start a ktask to keep flushing all PMs\n");
928                 return 1;
929         }
930         if (!strcmp(argv[1], "open")) {
931                 printk("Open Files:\n----------------------------\n");
932                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
933                         printk("Superblock for %s\n", sb->s_name);
934                         TAILQ_FOREACH(file, &sb->s_files, f_list)
935                                 printk("File: %p, %s, Refs: %d, Drefs: %d, Irefs: %d PM: %p\n",
936                                        file, file_name(file), kref_refcnt(&file->f_kref),
937                                        kref_refcnt(&file->f_dentry->d_kref),
938                                        kref_refcnt(&file->f_dentry->d_inode->i_kref),
939                                            file->f_mapping);
940                 }
941         } else if (!strcmp(argv[1], "inodes")) {
942                 printk("Mounted FS Inodes:\n----------------------------\n");
943                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
944                         printk("Superblock for %s\n", sb->s_name);
945                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
946                                 printk("Inode: %p, Refs: %d, Nlinks: %d, Size(B): %d\n",
947                                        inode, kref_refcnt(&inode->i_kref), inode->i_nlink,
948                                        inode->i_size);
949                                 TAILQ_FOREACH(dentry, &inode->i_dentry, d_alias)
950                                         printk("\t%s: Dentry: %p, Refs: %d\n",
951                                                dentry->d_name.name, dentry,
952                                                kref_refcnt(&dentry->d_kref));
953                         }
954                 }
955         } else if (!strcmp(argv[1], "dentries")) {
956                 printk("Dentry Cache:\n----------------------------\n");
957                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
958                         printk("Superblock for %s\n", sb->s_name);
959                         printk("DENTRY     FLAGS      REFCNT NAME\n");
960                         printk("--------------------------------\n");
961                         /* Hash helper */
962                         void print_dcache_entry(void *item)
963                         {
964                                 struct dentry *d_i = (struct dentry*)item;
965                                 printk("%p %p %02d     %s\n", d_i, d_i->d_flags,
966                                        kref_refcnt(&d_i->d_kref), d_i->d_name.name);
967                         }
968                         hash_for_each(sb->s_dcache, print_dcache_entry);
969                 }
970                 if (argc < 3)
971                         return 0;
972                 if (!strcmp(argv[2], "lru")) {
973                         printk("LRU lists:\n");
974                         TAILQ_FOREACH(sb, &super_blocks, s_list) {
975                                 printk("Superblock for %s\n", sb->s_name);
976                                 TAILQ_FOREACH(dentry, &sb->s_lru_d, d_lru)
977                                         printk("Dentry: %p, Name: %s\n", dentry,
978                                                dentry->d_name.name);
979                         }
980                 } else if (!strcmp(argv[2], "prune")) {
981                         printk("Pruning unused dentries\n");
982                         TAILQ_FOREACH(sb, &super_blocks, s_list)
983                                 dcache_prune(sb, FALSE);
984                 }
985         } else if (!strcmp(argv[1], "ls")) {
986                 if (argc != 3) {
987                         printk("Give me a dir.\n");
988                         return 1;
989                 }
990                 if (argv[2][0] != '/') {
991                         printk("Dear fellow giraffe lover, Use absolute paths.\n");
992                         return 1;
993                 }
994                 ls_dash_r(argv[2]);
995                 /* whatever.  placeholder. */
996         } else if (!strcmp(argv[1], "pid")) {
997                 if (argc != 3) {
998                         printk("Give me a pid number.\n");
999                         return 1;
1000                 }
1001                 /* whatever.  placeholder. */
1002         } else if (!strcmp(argv[1], "pmflusher")) {
1003                 ktask("pm_flusher", pm_flusher, 0);
1004         } else {
1005                 printk("Bad option\n");
1006                 return 1;
1007         }
1008         return 0;
1009 }
1010
1011 int mon_bb(int argc, char **argv, struct hw_trapframe *hw_tf)
1012 {
1013         char *l_argv[3] = {"", "busybox", "ash"};
1014         return mon_bin_run(3, l_argv, hw_tf);
1015 }
1016
1017 int mon_alarm(int argc, char **argv, struct hw_trapframe *hw_tf)
1018 {
1019         if (argc < 2) {
1020                 printk("Usage: alarm OPTION\n");
1021                 printk("\tpcpu: print full alarm tchains from every core\n");
1022                 return 1;
1023         }
1024         if (!strcmp(argv[1], "pcpu")) {
1025                 print_pcpu_chains();
1026         } else {
1027                 printk("Bad option\n");
1028                 return 1;
1029         }
1030         return 0;
1031 }
1032
1033 static void show_msr(struct hw_trapframe *unused, void *v)
1034 {
1035         int core = core_id();
1036         uint64_t val;
1037         uint32_t msr = *(uint32_t *)v;
1038         val = read_msr(msr);
1039         printk("%d: %08x: %016llx\n", core, msr, val);
1040 }
1041
1042 struct set {
1043         uint32_t msr;
1044         uint64_t val;
1045 };
1046
1047 static void set_msr(struct hw_trapframe *unused, void *v)
1048 {
1049         int core = core_id();
1050         struct set *s = v;
1051         uint32_t msr = s->msr;
1052         uint64_t val = s->val;
1053         write_msr(msr, val);
1054         val = read_msr(msr);
1055         printk("%d: %08x: %016llx\n", core, msr, val);
1056 }
1057
1058 int mon_msr(int argc, char **argv, struct hw_trapframe *hw_tf)
1059 {
1060 #ifndef CONFIG_X86
1061         cprintf("Not on this architecture\n");
1062         return 1;
1063 #else
1064         uint64_t val;
1065         uint32_t msr;
1066         if (argc < 2 || argc > 3) {
1067                 printk("Usage: msr register [value]\n");
1068                 return 1;
1069         }
1070         msr = strtoul(argv[1], 0, 16);
1071         handler_wrapper_t *w;
1072         smp_call_function_all(show_msr, &msr, &w);
1073         smp_call_wait(w);
1074
1075         if (argc < 3)
1076                 return 0;
1077         /* somewhat bogus on 32 bit. */
1078         val = strtoul(argv[2], 0, 16);
1079
1080         struct set set;
1081         set.msr = msr;
1082         set.val = val;
1083         smp_call_function_all(set_msr, &set, &w);
1084         smp_call_wait(w);
1085         return 0;
1086 #endif
1087 }
1088
1089 int mon_db(int argc, char **argv, struct hw_trapframe *hw_tf)
1090 {
1091         if (argc < 2) {
1092                 printk("Usage: db OPTION\n");
1093                 printk("\tsem: print all semaphore info\n");
1094                 printk("\taddr: for PID lookup ADDR's file/vmr info\n");
1095                 return 1;
1096         }
1097         if (!strcmp(argv[1], "sem")) {
1098                 print_all_sem_info();
1099         } else if (!strcmp(argv[1], "addr")) {
1100                 if (argc < 4) {
1101                         printk("Usage: db addr PID 0xADDR\n");
1102                         return 1;
1103                 }
1104                 debug_addr_pid(strtol(argv[2], 0, 10), strtol(argv[3], 0, 16));
1105         } else {
1106                 printk("Bad option\n");
1107                 return 1;
1108         }
1109         return 0;
1110 }
1111
1112 int mon_px(int argc, char **argv, struct hw_trapframe *hw_tf)
1113 {
1114         set_printx(2);
1115         printk("Printxing is now %sabled\n", printx_on ? "en" : "dis");
1116         return 0;
1117 }
1118
1119 /* Super hack.  Given a kernel hw_tf, we hack the RIP to smp_idle, then return
1120  * to it.  Any locks or other stuff being done is completely lost, so you could
1121  * deadlock.  This gets out of the "we're totall screwed, but don't want to
1122  * reboot right now", typically caused by screw-ups from the monitor. */
1123 int mon_kpfret(int argc, char **argv, struct hw_trapframe *hw_tf)
1124 {
1125         struct per_cpu_info *pcpui = &per_cpu_info[core_id()];
1126
1127         /* if monitor had a TF, try to use that */
1128         if (!hw_tf) {
1129                 if (argc < 2) {
1130                         printk("Usage: kpfret HW_TF\n");
1131                         return 1;
1132                 }
1133                 /* the hw_tf passed in is the one we got from monitor, which is 0 from
1134                  * panics. */
1135                 hw_tf = (struct hw_trapframe*)strtol(argv[1], 0, 16);
1136         }
1137
1138         if (!in_kernel(hw_tf)) {
1139                 printk("hw_tf %p was not a kernel tf!\n", hw_tf);
1140                 return -1;
1141         }
1142
1143 #ifdef CONFIG_X86
1144         hw_tf->tf_rip = (uintptr_t)smp_idle;
1145         dec_ktrap_depth(pcpui);
1146
1147         asm volatile("mov %0, %%rsp;"
1148                      "addq $0x10, %%rsp;"
1149                      "popq %%rax;"
1150                      "popq %%rbx;"
1151                      "popq %%rcx;"
1152                      "popq %%rdx;"
1153                      "popq %%rbp;"
1154                      "popq %%rsi;"
1155                      "popq %%rdi;"
1156                      "popq %%r8;"
1157                      "popq %%r9;"
1158                      "popq %%r10;"
1159                      "popq %%r11;"
1160                      "popq %%r12;"
1161                      "popq %%r13;"
1162                      "popq %%r14;"
1163                      "popq %%r15;"
1164                      "addq $0x10, %%rsp;"
1165                      "iretq;"
1166                                  : : "r"(hw_tf));
1167         assert(0);
1168 #else
1169         printk("KPF return not supported\n");
1170         return -1;
1171 #endif /* CONFIG_X86 */
1172 }
1173
1174 int mon_ks(int argc, char **argv, struct hw_trapframe *hw_tf)
1175 {
1176         if (argc < 2) {
1177 usage:
1178                 printk("Usage: ks OPTION\n");
1179                 printk("\tidles: show idle core map\n");
1180                 printk("\tdiag: scheduler diagnostic report\n");
1181                 printk("\tresources: show resources wanted/granted for all procs\n");
1182                 printk("\tsort: sorts the idlecoremap, 1..n\n");
1183                 printk("\tnc PCOREID: sets the next CG core allocated\n");
1184                 return 1;
1185         }
1186         if (!strcmp(argv[1], "idles")) {
1187                 print_idlecoremap();
1188         } else if (!strcmp(argv[1], "diag")) {
1189                 sched_diag();
1190         } else if (!strcmp(argv[1], "resources")) {
1191                 print_all_resources();
1192         } else if (!strcmp(argv[1], "sort")) {
1193                 sort_idles();
1194         } else if (!strcmp(argv[1], "nc")) {
1195                 if (argc != 3) {
1196                         printk("Need a pcore number.\n");
1197                         return 1;
1198                 }
1199                 next_core(strtol(argv[2], 0, 0));
1200         } else {
1201                 printk("Bad option %s\n", argv[1]);
1202                 goto usage;
1203         }
1204         return 0;
1205 }