Allow kfunc to take decimals and print the retval
[akaros.git] / kern / src / monitor.c
1 // Simple command-line kernel monitor useful for
2 // controlling the kernel and exploring the system interactively.
3
4 #include <arch/arch.h>
5 #include <stab.h>
6 #include <smp.h>
7 #include <console.h>
8 #include <arch/console.h>
9
10 #include <stdio.h>
11 #include <string.h>
12 #include <assert.h>
13 #include <monitor.h>
14 #include <trap.h>
15 #include <pmap.h>
16 #include <kdebug.h>
17 #include <testing.h>
18 #include <manager.h>
19 #include <schedule.h>
20 #include <kdebug.h>
21 #include <syscall.h>
22 #include <kmalloc.h>
23 #include <elf.h>
24 #include <event.h>
25 #include <trap.h>
26 #include <time.h>
27
28 #include <ros/memlayout.h>
29 #include <ros/event.h>
30
31 #define CMDBUF_SIZE     80      // enough for one VGA text line
32
33 typedef struct command {
34         const char *name;
35         const char *desc;
36         // return -1 to force monitor to exit
37         int (*func)(int argc, char **argv, struct hw_trapframe *hw_tf);
38 } command_t;
39
40 static command_t commands[] = {
41         { "help", "Display this list of commands", mon_help },
42         { "kerninfo", "Display information about the kernel", mon_kerninfo },
43         { "backtrace", "Dump a backtrace", mon_backtrace },
44         { "bt", "Dump a backtrace", mon_backtrace },
45         { "reboot", "Take a ride to the South Bay", mon_reboot },
46         { "showmapping", "Shows VA->PA mappings", mon_showmapping},
47         { "sm", "Shows VA->PA mappings", mon_sm},
48         { "cpuinfo", "Prints CPU diagnostics", mon_cpuinfo},
49         { "ps", "Prints process list", mon_ps},
50         { "nanwan", "Meet Nanwan!!", mon_nanwan},
51         { "bin_ls", "List files in /bin", mon_bin_ls},
52         { "bin_run", "Create and run a program from /bin", mon_bin_run},
53         { "manager", "Run the manager", mon_manager},
54         { "procinfo", "Show information about processes", mon_procinfo},
55         { "pip", "Shorthand for procinfo pid", mon_pip},
56         { "kill", "Kills a process", mon_kill},
57         { "exit", "Leave the monitor", mon_exit},
58         { "e", "Leave the monitor", mon_exit},
59         { "kfunc", "Run a kernel function directly (!!!)", mon_kfunc},
60         { "notify", "Notify a process.  Vcoreid will skip their prefs", mon_notify},
61         { "measure", "Run a specific measurement", mon_measure},
62         { "trace", "Run some tracing functions", mon_trace},
63         { "monitor", "Run the monitor on another core", mon_monitor},
64         { "fs", "Filesystem Diagnostics", mon_fs},
65         { "bb", "Try to run busybox (ash)", mon_bb},
66         { "alarm", "Alarm Diagnostics", mon_alarm},
67         { "msr", "read/write msr: msr msr [value]", mon_msr},
68         { "db", "Misc debugging", mon_db},
69         { "px", "Toggle printx", mon_px},
70         { "kpfret", "Attempt to idle after a kernel fault", mon_kpfret},
71         { "ks", "Kernel scheduler hacks", mon_ks},
72         { "gfp", "Get free pages", mon_gfp },
73         { "coreinfo", "Print diagnostics for a core", mon_coreinfo},
74 };
75 #define NCOMMANDS (sizeof(commands)/sizeof(commands[0]))
76
77 /***** Implementations of basic kernel monitor commands *****/
78
79 int mon_help(int argc, char **argv, struct hw_trapframe *hw_tf)
80 {
81         int i;
82
83         for (i = 0; i < NCOMMANDS; i++)
84                 cprintf("%s - %s\n", commands[i].name, commands[i].desc);
85         return 0;
86 }
87
88 int mon_ps(int argc, char** argv, struct hw_trapframe *hw_tf)
89 {
90         print_allpids();
91         return 0;
92 }
93
94 int mon_kerninfo(int argc, char **argv, struct hw_trapframe *hw_tf)
95 {
96         extern char _start[], etext[], end[];
97
98         cprintf("Special kernel symbols:\n");
99         cprintf("  _start %016x (virt)  %016x (phys)\n", _start, (uintptr_t)(_start - KERNBASE));
100         cprintf("  etext  %016x (virt)  %016x (phys)\n", etext, (uintptr_t)(etext - KERNBASE));
101         cprintf("  end    %016x (virt)  %016x (phys)\n", end, (uintptr_t)(end - KERNBASE));
102         cprintf("Kernel executable memory footprint: %dKB\n",
103                 (uint32_t)(end-_start+1023)/1024);
104         return 0;
105 }
106
107 static int __backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
108 {
109         uintptr_t pc, fp;
110         if (argc == 1) {
111                 backtrace();
112                 return 0;
113         }
114         if (argc != 3) {
115                 printk("Need either no arguments, or two (PC and FP) in hex\n");
116                 return 1;
117         }
118         pc = strtol(argv[1], 0, 16);
119         fp = strtol(argv[2], 0, 16);
120         printk("Backtrace from instruction %p, with frame pointer %p\n", pc, fp);
121         backtrace_frame(pc, fp);
122         return 0;
123 }
124
125 int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
126 {
127         return __backtrace(argc, argv, hw_tf);
128 }
129
130 int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
131 {
132         cprintf("[Scottish Accent]: She's goin' down, Cap'n!\n");
133         reboot();
134
135         // really, should never see this
136         cprintf("Sigh....\n");
137         return 0;
138 }
139
140 static int __showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
141 {
142         struct proc *p;
143         uintptr_t start;
144         size_t size;
145         pgdir_t pgdir;
146         pid_t pid;
147         if (argc < 3) {
148                 printk("Shows virtual -> physical mappings for a virt addr range.\n");
149                 printk("Usage: showmapping PID START_ADDR [END_ADDR]\n");
150                 printk("    PID == 0 for the boot pgdir\n");
151                 return 1;
152         }
153         pid = strtol(argv[1], 0, 10);
154         if (!pid) {
155                 pgdir = boot_pgdir;
156         } else {
157                 p = pid2proc(pid);
158                 if (!p) {
159                         printk("No proc with pid %d\n", pid);
160                         return 1;
161                 }
162                 pgdir = p->env_pgdir;
163         }
164         start = ROUNDDOWN(strtol(argv[2], 0, 16), PGSIZE);
165         size = (argc == 3) ? 1 : strtol(argv[3], 0, 16) - start;
166         if (size/PGSIZE > 512) {
167                 cprintf("Not going to do this for more than 512 items\n");
168                 return 1;
169         }
170         show_mapping(pgdir, start, size);
171         return 0;
172 }
173
174 int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
175 {
176         return __showmapping(argc, argv, hw_tf);
177 }
178
179 int mon_sm(int argc, char **argv, struct hw_trapframe *hw_tf)
180 {
181         return __showmapping(argc, argv, hw_tf);
182 }
183
184 static spinlock_t print_info_lock = SPINLOCK_INITIALIZER_IRQSAVE;
185
186 static void print_info_handler(struct hw_trapframe *hw_tf, void *data)
187 {
188         uint64_t tsc = read_tsc();
189
190         spin_lock_irqsave(&print_info_lock);
191         cprintf("----------------------------\n");
192         cprintf("This is Core %d\n", core_id());
193         cprintf("Timestamp = %lld\n", tsc);
194 #ifdef CONFIG_X86
195         cprintf("Hardware core %d\n", hw_core_id());
196         cprintf("MTRR_DEF_TYPE = 0x%08x\n", read_msr(IA32_MTRR_DEF_TYPE));
197         cprintf("MTRR Phys0 Base = 0x%016llx, Mask = 0x%016llx\n",
198                 read_msr(0x200), read_msr(0x201));
199         cprintf("MTRR Phys1 Base = 0x%016llx, Mask = 0x%016llx\n",
200                 read_msr(0x202), read_msr(0x203));
201         cprintf("MTRR Phys2 Base = 0x%016llx, Mask = 0x%016llx\n",
202                 read_msr(0x204), read_msr(0x205));
203         cprintf("MTRR Phys3 Base = 0x%016llx, Mask = 0x%016llx\n",
204                 read_msr(0x206), read_msr(0x207));
205         cprintf("MTRR Phys4 Base = 0x%016llx, Mask = 0x%016llx\n",
206                 read_msr(0x208), read_msr(0x209));
207         cprintf("MTRR Phys5 Base = 0x%016llx, Mask = 0x%016llx\n",
208                 read_msr(0x20a), read_msr(0x20b));
209         cprintf("MTRR Phys6 Base = 0x%016llx, Mask = 0x%016llx\n",
210                 read_msr(0x20c), read_msr(0x20d));
211         cprintf("MTRR Phys7 Base = 0x%016llx, Mask = 0x%016llx\n",
212                 read_msr(0x20e), read_msr(0x20f));
213 #endif // CONFIG_X86
214         cprintf("----------------------------\n");
215         spin_unlock_irqsave(&print_info_lock);
216 }
217
218 static bool print_all_info(void)
219 {
220         cprintf("\nCORE 0 asking all cores to print info:\n");
221         smp_call_function_all(print_info_handler, NULL, 0);
222         cprintf("\nDone!\n");
223         return true;
224 }
225
226 int mon_cpuinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
227 {
228         cprintf("Number of Cores detected: %d\n", num_cores);
229         cprintf("Calling CPU's ID: 0x%08x\n", core_id());
230
231         if (argc < 2)
232                 smp_call_function_self(print_info_handler, NULL, 0);
233         else
234                 smp_call_function_single(strtol(argv[1], 0, 10),
235                                          print_info_handler, NULL, 0);
236         return 0;
237 }
238
239 int mon_manager(int argc, char** argv, struct hw_trapframe *hw_tf)
240 {
241         manager();
242         panic("should never get here");
243         return 0;
244 }
245
246 int mon_nanwan(int argc, char **argv, struct hw_trapframe *hw_tf)
247 {
248         /* Borrowed with love from http://www.geocities.com/SoHo/7373/zoo.htm
249          * (http://www.ascii-art.com/).  Slightly modified to make it 25 lines tall.
250          */
251         printk("\n");
252         printk("             .-.  .-.\n");
253         printk("             |  \\/  |\n");
254         printk("            /,   ,_  `'-.\n");
255         printk("          .-|\\   /`\\     '. \n");
256         printk("        .'  0/   | 0\\  \\_  `\".  \n");
257         printk("     .-'  _,/    '--'.'|#''---'\n");
258         printk("      `--'  |       /   \\#\n");
259         printk("            |      /     \\#\n");
260         printk("            \\     ;|\\    .\\#\n");
261         printk("            |' ' //  \\   ::\\# \n");
262         printk("            \\   /`    \\   ':\\#\n");
263         printk("             `\"`       \\..   \\#\n");
264         printk("                        \\::.  \\#\n");
265         printk("                         \\::   \\#\n");
266         printk("                          \\'  .:\\#\n");
267         printk("                           \\  :::\\#\n");
268         printk("                            \\  '::\\#\n");
269         printk("                             \\     \\#\n");
270         printk("                              \\:.   \\#\n");
271         printk("                               \\::   \\#\n");
272         printk("                                \\'   .\\#\n");
273         printk("                             jgs \\   ::\\#\n");
274         printk("                                  \\      \n");
275         return 0;
276 }
277
278 int mon_bin_ls(int argc, char **argv, struct hw_trapframe *hw_tf)
279 {
280         struct dirent dir = {0};
281         struct file *bin_dir;
282         int retval = 0;
283
284         bin_dir = do_file_open("/bin", O_READ, 0);
285         if (!bin_dir) {
286                 printk("No /bin directory!\n");
287                 return 1;
288         }
289         printk("Files in /bin:\n-------------------------------\n");
290         do {
291                 retval = bin_dir->f_op->readdir(bin_dir, &dir);
292                 printk("%s\n", dir.d_name);
293         } while (retval == 1);
294         kref_put(&bin_dir->f_kref);
295         return 0;
296 }
297
298 int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
299 {
300         if (argc < 2) {
301                 printk("Usage: bin_run FILENAME\n");
302                 return 1;
303         }
304         struct file *program;
305         int retval = 0;
306         char buf[5 + MAX_FILENAME_SZ + 1] = "/bin/";    /* /bin/ + max + \0 */
307
308         strlcpy(buf, "/bin/", sizeof(buf));
309         if (strlcat(buf, argv[1], sizeof(buf)) > sizeof(buf)) {
310                 printk("Filename '%s' too long!\n", argv[1]);
311                 return 1;
312         }
313         program = do_file_open(buf, O_READ, 0);
314         if (!program) {
315                 printk("No such program!\n");
316                 return 1;
317         }
318         char **p_argv = kmalloc(sizeof(char*) * argc, 0);       /* bin_run's argc */
319         for (int i = 0; i < argc - 1; i++)
320                 p_argv[i] = argv[i + 1];
321         p_argv[argc - 1] = 0;
322         /* super ugly: we need to stash current, so that proc_create doesn't pick up
323          * on random processes running here and assuming they are the parent */
324         struct proc *old_cur = current;
325         current = 0;
326         struct proc *p = proc_create(program, p_argv, NULL);
327         current = old_cur;
328         kfree(p_argv);
329         proc_wakeup(p);
330         proc_decref(p); /* let go of the reference created in proc_create() */
331         kref_put(&program->f_kref);
332         /* Make a scheduling decision.  You might not get the process you created,
333          * in the event there are others floating around that are runnable */
334         run_scheduler();
335         /* want to idle, so we un the process we just selected.  this is a bit
336          * hackish, but so is the monitor. */
337         smp_idle();
338         assert(0);
339         return 0;
340 }
341
342 int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
343 {
344         if (argc < 2) {
345                 printk("Usage: procinfo OPTION\n");
346                 printk("\tall: show all active pids\n");
347                 printk("\tpid NUM: show a lot of info for proc NUM\n");
348                 printk("\tunlock: unlock the lock for the ADDR (OMG!!!)\n");
349                 printk("\tkill NUM: destroy proc NUM\n");
350                 return 1;
351         }
352         if (!strcmp(argv[1], "all")) {
353                 print_allpids();
354         } else if (!strcmp(argv[1], "pid")) {
355                 if (argc != 3) {
356                         printk("Give me a pid number.\n");
357                         return 1;
358                 }
359                 print_proc_info(strtol(argv[2], 0, 0));
360         } else if (!strcmp(argv[1], "unlock")) {
361                 if (argc != 3) {
362                         printk("Gimme lock address!  Me want lock address!.\n");
363                         return 1;
364                 }
365                 spinlock_t *lock = (spinlock_t*)strtol(argv[2], 0, 16);
366                 if (!lock) {
367                         printk("Null address...\n");
368                         return 1;
369                 }
370                 spin_unlock(lock);
371         } else if (!strcmp(argv[1], "kill")) {
372                 if (argc != 3) {
373                         printk("Give me a pid number.\n");
374                         return 1;
375                 }
376                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
377                 if (!p) {
378                         printk("No such proc\n");
379                         return 1;
380                 }
381                 proc_destroy(p);
382                 proc_decref(p);
383         } else {
384                 printk("Bad option\n");
385                 return 1;
386         }
387         return 0;
388 }
389
390 int mon_pip(int argc, char **argv, struct hw_trapframe *hw_tf)
391 {
392         if (argc != 2) {
393                 printk("Give me a pid number.\n");
394                 return 1;
395         }
396         print_proc_info(strtol(argv[1], 0, 0));
397         return 0;
398 }
399
400 int mon_kill(int argc, char **argv, struct hw_trapframe *hw_tf)
401 {
402         struct proc *p;
403
404         if (argc < 2) {
405                 printk("Usage: kill PID\n");
406                 return 1;
407         }
408         p = pid2proc(strtol(argv[1], 0, 0));
409         if (!p) {
410                 printk("No such proc\n");
411                 return 1;
412         }
413         proc_destroy(p);
414         proc_decref(p);
415         return 0;
416 }
417
418 int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
419 {
420         return -1;
421 }
422
423 int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
424 {
425         long ret;
426         long (*func)(void *arg, ...);
427
428         if (argc < 2) {
429                 printk("Usage: kfunc FUNCTION [arg1] [arg2] [etc]\n");
430                 printk("Use 0x with hex arguments.  Can take 6 args.\n");
431                 return 1;
432         }
433         func = (void*)get_symbol_addr(argv[1]);
434         if (!func) {
435                 printk("Function not found.\n");
436                 return 1;
437         }
438         /* Not elegant, but whatever.  maybe there's a better syntax, or we can do
439          * it with asm magic. */
440         switch (argc) {
441         case 2: /* have to fake one arg */
442                 ret = func((void*)0);
443                 break;
444         case 3: /* the real first arg */
445                 ret = func((void*)strtol(argv[2], 0, 0));
446                 break;
447         case 4:
448                 ret = func((void*)strtol(argv[2], 0, 0),
449                                   strtol(argv[3], 0, 0));
450                 break;
451         case 5:
452                 ret = func((void*)strtol(argv[2], 0, 0),
453                                   strtol(argv[3], 0, 0),
454                                   strtol(argv[4], 0, 0));
455                 break;
456         case 6:
457                 ret = func((void*)strtol(argv[2], 0, 0),
458                                   strtol(argv[3], 0, 0),
459                                   strtol(argv[4], 0, 0),
460                                   strtol(argv[5], 0, 0));
461                 break;
462         case 7:
463                 ret = func((void*)strtol(argv[2], 0, 0),
464                                   strtol(argv[3], 0, 0),
465                                   strtol(argv[4], 0, 0),
466                                   strtol(argv[5], 0, 0),
467                                   strtol(argv[6], 0, 0));
468                 break;
469         case 8:
470                 ret = func((void*)strtol(argv[2], 0, 0),
471                                   strtol(argv[3], 0, 0),
472                                   strtol(argv[4], 0, 0),
473                                   strtol(argv[5], 0, 0),
474                                   strtol(argv[6], 0, 0),
475                                   strtol(argv[7], 0, 0));
476                 break;
477         default:
478                 printk("Bad number of arguments.\n");
479                 return -1;
480         }
481         printk("%s (might have) returned %p\n", argv[1], ret);
482         return 0;
483 }
484
485 /* Sending a vcoreid forces an event and an IPI/notification */
486 int mon_notify(int argc, char **argv, struct hw_trapframe *hw_tf)
487 {
488         struct proc *p;
489         uint32_t vcoreid;
490         struct event_msg msg = {0};
491
492         if (argc < 3) {
493                 printk("Usage: notify PID NUM [VCOREID]\n");
494                 return 1;
495         }
496         p = pid2proc(strtol(argv[1], 0, 0));
497         if (!p) {
498                 printk("No such proc\n");
499                 return 1;
500         }
501         msg.ev_type = strtol(argv[2], 0, 0);
502         if (argc == 4) {
503                 vcoreid = strtol(argv[3], 0, 0);
504                 /* This will go to the private mbox */
505                 post_vcore_event(p, &msg, vcoreid, EVENT_VCORE_PRIVATE);
506                 proc_notify(p, vcoreid);
507         } else {
508                 /* o/w, try and do what they want */
509                 send_kernel_event(p, &msg, 0);
510         }
511         proc_decref(p);
512         return 0;
513 }
514
515 /* Micro-benchmarky Measurements.  This is really fragile code that probably
516  * won't work perfectly, esp as the kernel evolves. */
517 int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
518 {
519         uint64_t begin = 0, diff = 0;
520         uint32_t end_refcnt = 0;
521
522         if (argc < 2) {
523                 printk("Usage: measure OPTION\n");
524                 printk("\tkill PID : kill proc PID\n");
525                 printk("\tpreempt PID : preempt proc PID (no delay)\n");
526                 printk("\tpreempt PID [pcore] : preempt PID's pcore (no delay)\n");
527                 printk("\tpreempt-warn PID : warn-preempt proc PID (pending)\n");
528                 printk("\tpreempt-warn PID [pcore] : warn-preempt proc PID's pcore\n");
529                 printk("\tpreempt-raw PID : raw-preempt proc PID\n");
530                 printk("\tpreempt-raw PID [pcore] : raw-preempt proc PID's pcore\n");
531                 return 1;
532         }
533         if (!strcmp(argv[1], "kill")) {
534                 if (argc < 3) {
535                         printk("Give me a pid number.\n");
536                         return 1;
537                 }
538                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
539                 if (!p) {
540                         printk("No such proc\n");
541                         return 1;
542                 }
543                 begin = start_timing();
544 #ifdef CONFIG_APPSERVER
545                 printk("Warning: this will be inaccurate due to the appserver.\n");
546                 end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores - 1;
547 #endif /* CONFIG_APPSERVER */
548                 proc_destroy(p);
549                 proc_decref(p);
550 #ifdef CONFIG_APPSERVER
551                 /* Won't be that accurate, since it's not actually going through the
552                  * __proc_free() path. */
553                 spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
554 #else
555                 /* this is a little ghetto. it's not fully free yet, but we are also
556                  * slowing it down by messing with it, esp with the busy waiting on a
557                  * hyperthreaded core. */
558                 spin_on(p->env_cr3);
559 #endif /* CONFIG_APPSERVER */
560                 /* No noticeable difference using stop_timing instead of read_tsc() */
561                 diff = stop_timing(begin);
562         } else if (!strcmp(argv[1], "preempt")) {
563                 if (argc < 3) {
564                         printk("Give me a pid number.\n");
565                         return 1;
566                 }
567                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
568                 if (!p) {
569                         printk("No such proc\n");
570                         return 1;
571                 }
572                 if (argc == 4) { /* single core being preempted, warned but no delay */
573                         uint32_t pcoreid = strtol(argv[3], 0, 0);
574                         begin = start_timing();
575                         if (proc_preempt_core(p, pcoreid, 1000000)) {
576                                 __sched_put_idle_core(p, pcoreid);
577                                 /* done when unmapped (right before abandoning) */
578                                 spin_on(p->procinfo->pcoremap[pcoreid].valid);
579                         } else {
580                                 printk("Core %d was not mapped to proc\n", pcoreid);
581                         }
582                         diff = stop_timing(begin);
583                 } else { /* preempt all cores, warned but no delay */
584                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
585                         begin = start_timing();
586                         proc_preempt_all(p, 1000000);
587                         /* a little ghetto, implies no one is using p */
588                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
589                         diff = stop_timing(begin);
590                 }
591                 proc_decref(p);
592         } else if (!strcmp(argv[1], "preempt-warn")) {
593                 if (argc < 3) {
594                         printk("Give me a pid number.\n");
595                         return 1;
596                 }
597                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
598                 if (!p) {
599                         printk("No such proc\n");
600                         return 1;
601                 }
602                 printk("Careful: if this hangs, then the process isn't responding.\n");
603                 if (argc == 4) { /* single core being preempted-warned */
604                         uint32_t pcoreid = strtol(argv[3], 0, 0);
605                         spin_lock(&p->proc_lock);
606                         uint32_t vcoreid = p->procinfo->pcoremap[pcoreid].vcoreid;
607                         if (!p->procinfo->pcoremap[pcoreid].valid) {
608                                 printk("Pick a mapped pcore\n");
609                                 spin_unlock(&p->proc_lock);
610                                 return 1;
611                         }
612                         begin = start_timing();
613                         __proc_preempt_warn(p, vcoreid, 1000000); // 1 sec
614                         spin_unlock(&p->proc_lock);
615                         /* done when unmapped (right before abandoning) */
616                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
617                         diff = stop_timing(begin);
618                 } else { /* preempt-warn all cores */
619                         printk("Warning, this won't work if they can't yield their "
620                                "last vcore, will stop at 1!\n");
621                         spin_lock(&p->proc_lock);
622                         begin = start_timing();
623                         __proc_preempt_warnall(p, 1000000);
624                         spin_unlock(&p->proc_lock);
625                         /* target cores do the unmapping / changing of the num_vcores */
626                         spin_on(p->procinfo->num_vcores > 1);
627                         diff = stop_timing(begin);
628                 }
629                 proc_decref(p);
630         } else if (!strcmp(argv[1], "preempt-raw")) {
631                 if (argc < 3) {
632                         printk("Give me a pid number.\n");
633                         return 1;
634                 }
635                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
636                 if (!p) {
637                         printk("No such proc\n");
638                         return 1;
639                 }
640                 if (argc == 4) { /* single core preempted, no warning or waiting */
641                         uint32_t pcoreid = strtol(argv[3], 0, 0);
642                         spin_lock(&p->proc_lock);
643                         if (!p->procinfo->pcoremap[pcoreid].valid) {
644                                 printk("Pick a mapped pcore\n");
645                                 spin_unlock(&p->proc_lock);
646                                 return 1;
647                         }
648                         begin = start_timing();
649                         __proc_preempt_core(p, pcoreid);
650                         if (!p->procinfo->num_vcores)
651                                 __proc_set_state(p, PROC_RUNNABLE_M);
652                         spin_unlock(&p->proc_lock);
653                         /* ghetto, since the ksched should be calling all of this */
654                         __sched_put_idle_core(p, pcoreid);
655                         /* done when unmapped (right before abandoning) */
656                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
657                         diff = stop_timing(begin);
658                 } else { /* preempt all cores, no warning or waiting */
659                         spin_lock(&p->proc_lock);
660                         uint32_t pc_arr[p->procinfo->num_vcores];
661                         uint32_t num_revoked;
662                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
663                         begin = start_timing();
664                         num_revoked = __proc_preempt_all(p, pc_arr);
665                         __proc_set_state(p, PROC_RUNNABLE_M);
666                         spin_unlock(&p->proc_lock);
667                         if (num_revoked)
668                                 __sched_put_idle_cores(p, pc_arr, num_revoked);
669                         /* a little ghetto, implies no one else is using p */
670                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
671                         diff = stop_timing(begin);
672                 }
673                 proc_decref(p);
674         } else {
675                 printk("Bad option\n");
676                 return 1;
677         }
678         printk("[Tired Giraffe Accent] Took %llu usec (%llu nsec) to finish.\n",
679                tsc2usec(diff), tsc2nsec(diff));
680         return 0;
681 }
682
683 /* Used in various debug locations.  Not a kernel API or anything. */
684 bool mon_verbose_trace = FALSE;
685
686 int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
687 {
688         int core;
689         if (argc < 2) {
690                 printk("Usage: trace OPTION\n");
691                 printk("\tsyscall start [silent (0 or non-zero, NOT the word silent)] [pid]: starts tracing\n");
692                 printk("\tsyscall stop: stops tracing.\n");
693                 printk("\tcoretf COREID: prints PC, -1 for all cores, verbose => TF\n");
694                 printk("\tpcpui [type [coreid]]: runs pcpui trace ring handlers\n");
695                 printk("\tpcpui-reset [noclear]: resets/clears pcpui trace ring\n");
696                 printk("\tverbose: toggles verbosity, depends on trace command\n");
697                 return 1;
698         }
699         if (!strcmp(argv[1], "syscall")) {
700                 if (argc < 3) {
701                         printk("Need a start or stop.\n");
702                         return 1;
703                 }
704                 if (!strcmp(argv[2], "start")) {
705                         systrace_loud = TRUE;
706                 } else if (!strcmp(argv[2], "stop")) {
707                         systrace_loud = FALSE;
708                 } else {
709                         printk("Need a start or stop.\n");
710                         return 1;
711                 }
712         } else if (!strcmp(argv[1], "coretf")) {
713                 if (argc != 3) {
714                         printk("Need a coreid, fool.\n");
715                         return 1;
716                 }
717                 core = strtol(argv[2], 0, 0);
718                 if (core < 0) {
719                         printk("Sending NMIs to all cores:\n");
720                         for (int i = 0; i < num_cores; i++)
721                                 send_nmi(i);
722                 } else {
723                         printk("Sending NMI core %d:\n", core);
724                         if (core >= num_cores) {
725                                 printk("No such core!  Maybe it's in another cell...\n");
726                                 return 1;
727                         }
728                         send_nmi(core);
729                 }
730                 udelay(1000000);
731         } else if (!strcmp(argv[1], "pcpui")) {
732                 int pcpui_type, pcpui_coreid;
733                 if (argc >= 3)
734                         pcpui_type = strtol(argv[2], 0, 0);
735                 else
736                         pcpui_type = 0;
737                 printk("\nRunning PCPUI Trace Ring handlers for type %d\n", pcpui_type);
738                 if (argc >= 4) {
739                         pcpui_coreid = strtol(argv[3], 0, 0);
740                         pcpui_tr_foreach(pcpui_coreid, pcpui_type);
741                 } else {
742                         pcpui_tr_foreach_all(pcpui_type);
743                 }
744         } else if (!strcmp(argv[1], "pcpui-reset")) {
745                 if (argc >= 3) {
746                         printk("\nResetting all PCPUI Trace Rings\n");
747                         pcpui_tr_reset_all();
748                 } else {
749                         printk("\nResetting and clearing all PCPUI Trace Rings\n");
750                         pcpui_tr_reset_and_clear_all();
751                 }
752         } else if (!strcmp(argv[1], "verbose")) {
753                 if (mon_verbose_trace) {
754                         printk("Turning trace verbosity off\n");
755                         mon_verbose_trace = FALSE;
756                 } else {
757                         printk("Turning trace verbosity on\n");
758                         mon_verbose_trace = TRUE;
759                 }
760         } else if (!strcmp(argv[1], "opt2")) {
761                 if (argc != 3) {
762                         printk("ERRRRRRRRRR.\n");
763                         return 1;
764                 }
765                 print_proc_info(strtol(argv[2], 0, 0));
766         } else {
767                 printk("Bad option\n");
768                 return 1;
769         }
770         return 0;
771 }
772
773 int mon_monitor(int argc, char **argv, struct hw_trapframe *hw_tf)
774 {
775         if (argc < 2) {
776                 printk("Usage: monitor COREID\n");
777                 return 1;
778         }
779         uint32_t core = strtol(argv[1], 0, 0);
780         if (core >= num_cores) {
781                 printk("No such core!  Maybe it's in another cell...\n");
782                 return 1;
783         }
784         send_kernel_message(core, __run_mon, 0, 0, 0, KMSG_ROUTINE);
785         return 0;
786 }
787
788 /***** Kernel monitor command interpreter *****/
789
790 #define WHITESPACE "\t\r\n "
791 #define MAXARGS 16
792
793
794 int onecmd(int argc, char *argv[], struct hw_trapframe *hw_tf) {
795         int i;
796         if (!argc)
797                 return -1;
798         for (i = 0; i < NCOMMANDS; i++) {
799                 if (strcmp(argv[0], commands[i].name) == 0)
800                         return commands[i].func(argc, argv, hw_tf);
801         }
802         return -1;
803 }
804
805 static int runcmd(char *real_buf, struct hw_trapframe *hw_tf) {
806         char * buf = real_buf;
807         int argc;
808         char *argv[MAXARGS];
809         int i;
810
811         // Parse the command buffer into whitespace-separated arguments
812         argc = 0;
813         argv[argc] = 0;
814         while (1) {
815                 // gobble whitespace
816                 while (*buf && strchr(WHITESPACE, *buf))
817                         *buf++ = 0;
818                 if (*buf == 0)
819                         break;
820
821                 // save and scan past next arg
822                 if (argc == MAXARGS-1) {
823                         cprintf("Too many arguments (max %d)\n", MAXARGS);
824                         return 0;
825                 }
826                 //This will get fucked at runtime..... in the ASS
827                 argv[argc++] = buf;
828                 while (*buf && !strchr(WHITESPACE, *buf))
829                         buf++;
830         }
831         argv[argc] = 0;
832
833         // Lookup and invoke the command
834         if (argc == 0)
835                 return 0;
836         for (i = 0; i < NCOMMANDS; i++) {
837                 if (strcmp(argv[0], commands[i].name) == 0)
838                         return commands[i].func(argc, argv, hw_tf);
839         }
840         cprintf("Unknown command '%s'\n", argv[0]);
841         return 0;
842 }
843
844 void monitor(struct hw_trapframe *hw_tf)
845 {
846         #define MON_CMD_LENGTH 256
847         char buf[MON_CMD_LENGTH];
848         int cnt;
849         int coreid = core_id_early();
850
851         /* they are always disabled, since we have this irqsave lock */
852         if (irq_is_enabled())
853                 printk("Entering Nanwan's Dungeon on Core %d (Ints on):\n", coreid);
854         else
855                 printk("Entering Nanwan's Dungeon on Core %d (Ints off):\n", coreid);
856         printk("Type 'help' for a list of commands.\n");
857
858         if (hw_tf != NULL)
859                 print_trapframe(hw_tf);
860
861         while (1) {
862                 /* on occasion, the kernel monitor can migrate (like if you run
863                  * something that blocks / syncs and wakes up on another core) */
864                 cmb();
865                 cnt = readline(buf, MON_CMD_LENGTH, "ROS(Core %d)> ", core_id_early());
866                 if (cnt > 0) {
867                         buf[cnt] = 0;
868                         if (runcmd(buf, hw_tf) < 0)
869                                 break;
870                 }
871         }
872 }
873
874 static void pm_flusher(void *unused)
875 {
876         struct super_block *sb;
877         struct inode *inode;
878         unsigned long nr_pages;
879
880         /* could also put the delay between calls, or even within remove, during the
881          * WB phase. */
882         printk("GIANT WARNING: the pm_flusher is running and will never stop!\n");
883         while (1) {
884                 kthread_usleep(5000);
885                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
886                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
887                                 nr_pages = ROUNDUP(inode->i_size, PGSIZE) >> PGSHIFT;
888                                 if (nr_pages)
889                                         pm_remove_contig(inode->i_mapping, 0, nr_pages);
890                         }
891                 }
892         }
893 }
894
895 int mon_fs(int argc, char **argv, struct hw_trapframe *hw_tf)
896 {
897         /* this assumes one mounted FS at the NS root */
898         struct super_block *sb;
899         struct file *file;
900         struct inode *inode;
901         struct dentry *dentry;
902         if (argc < 2) {
903                 printk("Usage: fs OPTION\n");
904                 printk("\topen: show all open files\n");
905                 printk("\tinodes: show all inodes\n");
906                 printk("\tdentries [lru|prune]: show all dentries, opt LRU/prune\n");
907                 printk("\tls DIR: print the dir tree starting with DIR\n");
908                 printk("\tpid: proc PID's fs crap placeholder\n");
909                 printk("\tpmflusher: start a ktask to keep flushing all PMs\n");
910                 return 1;
911         }
912         if (!strcmp(argv[1], "open")) {
913                 printk("Open Files:\n----------------------------\n");
914                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
915                         printk("Superblock for %s\n", sb->s_name);
916                         TAILQ_FOREACH(file, &sb->s_files, f_list)
917                                 printk("File: %p, %s, Refs: %d, Drefs: %d, Irefs: %d PM: %p\n",
918                                        file, file_name(file), kref_refcnt(&file->f_kref),
919                                        kref_refcnt(&file->f_dentry->d_kref),
920                                        kref_refcnt(&file->f_dentry->d_inode->i_kref),
921                                            file->f_mapping);
922                 }
923         } else if (!strcmp(argv[1], "inodes")) {
924                 printk("Mounted FS Inodes:\n----------------------------\n");
925                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
926                         printk("Superblock for %s\n", sb->s_name);
927                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
928                                 printk("Inode: %p, Refs: %d, Nlinks: %d, Size(B): %d\n",
929                                        inode, kref_refcnt(&inode->i_kref), inode->i_nlink,
930                                        inode->i_size);
931                                 TAILQ_FOREACH(dentry, &inode->i_dentry, d_alias)
932                                         printk("\t%s: Dentry: %p, Refs: %d\n",
933                                                dentry->d_name.name, dentry,
934                                                kref_refcnt(&dentry->d_kref));
935                         }
936                 }
937         } else if (!strcmp(argv[1], "dentries")) {
938                 printk("Dentry Cache:\n----------------------------\n");
939                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
940                         printk("Superblock for %s\n", sb->s_name);
941                         printk("DENTRY     FLAGS      REFCNT NAME\n");
942                         printk("--------------------------------\n");
943                         /* Hash helper */
944                         void print_dcache_entry(void *item, void *opaque)
945                         {
946                                 struct dentry *d_i = (struct dentry*)item;
947                                 printk("%p %p %02d     %s\n", d_i, d_i->d_flags,
948                                        kref_refcnt(&d_i->d_kref), d_i->d_name.name);
949                         }
950                         hash_for_each(sb->s_dcache, print_dcache_entry, NULL);
951                 }
952                 if (argc < 3)
953                         return 0;
954                 if (!strcmp(argv[2], "lru")) {
955                         printk("LRU lists:\n");
956                         TAILQ_FOREACH(sb, &super_blocks, s_list) {
957                                 printk("Superblock for %s\n", sb->s_name);
958                                 TAILQ_FOREACH(dentry, &sb->s_lru_d, d_lru)
959                                         printk("Dentry: %p, Name: %s\n", dentry,
960                                                dentry->d_name.name);
961                         }
962                 } else if (!strcmp(argv[2], "prune")) {
963                         printk("Pruning unused dentries\n");
964                         TAILQ_FOREACH(sb, &super_blocks, s_list)
965                                 dcache_prune(sb, FALSE);
966                 }
967         } else if (!strcmp(argv[1], "ls")) {
968                 if (argc != 3) {
969                         printk("Give me a dir.\n");
970                         return 1;
971                 }
972                 if (argv[2][0] != '/') {
973                         printk("Dear fellow giraffe lover, Use absolute paths.\n");
974                         return 1;
975                 }
976                 ls_dash_r(argv[2]);
977                 /* whatever.  placeholder. */
978         } else if (!strcmp(argv[1], "pid")) {
979                 if (argc != 3) {
980                         printk("Give me a pid number.\n");
981                         return 1;
982                 }
983                 /* whatever.  placeholder. */
984         } else if (!strcmp(argv[1], "pmflusher")) {
985                 ktask("pm_flusher", pm_flusher, 0);
986         } else {
987                 printk("Bad option\n");
988                 return 1;
989         }
990         return 0;
991 }
992
993 int mon_bb(int argc, char **argv, struct hw_trapframe *hw_tf)
994 {
995         char *l_argv[3] = {"", "busybox", "ash"};
996         return mon_bin_run(3, l_argv, hw_tf);
997 }
998
999 int mon_alarm(int argc, char **argv, struct hw_trapframe *hw_tf)
1000 {
1001         if (argc < 2) {
1002                 printk("Usage: alarm OPTION\n");
1003                 printk("\tpcpu: print full alarm tchains from every core\n");
1004                 return 1;
1005         }
1006         if (!strcmp(argv[1], "pcpu")) {
1007                 print_pcpu_chains();
1008         } else {
1009                 printk("Bad option\n");
1010                 return 1;
1011         }
1012         return 0;
1013 }
1014
1015 static void show_msr(struct hw_trapframe *unused, void *v)
1016 {
1017         int core = core_id();
1018         uint64_t val;
1019         uint32_t msr = *(uint32_t *)v;
1020         val = read_msr(msr);
1021         printk("%d: %08x: %016llx\n", core, msr, val);
1022 }
1023
1024 struct set {
1025         uint32_t msr;
1026         uint64_t val;
1027 };
1028
1029 static void set_msr(struct hw_trapframe *unused, void *v)
1030 {
1031         int core = core_id();
1032         struct set *s = v;
1033         uint32_t msr = s->msr;
1034         uint64_t val = s->val;
1035         write_msr(msr, val);
1036         val = read_msr(msr);
1037         printk("%d: %08x: %016llx\n", core, msr, val);
1038 }
1039
1040 int mon_msr(int argc, char **argv, struct hw_trapframe *hw_tf)
1041 {
1042 #ifndef CONFIG_X86
1043         cprintf("Not on this architecture\n");
1044         return 1;
1045 #else
1046         uint64_t val;
1047         uint32_t msr;
1048         if (argc < 2 || argc > 3) {
1049                 printk("Usage: msr register [value]\n");
1050                 return 1;
1051         }
1052         msr = strtoul(argv[1], 0, 16);
1053         handler_wrapper_t *w;
1054         smp_call_function_all(show_msr, &msr, &w);
1055         smp_call_wait(w);
1056
1057         if (argc < 3)
1058                 return 0;
1059         /* somewhat bogus on 32 bit. */
1060         val = strtoul(argv[2], 0, 16);
1061
1062         struct set set;
1063         set.msr = msr;
1064         set.val = val;
1065         smp_call_function_all(set_msr, &set, &w);
1066         smp_call_wait(w);
1067         return 0;
1068 #endif
1069 }
1070
1071 int mon_db(int argc, char **argv, struct hw_trapframe *hw_tf)
1072 {
1073         if (argc < 2) {
1074                 printk("Usage: db OPTION\n");
1075                 printk("\tsem: print all semaphore info\n");
1076                 printk("\taddr: for PID lookup ADDR's file/vmr info\n");
1077                 return 1;
1078         }
1079         if (!strcmp(argv[1], "sem")) {
1080                 print_all_sem_info();
1081         } else if (!strcmp(argv[1], "addr")) {
1082                 if (argc < 4) {
1083                         printk("Usage: db addr PID 0xADDR\n");
1084                         return 1;
1085                 }
1086                 debug_addr_pid(strtol(argv[2], 0, 10), strtol(argv[3], 0, 16));
1087         } else {
1088                 printk("Bad option\n");
1089                 return 1;
1090         }
1091         return 0;
1092 }
1093
1094 int mon_px(int argc, char **argv, struct hw_trapframe *hw_tf)
1095 {
1096         set_printx(2);
1097         printk("Printxing is now %sabled\n", printx_on ? "en" : "dis");
1098         return 0;
1099 }
1100
1101 /* Super hack.  Given a kernel hw_tf, we hack the RIP to smp_idle, then return
1102  * to it.  Any locks or other stuff being done is completely lost, so you could
1103  * deadlock.  This gets out of the "we're totall screwed, but don't want to
1104  * reboot right now", typically caused by screw-ups from the monitor. */
1105 int mon_kpfret(int argc, char **argv, struct hw_trapframe *hw_tf)
1106 {
1107         struct per_cpu_info *pcpui = &per_cpu_info[core_id()];
1108
1109         /* if monitor had a TF, try to use that */
1110         if (!hw_tf) {
1111                 if (argc < 2) {
1112                         printk("Usage: kpfret HW_TF\n");
1113                         return 1;
1114                 }
1115                 /* the hw_tf passed in is the one we got from monitor, which is 0 from
1116                  * panics. */
1117                 hw_tf = (struct hw_trapframe*)strtol(argv[1], 0, 16);
1118         }
1119
1120         if (!in_kernel(hw_tf)) {
1121                 printk("hw_tf %p was not a kernel tf!\n", hw_tf);
1122                 return -1;
1123         }
1124
1125 #ifdef CONFIG_X86
1126         hw_tf->tf_rip = (uintptr_t)smp_idle;
1127         dec_ktrap_depth(pcpui);
1128
1129         asm volatile("mov %0, %%rsp;"
1130                      "addq $0x10, %%rsp;"
1131                      "popq %%rax;"
1132                      "popq %%rbx;"
1133                      "popq %%rcx;"
1134                      "popq %%rdx;"
1135                      "popq %%rbp;"
1136                      "popq %%rsi;"
1137                      "popq %%rdi;"
1138                      "popq %%r8;"
1139                      "popq %%r9;"
1140                      "popq %%r10;"
1141                      "popq %%r11;"
1142                      "popq %%r12;"
1143                      "popq %%r13;"
1144                      "popq %%r14;"
1145                      "popq %%r15;"
1146                      "addq $0x10, %%rsp;"
1147                      "iretq;"
1148                                  : : "r"(hw_tf));
1149         assert(0);
1150 #else
1151         printk("KPF return not supported\n");
1152         return -1;
1153 #endif /* CONFIG_X86 */
1154 }
1155
1156 int mon_ks(int argc, char **argv, struct hw_trapframe *hw_tf)
1157 {
1158         if (argc < 2) {
1159 usage:
1160                 printk("Usage: ks OPTION\n");
1161                 printk("\tidles: show idle core map\n");
1162                 printk("\tdiag: scheduler diagnostic report\n");
1163                 printk("\tresources: show resources wanted/granted for all procs\n");
1164                 printk("\tsort: sorts the idlecoremap, 1..n\n");
1165                 printk("\tnc PCOREID: sets the next CG core allocated\n");
1166                 return 1;
1167         }
1168         if (!strcmp(argv[1], "idles")) {
1169                 print_idle_core_map();
1170         } else if (!strcmp(argv[1], "diag")) {
1171                 sched_diag();
1172         } else if (!strcmp(argv[1], "resources")) {
1173                 print_all_resources();
1174         } else if (!strcmp(argv[1], "sort")) {
1175                 sort_idle_cores();
1176         } else if (!strcmp(argv[1], "nc")) {
1177                 if (argc != 3) {
1178                         printk("Need a pcore number.\n");
1179                         return 1;
1180                 }
1181                 next_core_to_alloc(strtol(argv[2], 0, 0));
1182         } else {
1183                 printk("Bad option %s\n", argv[1]);
1184                 goto usage;
1185         }
1186         return 0;
1187 }
1188
1189 int mon_gfp(int argc, char **argv, struct hw_trapframe *hw_tf)
1190 {
1191         size_t naddrpages = max_paddr / PGSIZE;
1192         spin_lock_irqsave(&colored_page_free_list_lock);
1193         printk("%9s %9s %9s\n", "start", "end", "size");
1194         for (int i = 0; i < naddrpages; i++) {
1195                 int j;
1196                 for (j = i; j < naddrpages; j++) {
1197                         if (!page_is_free(j))
1198                                 break;
1199                 }
1200                 if (j > i) {
1201                         printk("%9d %9d %9d\n", i, j, j - i);
1202                         i = j;
1203                 }
1204         }
1205         spin_unlock_irqsave(&colored_page_free_list_lock);
1206         return 0;
1207 }
1208
1209 /* Prints info about a core.  Optional first arg == coreid. */
1210 int mon_coreinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
1211 {
1212         struct per_cpu_info *pcpui;
1213         struct kthread *kth;
1214         int coreid = core_id();
1215
1216         if (argc >= 2)
1217                 coreid = strtol(argv[1], 0, 0);
1218         pcpui = &per_cpu_info[coreid];
1219         printk("Core %d:\n\tcur_proc %d\n\towning proc %d, owning vc %d\n",
1220                coreid, pcpui->cur_proc ? pcpui->cur_proc->pid : 0,
1221                pcpui->owning_proc ? pcpui->owning_proc->pid : 0,
1222                pcpui->owning_vcoreid != 0xdeadbeef ? pcpui->owning_vcoreid : 0);
1223         kth = pcpui->cur_kthread;
1224         if (kth) {
1225                 /* kth->proc is only used when the kthread is sleeping.  when it's
1226                  * running, we care about cur_proc.  if we're here, proc should be 0
1227                  * unless the kth is concurrently sleeping (we called this remotely) */
1228                 printk("\tkthread %p (%s), sysc %p (%d)\n", kth, kth->name,
1229                        kth->sysc, kth->sysc ? kth->sysc->num : -1);
1230         } else {
1231                 /* Can happen during early boot */
1232                 printk("\tNo kthread!\n");
1233         }
1234         return 0;
1235 }