85a56bdc7d85864322b9eac4c16b08694c90a943
[akaros.git] / kern / src / monitor.c
1 // Simple command-line kernel monitor useful for
2 // controlling the kernel and exploring the system interactively.
3
4 #include <arch/arch.h>
5 #include <stab.h>
6 #include <smp.h>
7 #include <console.h>
8 #include <arch/console.h>
9
10 #include <stdio.h>
11 #include <string.h>
12 #include <assert.h>
13 #include <monitor.h>
14 #include <trap.h>
15 #include <pmap.h>
16 #include <kdebug.h>
17 #include <testing.h>
18 #include <manager.h>
19 #include <schedule.h>
20 #include <kdebug.h>
21 #include <syscall.h>
22 #include <kmalloc.h>
23 #include <elf.h>
24 #include <event.h>
25 #include <trap.h>
26 #include <time.h>
27
28 #include <ros/memlayout.h>
29 #include <ros/event.h>
30
31 #define CMDBUF_SIZE     80      // enough for one VGA text line
32
33 typedef struct command {
34         const char *name;
35         const char *desc;
36         // return -1 to force monitor to exit
37         int (*func)(int argc, char **argv, struct hw_trapframe *hw_tf);
38 } command_t;
39
40 static command_t commands[] = {
41         { "help", "Display this list of commands", mon_help },
42         { "kerninfo", "Display information about the kernel", mon_kerninfo },
43         { "backtrace", "Dump a backtrace", mon_backtrace },
44         { "bt", "Dump a backtrace", mon_backtrace },
45         { "reboot", "Take a ride to the South Bay", mon_reboot },
46         { "showmapping", "Shows VA->PA mappings", mon_showmapping},
47         { "sm", "Shows VA->PA mappings", mon_sm},
48         { "cpuinfo", "Prints CPU diagnostics", mon_cpuinfo},
49         { "ps", "Prints process list", mon_ps},
50         { "nanwan", "Meet Nanwan!!", mon_nanwan},
51         { "bin_ls", "List files in /bin", mon_bin_ls},
52         { "bin_run", "Create and run a program from /bin", mon_bin_run},
53         { "manager", "Run the manager", mon_manager},
54         { "procinfo", "Show information about processes", mon_procinfo},
55         { "pip", "Shorthand for procinfo pid", mon_pip},
56         { "kill", "Kills a process", mon_kill},
57         { "exit", "Leave the monitor", mon_exit},
58         { "e", "Leave the monitor", mon_exit},
59         { "kfunc", "Run a kernel function directly (!!!)", mon_kfunc},
60         { "notify", "Notify a process.  Vcoreid will skip their prefs", mon_notify},
61         { "measure", "Run a specific measurement", mon_measure},
62         { "trace", "Run some tracing functions", mon_trace},
63         { "monitor", "Run the monitor on another core", mon_monitor},
64         { "fs", "Filesystem Diagnostics", mon_fs},
65         { "bb", "Try to run busybox (ash)", mon_bb},
66         { "alarm", "Alarm Diagnostics", mon_alarm},
67         { "msr", "read/write msr: msr msr [value]", mon_msr},
68         { "db", "Misc debugging", mon_db},
69         { "px", "Toggle printx", mon_px},
70         { "kpfret", "Attempt to idle after a kernel fault", mon_kpfret},
71         { "ks", "Kernel scheduler hacks", mon_ks},
72         { "gfp", "Get free pages", mon_gfp },
73         { "coreinfo", "Print diagnostics for a core", mon_coreinfo},
74 };
75 #define NCOMMANDS (sizeof(commands)/sizeof(commands[0]))
76
77 /***** Implementations of basic kernel monitor commands *****/
78
79 int mon_help(int argc, char **argv, struct hw_trapframe *hw_tf)
80 {
81         int i;
82
83         for (i = 0; i < NCOMMANDS; i++)
84                 cprintf("%s - %s\n", commands[i].name, commands[i].desc);
85         return 0;
86 }
87
88 int mon_ps(int argc, char** argv, struct hw_trapframe *hw_tf)
89 {
90         print_allpids();
91         return 0;
92 }
93
94 int mon_kerninfo(int argc, char **argv, struct hw_trapframe *hw_tf)
95 {
96         extern char _start[], etext[], end[];
97
98         cprintf("Special kernel symbols:\n");
99         cprintf("  _start %016x (virt)  %016x (phys)\n", _start, (uintptr_t)(_start - KERNBASE));
100         cprintf("  etext  %016x (virt)  %016x (phys)\n", etext, (uintptr_t)(etext - KERNBASE));
101         cprintf("  end    %016x (virt)  %016x (phys)\n", end, (uintptr_t)(end - KERNBASE));
102         cprintf("Kernel executable memory footprint: %dKB\n",
103                 (uint32_t)(end-_start+1023)/1024);
104         return 0;
105 }
106
107 static int __backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
108 {
109         uintptr_t pc, fp;
110         if (argc == 1) {
111                 backtrace();
112                 return 0;
113         }
114         if (argc != 3) {
115                 printk("Need either no arguments, or two (PC and FP) in hex\n");
116                 return 1;
117         }
118         pc = strtol(argv[1], 0, 16);
119         fp = strtol(argv[2], 0, 16);
120         printk("Backtrace from instruction %p, with frame pointer %p\n", pc, fp);
121         backtrace_frame(pc, fp);
122         return 0;
123 }
124
125 int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
126 {
127         return __backtrace(argc, argv, hw_tf);
128 }
129
130 int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
131 {
132         cprintf("[Scottish Accent]: She's goin' down, Cap'n!\n");
133         reboot();
134
135         // really, should never see this
136         cprintf("Sigh....\n");
137         return 0;
138 }
139
140 static int __showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
141 {
142         struct proc *p;
143         uintptr_t start;
144         size_t size;
145         pgdir_t pgdir;
146         pid_t pid;
147         if (argc < 3) {
148                 printk("Shows virtual -> physical mappings for a virt addr range.\n");
149                 printk("Usage: showmapping PID START_ADDR [END_ADDR]\n");
150                 printk("    PID == 0 for the boot pgdir\n");
151                 return 1;
152         }
153         pid = strtol(argv[1], 0, 10);
154         if (!pid) {
155                 pgdir = boot_pgdir;
156         } else {
157                 p = pid2proc(pid);
158                 if (!p) {
159                         printk("No proc with pid %d\n", pid);
160                         return 1;
161                 }
162                 pgdir = p->env_pgdir;
163         }
164         start = ROUNDDOWN(strtol(argv[2], 0, 16), PGSIZE);
165         size = (argc == 3) ? 1 : strtol(argv[3], 0, 16) - start;
166         if (size/PGSIZE > 512) {
167                 cprintf("Not going to do this for more than 512 items\n");
168                 return 1;
169         }
170         show_mapping(pgdir, start, size);
171         return 0;
172 }
173
174 int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
175 {
176         return __showmapping(argc, argv, hw_tf);
177 }
178
179 int mon_sm(int argc, char **argv, struct hw_trapframe *hw_tf)
180 {
181         return __showmapping(argc, argv, hw_tf);
182 }
183
184 static spinlock_t print_info_lock = SPINLOCK_INITIALIZER_IRQSAVE;
185
186 static void print_info_handler(struct hw_trapframe *hw_tf, void *data)
187 {
188         uint64_t tsc = read_tsc();
189
190         spin_lock_irqsave(&print_info_lock);
191         cprintf("----------------------------\n");
192         cprintf("This is Core %d\n", core_id());
193         cprintf("Timestamp = %lld\n", tsc);
194 #ifdef CONFIG_X86
195         cprintf("Hardware core %d\n", hw_core_id());
196         cprintf("MTRR_DEF_TYPE = 0x%08x\n", read_msr(IA32_MTRR_DEF_TYPE));
197         cprintf("MTRR Phys0 Base = 0x%016llx, Mask = 0x%016llx\n",
198                 read_msr(0x200), read_msr(0x201));
199         cprintf("MTRR Phys1 Base = 0x%016llx, Mask = 0x%016llx\n",
200                 read_msr(0x202), read_msr(0x203));
201         cprintf("MTRR Phys2 Base = 0x%016llx, Mask = 0x%016llx\n",
202                 read_msr(0x204), read_msr(0x205));
203         cprintf("MTRR Phys3 Base = 0x%016llx, Mask = 0x%016llx\n",
204                 read_msr(0x206), read_msr(0x207));
205         cprintf("MTRR Phys4 Base = 0x%016llx, Mask = 0x%016llx\n",
206                 read_msr(0x208), read_msr(0x209));
207         cprintf("MTRR Phys5 Base = 0x%016llx, Mask = 0x%016llx\n",
208                 read_msr(0x20a), read_msr(0x20b));
209         cprintf("MTRR Phys6 Base = 0x%016llx, Mask = 0x%016llx\n",
210                 read_msr(0x20c), read_msr(0x20d));
211         cprintf("MTRR Phys7 Base = 0x%016llx, Mask = 0x%016llx\n",
212                 read_msr(0x20e), read_msr(0x20f));
213 #endif // CONFIG_X86
214         cprintf("----------------------------\n");
215         spin_unlock_irqsave(&print_info_lock);
216 }
217
218 static bool print_all_info(void)
219 {
220         cprintf("\nCORE 0 asking all cores to print info:\n");
221         smp_call_function_all(print_info_handler, NULL, 0);
222         cprintf("\nDone!\n");
223         return true;
224 }
225
226 int mon_cpuinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
227 {
228         cprintf("Number of Cores detected: %d\n", num_cores);
229         cprintf("Calling CPU's ID: 0x%08x\n", core_id());
230
231         if (argc < 2)
232                 smp_call_function_self(print_info_handler, NULL, 0);
233         else
234                 smp_call_function_single(strtol(argv[1], 0, 10),
235                                          print_info_handler, NULL, 0);
236         return 0;
237 }
238
239 int mon_manager(int argc, char** argv, struct hw_trapframe *hw_tf)
240 {
241         manager();
242         panic("should never get here");
243         return 0;
244 }
245
246 int mon_nanwan(int argc, char **argv, struct hw_trapframe *hw_tf)
247 {
248         /* Borrowed with love from http://www.geocities.com/SoHo/7373/zoo.htm
249          * (http://www.ascii-art.com/).  Slightly modified to make it 25 lines tall.
250          */
251         printk("\n");
252         printk("             .-.  .-.\n");
253         printk("             |  \\/  |\n");
254         printk("            /,   ,_  `'-.\n");
255         printk("          .-|\\   /`\\     '. \n");
256         printk("        .'  0/   | 0\\  \\_  `\".  \n");
257         printk("     .-'  _,/    '--'.'|#''---'\n");
258         printk("      `--'  |       /   \\#\n");
259         printk("            |      /     \\#\n");
260         printk("            \\     ;|\\    .\\#\n");
261         printk("            |' ' //  \\   ::\\# \n");
262         printk("            \\   /`    \\   ':\\#\n");
263         printk("             `\"`       \\..   \\#\n");
264         printk("                        \\::.  \\#\n");
265         printk("                         \\::   \\#\n");
266         printk("                          \\'  .:\\#\n");
267         printk("                           \\  :::\\#\n");
268         printk("                            \\  '::\\#\n");
269         printk("                             \\     \\#\n");
270         printk("                              \\:.   \\#\n");
271         printk("                               \\::   \\#\n");
272         printk("                                \\'   .\\#\n");
273         printk("                             jgs \\   ::\\#\n");
274         printk("                                  \\      \n");
275         return 0;
276 }
277
278 int mon_bin_ls(int argc, char **argv, struct hw_trapframe *hw_tf)
279 {
280         struct dirent dir = {0};
281         struct file *bin_dir;
282         int retval = 0;
283
284         bin_dir = do_file_open("/bin", O_READ, 0);
285         if (!bin_dir) {
286                 printk("No /bin directory!\n");
287                 return 1;
288         }
289         printk("Files in /bin:\n-------------------------------\n");
290         do {
291                 retval = bin_dir->f_op->readdir(bin_dir, &dir);
292                 printk("%s\n", dir.d_name);
293         } while (retval == 1);
294         kref_put(&bin_dir->f_kref);
295         return 0;
296 }
297
298 int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
299 {
300         if (argc < 2) {
301                 printk("Usage: bin_run FILENAME\n");
302                 return 1;
303         }
304         struct file *program;
305         int retval = 0;
306         char buf[5 + MAX_FILENAME_SZ + 1] = "/bin/";    /* /bin/ + max + \0 */
307
308         strlcpy(buf, "/bin/", sizeof(buf));
309         if (strlcat(buf, argv[1], sizeof(buf)) > sizeof(buf)) {
310                 printk("Filename '%s' too long!\n", argv[1]);
311                 return 1;
312         }
313         program = do_file_open(buf, O_READ, 0);
314         if (!program) {
315                 printk("No such program!\n");
316                 return 1;
317         }
318         char **p_argv = kmalloc(sizeof(char*) * argc, 0);       /* bin_run's argc */
319         for (int i = 0; i < argc - 1; i++)
320                 p_argv[i] = argv[i + 1];
321         p_argv[argc - 1] = 0;
322         /* super ugly: we need to stash current, so that proc_create doesn't pick up
323          * on random processes running here and assuming they are the parent */
324         struct proc *old_cur = current;
325         current = 0;
326         struct proc *p = proc_create(program, p_argv, NULL);
327         current = old_cur;
328         kfree(p_argv);
329         proc_wakeup(p);
330         proc_decref(p); /* let go of the reference created in proc_create() */
331         kref_put(&program->f_kref);
332         /* Make a scheduling decision.  You might not get the process you created,
333          * in the event there are others floating around that are runnable */
334         run_scheduler();
335         /* want to idle, so we un the process we just selected.  this is a bit
336          * hackish, but so is the monitor. */
337         smp_idle();
338         assert(0);
339         return 0;
340 }
341
342 int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
343 {
344         if (argc < 2) {
345                 printk("Usage: procinfo OPTION\n");
346                 printk("\tall: show all active pids\n");
347                 printk("\tpid NUM: show a lot of info for proc NUM\n");
348                 printk("\tunlock: unlock the lock for the ADDR (OMG!!!)\n");
349                 printk("\tkill NUM: destroy proc NUM\n");
350                 return 1;
351         }
352         if (!strcmp(argv[1], "all")) {
353                 print_allpids();
354         } else if (!strcmp(argv[1], "pid")) {
355                 if (argc != 3) {
356                         printk("Give me a pid number.\n");
357                         return 1;
358                 }
359                 print_proc_info(strtol(argv[2], 0, 0));
360         } else if (!strcmp(argv[1], "unlock")) {
361                 if (argc != 3) {
362                         printk("Gimme lock address!  Me want lock address!.\n");
363                         return 1;
364                 }
365                 spinlock_t *lock = (spinlock_t*)strtol(argv[2], 0, 16);
366                 if (!lock) {
367                         printk("Null address...\n");
368                         return 1;
369                 }
370                 spin_unlock(lock);
371         } else if (!strcmp(argv[1], "kill")) {
372                 if (argc != 3) {
373                         printk("Give me a pid number.\n");
374                         return 1;
375                 }
376                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
377                 if (!p) {
378                         printk("No such proc\n");
379                         return 1;
380                 }
381                 proc_destroy(p);
382                 proc_decref(p);
383         } else {
384                 printk("Bad option\n");
385                 return 1;
386         }
387         return 0;
388 }
389
390 int mon_pip(int argc, char **argv, struct hw_trapframe *hw_tf)
391 {
392         if (argc != 2) {
393                 printk("Give me a pid number.\n");
394                 return 1;
395         }
396         print_proc_info(strtol(argv[1], 0, 0));
397         return 0;
398 }
399
400 int mon_kill(int argc, char **argv, struct hw_trapframe *hw_tf)
401 {
402         struct proc *p;
403
404         if (argc < 2) {
405                 printk("Usage: kill PID\n");
406                 return 1;
407         }
408         p = pid2proc(strtol(argv[1], 0, 0));
409         if (!p) {
410                 printk("No such proc\n");
411                 return 1;
412         }
413         proc_destroy(p);
414         proc_decref(p);
415         return 0;
416 }
417
418 int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
419 {
420         return -1;
421 }
422
423 int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
424 {
425         void (*func)(void *arg, ...);
426
427         if (argc < 2) {
428                 printk("Usage: kfunc FUNCTION [arg1] [arg2] [etc]\n");
429                 printk("Arguments must be in hex.  Can take 6 args.\n");
430                 return 1;
431         }
432         func = (void*)get_symbol_addr(argv[1]);
433         if (!func) {
434                 printk("Function not found.\n");
435                 return 1;
436         }
437         /* Not elegant, but whatever.  maybe there's a better syntax, or we can do
438          * it with asm magic. */
439         switch (argc) {
440                 case 2: /* have to fake one arg */
441                         func((void*)0);
442                         break;
443                 case 3: /* the real first arg */
444                         func((void*)strtol(argv[2], 0, 16));
445                         break;
446                 case 4:
447                         func((void*)strtol(argv[2], 0, 16),
448                                     strtol(argv[3], 0, 16));
449                         break;
450                 case 5:
451                         func((void*)strtol(argv[2], 0, 16),
452                                     strtol(argv[3], 0, 16),
453                                     strtol(argv[4], 0, 16));
454                         break;
455                 case 6:
456                         func((void*)strtol(argv[2], 0, 16),
457                                     strtol(argv[3], 0, 16),
458                                     strtol(argv[4], 0, 16),
459                                     strtol(argv[5], 0, 16));
460                         break;
461                 case 7:
462                         func((void*)strtol(argv[2], 0, 16),
463                                     strtol(argv[3], 0, 16),
464                                     strtol(argv[4], 0, 16),
465                                     strtol(argv[5], 0, 16),
466                                     strtol(argv[6], 0, 16));
467                         break;
468                 case 8:
469                         func((void*)strtol(argv[2], 0, 16),
470                                     strtol(argv[3], 0, 16),
471                                     strtol(argv[4], 0, 16),
472                                     strtol(argv[5], 0, 16),
473                                     strtol(argv[6], 0, 16),
474                                     strtol(argv[7], 0, 16));
475                         break;
476                 default:
477                         printk("Bad number of arguments.\n");
478                         return -1;
479         }
480         return 0;
481 }
482
483 /* Sending a vcoreid forces an event and an IPI/notification */
484 int mon_notify(int argc, char **argv, struct hw_trapframe *hw_tf)
485 {
486         struct proc *p;
487         uint32_t vcoreid;
488         struct event_msg msg = {0};
489
490         if (argc < 3) {
491                 printk("Usage: notify PID NUM [VCOREID]\n");
492                 return 1;
493         }
494         p = pid2proc(strtol(argv[1], 0, 0));
495         if (!p) {
496                 printk("No such proc\n");
497                 return 1;
498         }
499         msg.ev_type = strtol(argv[2], 0, 0);
500         if (argc == 4) {
501                 vcoreid = strtol(argv[3], 0, 0);
502                 /* This will go to the private mbox */
503                 post_vcore_event(p, &msg, vcoreid, EVENT_VCORE_PRIVATE);
504                 proc_notify(p, vcoreid);
505         } else {
506                 /* o/w, try and do what they want */
507                 send_kernel_event(p, &msg, 0);
508         }
509         proc_decref(p);
510         return 0;
511 }
512
513 /* Micro-benchmarky Measurements.  This is really fragile code that probably
514  * won't work perfectly, esp as the kernel evolves. */
515 int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
516 {
517         uint64_t begin = 0, diff = 0;
518         uint32_t end_refcnt = 0;
519
520         if (argc < 2) {
521                 printk("Usage: measure OPTION\n");
522                 printk("\tkill PID : kill proc PID\n");
523                 printk("\tpreempt PID : preempt proc PID (no delay)\n");
524                 printk("\tpreempt PID [pcore] : preempt PID's pcore (no delay)\n");
525                 printk("\tpreempt-warn PID : warn-preempt proc PID (pending)\n");
526                 printk("\tpreempt-warn PID [pcore] : warn-preempt proc PID's pcore\n");
527                 printk("\tpreempt-raw PID : raw-preempt proc PID\n");
528                 printk("\tpreempt-raw PID [pcore] : raw-preempt proc PID's pcore\n");
529                 return 1;
530         }
531         if (!strcmp(argv[1], "kill")) {
532                 if (argc < 3) {
533                         printk("Give me a pid number.\n");
534                         return 1;
535                 }
536                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
537                 if (!p) {
538                         printk("No such proc\n");
539                         return 1;
540                 }
541                 begin = start_timing();
542 #ifdef CONFIG_APPSERVER
543                 printk("Warning: this will be inaccurate due to the appserver.\n");
544                 end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores - 1;
545 #endif /* CONFIG_APPSERVER */
546                 proc_destroy(p);
547                 proc_decref(p);
548 #ifdef CONFIG_APPSERVER
549                 /* Won't be that accurate, since it's not actually going through the
550                  * __proc_free() path. */
551                 spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
552 #else
553                 /* this is a little ghetto. it's not fully free yet, but we are also
554                  * slowing it down by messing with it, esp with the busy waiting on a
555                  * hyperthreaded core. */
556                 spin_on(p->env_cr3);
557 #endif /* CONFIG_APPSERVER */
558                 /* No noticeable difference using stop_timing instead of read_tsc() */
559                 diff = stop_timing(begin);
560         } else if (!strcmp(argv[1], "preempt")) {
561                 if (argc < 3) {
562                         printk("Give me a pid number.\n");
563                         return 1;
564                 }
565                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
566                 if (!p) {
567                         printk("No such proc\n");
568                         return 1;
569                 }
570                 if (argc == 4) { /* single core being preempted, warned but no delay */
571                         uint32_t pcoreid = strtol(argv[3], 0, 0);
572                         begin = start_timing();
573                         if (proc_preempt_core(p, pcoreid, 1000000)) {
574                                 __sched_put_idle_core(p, pcoreid);
575                                 /* done when unmapped (right before abandoning) */
576                                 spin_on(p->procinfo->pcoremap[pcoreid].valid);
577                         } else {
578                                 printk("Core %d was not mapped to proc\n", pcoreid);
579                         }
580                         diff = stop_timing(begin);
581                 } else { /* preempt all cores, warned but no delay */
582                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
583                         begin = start_timing();
584                         proc_preempt_all(p, 1000000);
585                         /* a little ghetto, implies no one is using p */
586                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
587                         diff = stop_timing(begin);
588                 }
589                 proc_decref(p);
590         } else if (!strcmp(argv[1], "preempt-warn")) {
591                 if (argc < 3) {
592                         printk("Give me a pid number.\n");
593                         return 1;
594                 }
595                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
596                 if (!p) {
597                         printk("No such proc\n");
598                         return 1;
599                 }
600                 printk("Careful: if this hangs, then the process isn't responding.\n");
601                 if (argc == 4) { /* single core being preempted-warned */
602                         uint32_t pcoreid = strtol(argv[3], 0, 0);
603                         spin_lock(&p->proc_lock);
604                         uint32_t vcoreid = p->procinfo->pcoremap[pcoreid].vcoreid;
605                         if (!p->procinfo->pcoremap[pcoreid].valid) {
606                                 printk("Pick a mapped pcore\n");
607                                 spin_unlock(&p->proc_lock);
608                                 return 1;
609                         }
610                         begin = start_timing();
611                         __proc_preempt_warn(p, vcoreid, 1000000); // 1 sec
612                         spin_unlock(&p->proc_lock);
613                         /* done when unmapped (right before abandoning) */
614                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
615                         diff = stop_timing(begin);
616                 } else { /* preempt-warn all cores */
617                         printk("Warning, this won't work if they can't yield their "
618                                "last vcore, will stop at 1!\n");
619                         spin_lock(&p->proc_lock);
620                         begin = start_timing();
621                         __proc_preempt_warnall(p, 1000000);
622                         spin_unlock(&p->proc_lock);
623                         /* target cores do the unmapping / changing of the num_vcores */
624                         spin_on(p->procinfo->num_vcores > 1);
625                         diff = stop_timing(begin);
626                 }
627                 proc_decref(p);
628         } else if (!strcmp(argv[1], "preempt-raw")) {
629                 if (argc < 3) {
630                         printk("Give me a pid number.\n");
631                         return 1;
632                 }
633                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
634                 if (!p) {
635                         printk("No such proc\n");
636                         return 1;
637                 }
638                 if (argc == 4) { /* single core preempted, no warning or waiting */
639                         uint32_t pcoreid = strtol(argv[3], 0, 0);
640                         spin_lock(&p->proc_lock);
641                         if (!p->procinfo->pcoremap[pcoreid].valid) {
642                                 printk("Pick a mapped pcore\n");
643                                 spin_unlock(&p->proc_lock);
644                                 return 1;
645                         }
646                         begin = start_timing();
647                         __proc_preempt_core(p, pcoreid);
648                         if (!p->procinfo->num_vcores)
649                                 __proc_set_state(p, PROC_RUNNABLE_M);
650                         spin_unlock(&p->proc_lock);
651                         /* ghetto, since the ksched should be calling all of this */
652                         __sched_put_idle_core(p, pcoreid);
653                         /* done when unmapped (right before abandoning) */
654                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
655                         diff = stop_timing(begin);
656                 } else { /* preempt all cores, no warning or waiting */
657                         spin_lock(&p->proc_lock);
658                         uint32_t pc_arr[p->procinfo->num_vcores];
659                         uint32_t num_revoked;
660                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
661                         begin = start_timing();
662                         num_revoked = __proc_preempt_all(p, pc_arr);
663                         __proc_set_state(p, PROC_RUNNABLE_M);
664                         spin_unlock(&p->proc_lock);
665                         if (num_revoked)
666                                 __sched_put_idle_cores(p, pc_arr, num_revoked);
667                         /* a little ghetto, implies no one else is using p */
668                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
669                         diff = stop_timing(begin);
670                 }
671                 proc_decref(p);
672         } else {
673                 printk("Bad option\n");
674                 return 1;
675         }
676         printk("[Tired Giraffe Accent] Took %llu usec (%llu nsec) to finish.\n",
677                tsc2usec(diff), tsc2nsec(diff));
678         return 0;
679 }
680
681 /* Used in various debug locations.  Not a kernel API or anything. */
682 bool mon_verbose_trace = FALSE;
683
684 int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
685 {
686         int core;
687         if (argc < 2) {
688                 printk("Usage: trace OPTION\n");
689                 printk("\tsyscall start [silent (0 or non-zero, NOT the word silent)] [pid]: starts tracing\n");
690                 printk("\tsyscall stop: stops tracing.\n");
691                 printk("\tcoretf COREID: prints PC, -1 for all cores, verbose => TF\n");
692                 printk("\tpcpui [type [coreid]]: runs pcpui trace ring handlers\n");
693                 printk("\tpcpui-reset [noclear]: resets/clears pcpui trace ring\n");
694                 printk("\tverbose: toggles verbosity, depends on trace command\n");
695                 return 1;
696         }
697         if (!strcmp(argv[1], "syscall")) {
698                 if (argc < 3) {
699                         printk("Need a start or stop.\n");
700                         return 1;
701                 }
702                 if (!strcmp(argv[2], "start")) {
703                         systrace_loud = TRUE;
704                 } else if (!strcmp(argv[2], "stop")) {
705                         systrace_loud = FALSE;
706                 } else {
707                         printk("Need a start or stop.\n");
708                         return 1;
709                 }
710         } else if (!strcmp(argv[1], "coretf")) {
711                 if (argc != 3) {
712                         printk("Need a coreid, fool.\n");
713                         return 1;
714                 }
715                 core = strtol(argv[2], 0, 0);
716                 if (core < 0) {
717                         printk("Sending NMIs to all cores:\n");
718                         for (int i = 0; i < num_cores; i++)
719                                 send_nmi(i);
720                 } else {
721                         printk("Sending NMI core %d:\n", core);
722                         if (core >= num_cores) {
723                                 printk("No such core!  Maybe it's in another cell...\n");
724                                 return 1;
725                         }
726                         send_nmi(core);
727                 }
728                 udelay(1000000);
729         } else if (!strcmp(argv[1], "pcpui")) {
730                 int pcpui_type, pcpui_coreid;
731                 if (argc >= 3)
732                         pcpui_type = strtol(argv[2], 0, 0);
733                 else
734                         pcpui_type = 0;
735                 printk("\nRunning PCPUI Trace Ring handlers for type %d\n", pcpui_type);
736                 if (argc >= 4) {
737                         pcpui_coreid = strtol(argv[3], 0, 0);
738                         pcpui_tr_foreach(pcpui_coreid, pcpui_type);
739                 } else {
740                         pcpui_tr_foreach_all(pcpui_type);
741                 }
742         } else if (!strcmp(argv[1], "pcpui-reset")) {
743                 if (argc >= 3) {
744                         printk("\nResetting all PCPUI Trace Rings\n");
745                         pcpui_tr_reset_all();
746                 } else {
747                         printk("\nResetting and clearing all PCPUI Trace Rings\n");
748                         pcpui_tr_reset_and_clear_all();
749                 }
750         } else if (!strcmp(argv[1], "verbose")) {
751                 if (mon_verbose_trace) {
752                         printk("Turning trace verbosity off\n");
753                         mon_verbose_trace = FALSE;
754                 } else {
755                         printk("Turning trace verbosity on\n");
756                         mon_verbose_trace = TRUE;
757                 }
758         } else if (!strcmp(argv[1], "opt2")) {
759                 if (argc != 3) {
760                         printk("ERRRRRRRRRR.\n");
761                         return 1;
762                 }
763                 print_proc_info(strtol(argv[2], 0, 0));
764         } else {
765                 printk("Bad option\n");
766                 return 1;
767         }
768         return 0;
769 }
770
771 int mon_monitor(int argc, char **argv, struct hw_trapframe *hw_tf)
772 {
773         if (argc < 2) {
774                 printk("Usage: monitor COREID\n");
775                 return 1;
776         }
777         uint32_t core = strtol(argv[1], 0, 0);
778         if (core >= num_cores) {
779                 printk("No such core!  Maybe it's in another cell...\n");
780                 return 1;
781         }
782         send_kernel_message(core, __run_mon, 0, 0, 0, KMSG_ROUTINE);
783         return 0;
784 }
785
786 /***** Kernel monitor command interpreter *****/
787
788 #define WHITESPACE "\t\r\n "
789 #define MAXARGS 16
790
791
792 int onecmd(int argc, char *argv[], struct hw_trapframe *hw_tf) {
793         int i;
794         if (!argc)
795                 return -1;
796         for (i = 0; i < NCOMMANDS; i++) {
797                 if (strcmp(argv[0], commands[i].name) == 0)
798                         return commands[i].func(argc, argv, hw_tf);
799         }
800         return -1;
801 }
802
803 static int runcmd(char *real_buf, struct hw_trapframe *hw_tf) {
804         char * buf = real_buf;
805         int argc;
806         char *argv[MAXARGS];
807         int i;
808
809         // Parse the command buffer into whitespace-separated arguments
810         argc = 0;
811         argv[argc] = 0;
812         while (1) {
813                 // gobble whitespace
814                 while (*buf && strchr(WHITESPACE, *buf))
815                         *buf++ = 0;
816                 if (*buf == 0)
817                         break;
818
819                 // save and scan past next arg
820                 if (argc == MAXARGS-1) {
821                         cprintf("Too many arguments (max %d)\n", MAXARGS);
822                         return 0;
823                 }
824                 //This will get fucked at runtime..... in the ASS
825                 argv[argc++] = buf;
826                 while (*buf && !strchr(WHITESPACE, *buf))
827                         buf++;
828         }
829         argv[argc] = 0;
830
831         // Lookup and invoke the command
832         if (argc == 0)
833                 return 0;
834         for (i = 0; i < NCOMMANDS; i++) {
835                 if (strcmp(argv[0], commands[i].name) == 0)
836                         return commands[i].func(argc, argv, hw_tf);
837         }
838         cprintf("Unknown command '%s'\n", argv[0]);
839         return 0;
840 }
841
842 void monitor(struct hw_trapframe *hw_tf)
843 {
844         #define MON_CMD_LENGTH 256
845         char buf[MON_CMD_LENGTH];
846         int cnt;
847         int coreid = core_id_early();
848
849         /* they are always disabled, since we have this irqsave lock */
850         if (irq_is_enabled())
851                 printk("Entering Nanwan's Dungeon on Core %d (Ints on):\n", coreid);
852         else
853                 printk("Entering Nanwan's Dungeon on Core %d (Ints off):\n", coreid);
854         printk("Type 'help' for a list of commands.\n");
855
856         if (hw_tf != NULL)
857                 print_trapframe(hw_tf);
858
859         while (1) {
860                 /* on occasion, the kernel monitor can migrate (like if you run
861                  * something that blocks / syncs and wakes up on another core) */
862                 cmb();
863                 cnt = readline(buf, MON_CMD_LENGTH, "ROS(Core %d)> ", core_id_early());
864                 if (cnt > 0) {
865                         buf[cnt] = 0;
866                         if (runcmd(buf, hw_tf) < 0)
867                                 break;
868                 }
869         }
870 }
871
872 static void pm_flusher(void *unused)
873 {
874         struct super_block *sb;
875         struct inode *inode;
876         unsigned long nr_pages;
877
878         /* could also put the delay between calls, or even within remove, during the
879          * WB phase. */
880         printk("GIANT WARNING: the pm_flusher is running and will never stop!\n");
881         while (1) {
882                 kthread_usleep(5000);
883                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
884                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
885                                 nr_pages = ROUNDUP(inode->i_size, PGSIZE) >> PGSHIFT;
886                                 if (nr_pages)
887                                         pm_remove_contig(inode->i_mapping, 0, nr_pages);
888                         }
889                 }
890         }
891 }
892
893 int mon_fs(int argc, char **argv, struct hw_trapframe *hw_tf)
894 {
895         /* this assumes one mounted FS at the NS root */
896         struct super_block *sb;
897         struct file *file;
898         struct inode *inode;
899         struct dentry *dentry;
900         if (argc < 2) {
901                 printk("Usage: fs OPTION\n");
902                 printk("\topen: show all open files\n");
903                 printk("\tinodes: show all inodes\n");
904                 printk("\tdentries [lru|prune]: show all dentries, opt LRU/prune\n");
905                 printk("\tls DIR: print the dir tree starting with DIR\n");
906                 printk("\tpid: proc PID's fs crap placeholder\n");
907                 printk("\tpmflusher: start a ktask to keep flushing all PMs\n");
908                 return 1;
909         }
910         if (!strcmp(argv[1], "open")) {
911                 printk("Open Files:\n----------------------------\n");
912                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
913                         printk("Superblock for %s\n", sb->s_name);
914                         TAILQ_FOREACH(file, &sb->s_files, f_list)
915                                 printk("File: %p, %s, Refs: %d, Drefs: %d, Irefs: %d PM: %p\n",
916                                        file, file_name(file), kref_refcnt(&file->f_kref),
917                                        kref_refcnt(&file->f_dentry->d_kref),
918                                        kref_refcnt(&file->f_dentry->d_inode->i_kref),
919                                            file->f_mapping);
920                 }
921         } else if (!strcmp(argv[1], "inodes")) {
922                 printk("Mounted FS Inodes:\n----------------------------\n");
923                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
924                         printk("Superblock for %s\n", sb->s_name);
925                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
926                                 printk("Inode: %p, Refs: %d, Nlinks: %d, Size(B): %d\n",
927                                        inode, kref_refcnt(&inode->i_kref), inode->i_nlink,
928                                        inode->i_size);
929                                 TAILQ_FOREACH(dentry, &inode->i_dentry, d_alias)
930                                         printk("\t%s: Dentry: %p, Refs: %d\n",
931                                                dentry->d_name.name, dentry,
932                                                kref_refcnt(&dentry->d_kref));
933                         }
934                 }
935         } else if (!strcmp(argv[1], "dentries")) {
936                 printk("Dentry Cache:\n----------------------------\n");
937                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
938                         printk("Superblock for %s\n", sb->s_name);
939                         printk("DENTRY     FLAGS      REFCNT NAME\n");
940                         printk("--------------------------------\n");
941                         /* Hash helper */
942                         void print_dcache_entry(void *item, void *opaque)
943                         {
944                                 struct dentry *d_i = (struct dentry*)item;
945                                 printk("%p %p %02d     %s\n", d_i, d_i->d_flags,
946                                        kref_refcnt(&d_i->d_kref), d_i->d_name.name);
947                         }
948                         hash_for_each(sb->s_dcache, print_dcache_entry, NULL);
949                 }
950                 if (argc < 3)
951                         return 0;
952                 if (!strcmp(argv[2], "lru")) {
953                         printk("LRU lists:\n");
954                         TAILQ_FOREACH(sb, &super_blocks, s_list) {
955                                 printk("Superblock for %s\n", sb->s_name);
956                                 TAILQ_FOREACH(dentry, &sb->s_lru_d, d_lru)
957                                         printk("Dentry: %p, Name: %s\n", dentry,
958                                                dentry->d_name.name);
959                         }
960                 } else if (!strcmp(argv[2], "prune")) {
961                         printk("Pruning unused dentries\n");
962                         TAILQ_FOREACH(sb, &super_blocks, s_list)
963                                 dcache_prune(sb, FALSE);
964                 }
965         } else if (!strcmp(argv[1], "ls")) {
966                 if (argc != 3) {
967                         printk("Give me a dir.\n");
968                         return 1;
969                 }
970                 if (argv[2][0] != '/') {
971                         printk("Dear fellow giraffe lover, Use absolute paths.\n");
972                         return 1;
973                 }
974                 ls_dash_r(argv[2]);
975                 /* whatever.  placeholder. */
976         } else if (!strcmp(argv[1], "pid")) {
977                 if (argc != 3) {
978                         printk("Give me a pid number.\n");
979                         return 1;
980                 }
981                 /* whatever.  placeholder. */
982         } else if (!strcmp(argv[1], "pmflusher")) {
983                 ktask("pm_flusher", pm_flusher, 0);
984         } else {
985                 printk("Bad option\n");
986                 return 1;
987         }
988         return 0;
989 }
990
991 int mon_bb(int argc, char **argv, struct hw_trapframe *hw_tf)
992 {
993         char *l_argv[3] = {"", "busybox", "ash"};
994         return mon_bin_run(3, l_argv, hw_tf);
995 }
996
997 int mon_alarm(int argc, char **argv, struct hw_trapframe *hw_tf)
998 {
999         if (argc < 2) {
1000                 printk("Usage: alarm OPTION\n");
1001                 printk("\tpcpu: print full alarm tchains from every core\n");
1002                 return 1;
1003         }
1004         if (!strcmp(argv[1], "pcpu")) {
1005                 print_pcpu_chains();
1006         } else {
1007                 printk("Bad option\n");
1008                 return 1;
1009         }
1010         return 0;
1011 }
1012
1013 static void show_msr(struct hw_trapframe *unused, void *v)
1014 {
1015         int core = core_id();
1016         uint64_t val;
1017         uint32_t msr = *(uint32_t *)v;
1018         val = read_msr(msr);
1019         printk("%d: %08x: %016llx\n", core, msr, val);
1020 }
1021
1022 struct set {
1023         uint32_t msr;
1024         uint64_t val;
1025 };
1026
1027 static void set_msr(struct hw_trapframe *unused, void *v)
1028 {
1029         int core = core_id();
1030         struct set *s = v;
1031         uint32_t msr = s->msr;
1032         uint64_t val = s->val;
1033         write_msr(msr, val);
1034         val = read_msr(msr);
1035         printk("%d: %08x: %016llx\n", core, msr, val);
1036 }
1037
1038 int mon_msr(int argc, char **argv, struct hw_trapframe *hw_tf)
1039 {
1040 #ifndef CONFIG_X86
1041         cprintf("Not on this architecture\n");
1042         return 1;
1043 #else
1044         uint64_t val;
1045         uint32_t msr;
1046         if (argc < 2 || argc > 3) {
1047                 printk("Usage: msr register [value]\n");
1048                 return 1;
1049         }
1050         msr = strtoul(argv[1], 0, 16);
1051         handler_wrapper_t *w;
1052         smp_call_function_all(show_msr, &msr, &w);
1053         smp_call_wait(w);
1054
1055         if (argc < 3)
1056                 return 0;
1057         /* somewhat bogus on 32 bit. */
1058         val = strtoul(argv[2], 0, 16);
1059
1060         struct set set;
1061         set.msr = msr;
1062         set.val = val;
1063         smp_call_function_all(set_msr, &set, &w);
1064         smp_call_wait(w);
1065         return 0;
1066 #endif
1067 }
1068
1069 int mon_db(int argc, char **argv, struct hw_trapframe *hw_tf)
1070 {
1071         if (argc < 2) {
1072                 printk("Usage: db OPTION\n");
1073                 printk("\tsem: print all semaphore info\n");
1074                 printk("\taddr: for PID lookup ADDR's file/vmr info\n");
1075                 return 1;
1076         }
1077         if (!strcmp(argv[1], "sem")) {
1078                 print_all_sem_info();
1079         } else if (!strcmp(argv[1], "addr")) {
1080                 if (argc < 4) {
1081                         printk("Usage: db addr PID 0xADDR\n");
1082                         return 1;
1083                 }
1084                 debug_addr_pid(strtol(argv[2], 0, 10), strtol(argv[3], 0, 16));
1085         } else {
1086                 printk("Bad option\n");
1087                 return 1;
1088         }
1089         return 0;
1090 }
1091
1092 int mon_px(int argc, char **argv, struct hw_trapframe *hw_tf)
1093 {
1094         set_printx(2);
1095         printk("Printxing is now %sabled\n", printx_on ? "en" : "dis");
1096         return 0;
1097 }
1098
1099 /* Super hack.  Given a kernel hw_tf, we hack the RIP to smp_idle, then return
1100  * to it.  Any locks or other stuff being done is completely lost, so you could
1101  * deadlock.  This gets out of the "we're totall screwed, but don't want to
1102  * reboot right now", typically caused by screw-ups from the monitor. */
1103 int mon_kpfret(int argc, char **argv, struct hw_trapframe *hw_tf)
1104 {
1105         struct per_cpu_info *pcpui = &per_cpu_info[core_id()];
1106
1107         /* if monitor had a TF, try to use that */
1108         if (!hw_tf) {
1109                 if (argc < 2) {
1110                         printk("Usage: kpfret HW_TF\n");
1111                         return 1;
1112                 }
1113                 /* the hw_tf passed in is the one we got from monitor, which is 0 from
1114                  * panics. */
1115                 hw_tf = (struct hw_trapframe*)strtol(argv[1], 0, 16);
1116         }
1117
1118         if (!in_kernel(hw_tf)) {
1119                 printk("hw_tf %p was not a kernel tf!\n", hw_tf);
1120                 return -1;
1121         }
1122
1123 #ifdef CONFIG_X86
1124         hw_tf->tf_rip = (uintptr_t)smp_idle;
1125         dec_ktrap_depth(pcpui);
1126
1127         asm volatile("mov %0, %%rsp;"
1128                      "addq $0x10, %%rsp;"
1129                      "popq %%rax;"
1130                      "popq %%rbx;"
1131                      "popq %%rcx;"
1132                      "popq %%rdx;"
1133                      "popq %%rbp;"
1134                      "popq %%rsi;"
1135                      "popq %%rdi;"
1136                      "popq %%r8;"
1137                      "popq %%r9;"
1138                      "popq %%r10;"
1139                      "popq %%r11;"
1140                      "popq %%r12;"
1141                      "popq %%r13;"
1142                      "popq %%r14;"
1143                      "popq %%r15;"
1144                      "addq $0x10, %%rsp;"
1145                      "iretq;"
1146                                  : : "r"(hw_tf));
1147         assert(0);
1148 #else
1149         printk("KPF return not supported\n");
1150         return -1;
1151 #endif /* CONFIG_X86 */
1152 }
1153
1154 int mon_ks(int argc, char **argv, struct hw_trapframe *hw_tf)
1155 {
1156         if (argc < 2) {
1157 usage:
1158                 printk("Usage: ks OPTION\n");
1159                 printk("\tidles: show idle core map\n");
1160                 printk("\tdiag: scheduler diagnostic report\n");
1161                 printk("\tresources: show resources wanted/granted for all procs\n");
1162                 printk("\tsort: sorts the idlecoremap, 1..n\n");
1163                 printk("\tnc PCOREID: sets the next CG core allocated\n");
1164                 return 1;
1165         }
1166         if (!strcmp(argv[1], "idles")) {
1167                 print_idle_core_map();
1168         } else if (!strcmp(argv[1], "diag")) {
1169                 sched_diag();
1170         } else if (!strcmp(argv[1], "resources")) {
1171                 print_all_resources();
1172         } else if (!strcmp(argv[1], "sort")) {
1173                 sort_idle_cores();
1174         } else if (!strcmp(argv[1], "nc")) {
1175                 if (argc != 3) {
1176                         printk("Need a pcore number.\n");
1177                         return 1;
1178                 }
1179                 next_core_to_alloc(strtol(argv[2], 0, 0));
1180         } else {
1181                 printk("Bad option %s\n", argv[1]);
1182                 goto usage;
1183         }
1184         return 0;
1185 }
1186
1187 int mon_gfp(int argc, char **argv, struct hw_trapframe *hw_tf)
1188 {
1189         size_t naddrpages = max_paddr / PGSIZE;
1190         spin_lock_irqsave(&colored_page_free_list_lock);
1191         printk("%9s %9s %9s\n", "start", "end", "size");
1192         for (int i = 0; i < naddrpages; i++) {
1193                 int j;
1194                 for (j = i; j < naddrpages; j++) {
1195                         if (!page_is_free(j))
1196                                 break;
1197                 }
1198                 if (j > i) {
1199                         printk("%9d %9d %9d\n", i, j, j - i);
1200                         i = j;
1201                 }
1202         }
1203         spin_unlock_irqsave(&colored_page_free_list_lock);
1204         return 0;
1205 }
1206
1207 /* Prints info about a core.  Optional first arg == coreid. */
1208 int mon_coreinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
1209 {
1210         struct per_cpu_info *pcpui;
1211         struct kthread *kth;
1212         int coreid = core_id();
1213
1214         if (argc >= 2)
1215                 coreid = strtol(argv[1], 0, 0);
1216         pcpui = &per_cpu_info[coreid];
1217         printk("Core %d:\n\tcur_proc %d\n\towning proc %d, owning vc %d\n",
1218                coreid, pcpui->cur_proc ? pcpui->cur_proc->pid : 0,
1219                pcpui->owning_proc ? pcpui->owning_proc->pid : 0,
1220                pcpui->owning_vcoreid != 0xdeadbeef ? pcpui->owning_vcoreid : 0);
1221         kth = pcpui->cur_kthread;
1222         if (kth) {
1223                 /* kth->proc is only used when the kthread is sleeping.  when it's
1224                  * running, we care about cur_proc.  if we're here, proc should be 0
1225                  * unless the kth is concurrently sleeping (we called this remotely) */
1226                 printk("\tkthread %p (%s), sysc %p (%d)\n", kth, kth->name,
1227                        kth->sysc, kth->sysc ? kth->sysc->num : -1);
1228         } else {
1229                 /* Can happen during early boot */
1230                 printk("\tNo kthread!\n");
1231         }
1232         return 0;
1233 }