Monitor access to semaphore debugging info
[akaros.git] / kern / src / monitor.c
1 // Simple command-line kernel monitor useful for
2 // controlling the kernel and exploring the system interactively.
3
4 #ifdef __SHARC__
5 #pragma nosharc
6 #endif
7
8 #include <arch/arch.h>
9 #include <stab.h>
10 #include <smp.h>
11 #include <console.h>
12 #include <arch/console.h>
13
14 #include <stdio.h>
15 #include <string.h>
16 #include <assert.h>
17 #include <monitor.h>
18 #include <trap.h>
19 #include <pmap.h>
20 #include <kdebug.h>
21 #include <testing.h>
22 #include <manager.h>
23 #include <schedule.h>
24 #include <kdebug.h>
25 #include <syscall.h>
26 #include <kmalloc.h>
27 #include <elf.h>
28 #include <event.h>
29 #include <trap.h>
30 #include <time.h>
31
32 #include <ros/memlayout.h>
33 #include <ros/event.h>
34
35 #define CMDBUF_SIZE     80      // enough for one VGA text line
36
37 typedef struct command {
38         const char *NTS name;
39         const char *NTS desc;
40         // return -1 to force monitor to exit
41         int (*func)(int argc, char **argv, struct hw_trapframe *hw_tf);
42 } command_t;
43
44 static command_t (RO commands)[] = {
45         { "help", "Display this list of commands", mon_help },
46         { "kerninfo", "Display information about the kernel", mon_kerninfo },
47         { "backtrace", "Dump a backtrace", mon_backtrace },
48         { "reboot", "Take a ride to the South Bay", mon_reboot },
49         { "showmapping", "Shows VA->PA mappings", mon_showmapping},
50         { "setmapperm", "Sets permissions on a VA->PA mapping", mon_setmapperm},
51         { "cpuinfo", "Prints CPU diagnostics", mon_cpuinfo},
52         { "ps", "Prints process list", mon_ps},
53         { "nanwan", "Meet Nanwan!!", mon_nanwan},
54         { "bin_ls", "List files in /bin", mon_bin_ls},
55         { "bin_run", "Create and run a program from /bin", mon_bin_run},
56         { "manager", "Run the manager", mon_manager},
57         { "procinfo", "Show information about processes", mon_procinfo},
58         { "kill", "Kills a process", mon_kill},
59         { "exit", "Leave the monitor", mon_exit},
60         { "kfunc", "Run a kernel function directly (!!!)", mon_kfunc},
61         { "notify", "Notify a process.  Vcoreid will skip their prefs", mon_notify},
62         { "measure", "Run a specific measurement", mon_measure},
63         { "trace", "Run some tracing functions", mon_trace},
64         { "monitor", "Run the monitor on another core", mon_monitor},
65         { "fs", "Filesystem Diagnostics", mon_fs},
66         { "bb", "Try to run busybox (ash)", mon_bb},
67         { "alarm", "Alarm Diagnostics", mon_alarm},
68         { "msr", "read/write msr: msr msr [value]", mon_msr},
69         { "db", "Misc debugging", mon_db},
70 };
71 #define NCOMMANDS (sizeof(commands)/sizeof(commands[0]))
72
73 /***** Implementations of basic kernel monitor commands *****/
74
75 int mon_help(int argc, char **argv, struct hw_trapframe *hw_tf)
76 {
77         int i;
78
79         for (i = 0; i < NCOMMANDS; i++)
80                 cprintf("%s - %s\n", commands[i].name, commands[i].desc);
81         return 0;
82 }
83
84 int mon_ps(int argc, char** argv, struct hw_trapframe *hw_tf)
85 {
86         print_allpids();
87         return 0;
88 }
89
90 int mon_kerninfo(int argc, char **argv, struct hw_trapframe *hw_tf)
91 {
92         extern char (RO SNT _start)[], (RO SNT etext)[], (RO SNT edata)[], (RO SNT end)[];
93
94         cprintf("Special kernel symbols:\n");
95         cprintf("  _start %016x (virt)  %016x (phys)\n", _start, (uintptr_t)(_start - KERNBASE));
96         cprintf("  etext  %016x (virt)  %016x (phys)\n", etext, (uintptr_t)(etext - KERNBASE));
97         cprintf("  edata  %016x (virt)  %016x (phys)\n", edata, (uintptr_t)(edata - KERNBASE));
98         cprintf("  end    %016x (virt)  %016x (phys)\n", end, (uintptr_t)(end - KERNBASE));
99         cprintf("Kernel executable memory footprint: %dKB\n",
100                 (uint32_t)(end-_start+1023)/1024);
101         return 0;
102 }
103
104 #if 0
105 zra: not called
106 static char RO* function_of(uint32_t address)
107 {
108         extern stab_t (RO stab)[], (RO estab)[];
109         extern char (RO stabstr)[];
110         stab_t* symtab;
111         stab_t* best_symtab = 0;
112         uint32_t best_func = 0;
113
114         // ugly and unsorted
115         for (symtab = stab; symtab < estab; symtab++) {
116                 // only consider functions, type = N_FUN
117                 if ((symtab->n_type == N_FUN) &&
118                     (symtab->n_value <= address) &&
119                         (symtab->n_value > best_func)) {
120                         best_func = symtab->n_value;
121                         best_symtab = symtab;
122                 }
123         }
124         // maybe the first stab really is the right one...  we'll see.
125         if (best_symtab == 0)
126                 return "Function not found!";
127         return stabstr + best_symtab->n_strx;
128 }
129 #endif
130
131 int mon_backtrace(int argc, char **argv, struct hw_trapframe *hw_tf)
132 {
133         uintptr_t pc, fp;
134         if (argc == 1) {
135                 backtrace();
136                 return 0;
137         }
138         if (argc != 3) {
139                 printk("Need either no arguments, or two (PC and FP) in hex\n");
140                 return 1;
141         }
142         pc = strtol(argv[1], 0, 16);
143         fp = strtol(argv[2], 0, 16);
144         printk("Backtrace from instruction %p, with frame pointer %p\n", pc, fp);
145         backtrace_frame(pc, fp);
146         return 0;
147 }
148
149 int mon_reboot(int argc, char **argv, struct hw_trapframe *hw_tf)
150 {
151         cprintf("[Scottish Accent]: She's goin' down, Cap'n!\n");
152         reboot();
153
154         // really, should never see this
155         cprintf("Sigh....\n");
156         return 0;
157 }
158
159 int mon_showmapping(int argc, char **argv, struct hw_trapframe *hw_tf)
160 {
161         if (argc < 2) {
162                 cprintf("Shows virtual -> physical mappings for a virt addr range.\n");
163                 cprintf("Usage: showmapping START_ADDR [END_ADDR]\n");
164                 return 1;
165         }
166         uintptr_t start;
167         size_t size;
168         start = ROUNDDOWN(strtol(argv[1], 0, 16), PGSIZE);
169         size = (argc == 2) ? 1 : strtol(argv[2], 0, 16) - start;
170         if (size/PGSIZE > 512) {
171                 cprintf("Not going to do this for more than 512 items\n");
172                 return 1;
173         }
174
175         show_mapping(start,size);
176         return 0;
177 }
178
179 int mon_setmapperm(int argc, char **argv, struct hw_trapframe *hw_tf)
180 {
181 #ifndef CONFIG_X86_32
182         cprintf("I don't support this call yet!\n");
183         return 1;
184 #else
185         if (argc < 3) {
186                 cprintf("Sets VIRT_ADDR's mapping's permissions to PERMS (in hex)\n");
187                 cprintf("Only affects the lowest level PTE.  To adjust the PDE, do the math.\n");
188                 cprintf("Be careful with this around UVPT, VPT, and friends.\n");
189                 cprintf("Usage: setmapperm VIRT_ADDR PERMS\n");
190                 return 1;
191         }
192         pde_t*COUNT(PTSIZE) pgdir = (pde_t*COUNT(PTSIZE))vpd;
193         pte_t *pte, *pde;
194         page_t* page;
195         uintptr_t va;
196         va = ROUNDDOWN(strtol(argv[1], 0, 16), PGSIZE);
197         page = page_lookup(pgdir, (void*SNT)va, &pte);
198         if (!page) {
199                 cprintf("No such mapping\n");
200                 return 1;
201         }
202         pde = &pgdir[PDX(va)];
203         cprintf("   Virtual    Physical  Ps Dr Ac CD WT U W\n");
204         cprintf("------------------------------------------\n");
205         cprintf("%p  %p  %1d  %1d  %1d  %1d  %1d  %1d %1d\n", va, page2pa(page),
206                (*pte & PTE_PS) >> 7, (*pte & PTE_D) >> 6, (*pte & PTE_A) >> 5,
207                (*pte & PTE_PCD) >> 4, (*pte & PTE_PWT) >> 3, (*pte & *pde & PTE_U) >> 2,
208                (*pte & *pde & PTE_W) >> 1);
209         *pte = PTE_ADDR(*pte) | (*pte & PTE_PS) |
210                (PGOFF(strtol(argv[2], 0, 16)) & ~PTE_PS ) | PTE_P;
211         cprintf("%p  %p  %1d  %1d  %1d  %1d  %1d  %1d %1d\n", va, page2pa(page),
212                (*pte & PTE_PS) >> 7, (*pte & PTE_D) >> 6, (*pte & PTE_A) >> 5,
213                (*pte & PTE_PCD) >> 4, (*pte & PTE_PWT) >> 3, (*pte & *pde & PTE_U) >> 2,
214                (*pte & *pde & PTE_W) >> 1);
215         return 0;
216 #endif
217 }
218
219 int mon_cpuinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
220 {
221         cprintf("Number of CPUs detected: %d\n", num_cpus);
222         cprintf("Calling CPU's ID: 0x%08x\n", core_id());
223
224         if (argc < 2)
225                 smp_call_function_self(test_print_info_handler, NULL, 0);
226         else
227                 smp_call_function_single(strtol(argv[1], 0, 10),
228                                          test_print_info_handler, NULL, 0);
229         return 0;
230 }
231
232 int mon_manager(int argc, char** argv, struct hw_trapframe *hw_tf)
233 {
234         manager();
235         panic("should never get here");
236         return 0;
237 }
238
239 int mon_nanwan(int argc, char **argv, struct hw_trapframe *hw_tf)
240 {
241         /* Borrowed with love from http://www.geocities.com/SoHo/7373/zoo.htm
242          * (http://www.ascii-art.com/).  Slightly modified to make it 25 lines tall.
243          */
244         printk("\n");
245         printk("             .-.  .-.\n");
246         printk("             |  \\/  |\n");
247         printk("            /,   ,_  `'-.\n");
248         printk("          .-|\\   /`\\     '. \n");
249         printk("        .'  0/   | 0\\  \\_  `\".  \n");
250         printk("     .-'  _,/    '--'.'|#''---'\n");
251         printk("      `--'  |       /   \\#\n");
252         printk("            |      /     \\#\n");
253         printk("            \\     ;|\\    .\\#\n");
254         printk("            |' ' //  \\   ::\\# \n");
255         printk("            \\   /`    \\   ':\\#\n");
256         printk("             `\"`       \\..   \\#\n");
257         printk("                        \\::.  \\#\n");
258         printk("                         \\::   \\#\n");
259         printk("                          \\'  .:\\#\n");
260         printk("                           \\  :::\\#\n");
261         printk("                            \\  '::\\#\n");
262         printk("                             \\     \\#\n");
263         printk("                              \\:.   \\#\n");
264         printk("                               \\::   \\#\n");
265         printk("                                \\'   .\\#\n");
266         printk("                             jgs \\   ::\\#\n");
267         printk("                                  \\      \n");
268         return 0;
269 }
270
271 int mon_bin_ls(int argc, char **argv, struct hw_trapframe *hw_tf)
272 {
273         struct dirent dir = {0};
274         struct file *bin_dir;
275         int retval = 0;
276
277         bin_dir = do_file_open("/bin", 0, 0);
278         if (!bin_dir) {
279                 printk("No /bin directory!\n");
280                 return 1;
281         }
282         printk("Files in /bin:\n-------------------------------\n");
283         do {
284                 retval = bin_dir->f_op->readdir(bin_dir, &dir); 
285                 printk("%s\n", dir.d_name);
286         } while (retval == 1);
287         kref_put(&bin_dir->f_kref);
288         return 0;
289 }
290
291 int mon_bin_run(int argc, char **argv, struct hw_trapframe *hw_tf)
292 {
293         if (argc < 2) {
294                 printk("Usage: bin_run FILENAME\n");
295                 return 1;
296         }
297         struct file *program;
298         int retval = 0;
299         char buf[6 + MAX_FILENAME_SZ] = "/bin/";        /* /bin/ + max + \0 */
300         strncpy(buf + 5, argv[1], MAX_FILENAME_SZ);
301         program = do_file_open(buf, 0, 0);
302         if (!program) {
303                 printk("No such program!\n");
304                 return 1;
305         }
306         char **p_argv = kmalloc(sizeof(char*) * argc, 0);       /* bin_run's argc */
307         for (int i = 0; i < argc - 1; i++)
308                 p_argv[i] = argv[i + 1];
309         p_argv[argc - 1] = 0;
310         char *p_envp[] = {"LD_LIBRARY_PATH=/lib", 0};
311         /* super ugly: we need to stash current, so that proc_create doesn't pick up
312          * on random processes running here and assuming they are the parent */
313         struct proc *old_cur = current;
314         current = 0;
315         struct proc *p = proc_create(program, p_argv, p_envp);
316         current = old_cur;
317         kfree(p_argv);
318         proc_wakeup(p);
319         proc_decref(p); /* let go of the reference created in proc_create() */
320         kref_put(&program->f_kref);
321         /* Make a scheduling decision.  You might not get the process you created,
322          * in the event there are others floating around that are runnable */
323         run_scheduler();
324         /* want to idle, so we un the process we just selected.  this is a bit
325          * hackish, but so is the monitor. */
326         smp_idle();
327         assert(0);
328         return 0;
329 }
330
331 int mon_procinfo(int argc, char **argv, struct hw_trapframe *hw_tf)
332 {
333         int8_t irq_state = 0;
334         if (argc < 2) {
335                 printk("Usage: procinfo OPTION\n");
336                 printk("\tidlecores: show idle core map\n");
337                 printk("\tall: show all active pids\n");
338                 printk("\tsched: scheduler diagnostic report\n");
339                 printk("\tresources: show resources wanted/granted for all procs\n");
340                 printk("\tpid NUM: show a lot of info for proc NUM\n");
341                 printk("\tunlock: unlock the lock for the ADDR (OMG!!!)\n");
342                 printk("\tkill NUM: destroy proc NUM\n");
343                 return 1;
344         }
345         if (!strcmp(argv[1], "idlecores")) {
346                 print_idlecoremap();
347         } else if (!strcmp(argv[1], "all")) {
348                 print_allpids();
349         } else if (!strcmp(argv[1], "sched")) {
350                 sched_diag();
351         } else if (!strcmp(argv[1], "resources")) {
352                 print_all_resources();
353         } else if (!strcmp(argv[1], "pid")) {
354                 if (argc != 3) {
355                         printk("Give me a pid number.\n");
356                         return 1;
357                 }
358                 print_proc_info(strtol(argv[2], 0, 0));
359         } else if (!strcmp(argv[1], "unlock")) {
360                 if (argc != 3) {
361                         printk("Gimme lock address!  Me want lock address!.\n");
362                         return 1;
363                 }
364                 spinlock_t *lock = (spinlock_t*)strtol(argv[2], 0, 16);
365                 if (!lock) {
366                         printk("Null address...\n");
367                         return 1;
368                 }
369                 spin_unlock(lock);
370         } else if (!strcmp(argv[1], "kill")) {
371                 if (argc != 3) {
372                         printk("Give me a pid number.\n");
373                         return 1;
374                 }
375                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
376                 if (!p) {
377                         printk("No such proc\n");
378                         return 1;
379                 }
380                 enable_irqsave(&irq_state);
381                 proc_destroy(p);
382                 disable_irqsave(&irq_state);
383                 proc_decref(p);
384         } else {
385                 printk("Bad option\n");
386                 return 1;
387         }
388         return 0;
389 }
390
391 int mon_kill(int argc, char **argv, struct hw_trapframe *hw_tf)
392 {
393         struct proc *p;
394         int8_t irq_state = 0;
395         if (argc < 2) {
396                 printk("Usage: kill PID\n");
397                 return 1;
398         }
399         p = pid2proc(strtol(argv[1], 0, 0));
400         if (!p) {
401                 printk("No such proc\n");
402                 return 1;
403         }
404         enable_irqsave(&irq_state);
405         proc_destroy(p);
406         disable_irqsave(&irq_state);
407         proc_decref(p);
408         return 0;
409 }
410
411 int mon_exit(int argc, char **argv, struct hw_trapframe *hw_tf)
412 {
413         return -1;
414 }
415
416 int mon_kfunc(int argc, char **argv, struct hw_trapframe *hw_tf)
417 {
418         void (*func)(void *arg, ...);
419
420         if (argc < 2) {
421                 printk("Usage: kfunc FUNCTION [arg1] [arg2] [etc]\n");
422                 printk("Arguments must be in hex.  Can take 6 args.\n");
423                 return 1;
424         }
425         func = (void*)get_symbol_addr(argv[1]);
426         if (!func) {
427                 printk("Function not found.\n");
428                 return 1;
429         }
430         /* Not elegant, but whatever.  maybe there's a better syntax, or we can do
431          * it with asm magic. */
432         switch (argc) {
433                 case 2: /* have to fake one arg */
434                         func((void*)0);
435                         break;
436                 case 3: /* the real first arg */
437                         func((void*)strtol(argv[2], 0, 16));
438                         break;
439                 case 4:
440                         func((void*)strtol(argv[2], 0, 16),
441                                     strtol(argv[3], 0, 16));
442                         break;
443                 case 5:
444                         func((void*)strtol(argv[2], 0, 16),
445                                     strtol(argv[3], 0, 16),
446                                     strtol(argv[4], 0, 16));
447                         break;
448                 case 6:
449                         func((void*)strtol(argv[2], 0, 16),
450                                     strtol(argv[3], 0, 16),
451                                     strtol(argv[4], 0, 16),
452                                     strtol(argv[5], 0, 16));
453                         break;
454                 case 7:
455                         func((void*)strtol(argv[2], 0, 16),
456                                     strtol(argv[3], 0, 16),
457                                     strtol(argv[4], 0, 16),
458                                     strtol(argv[5], 0, 16),
459                                     strtol(argv[6], 0, 16));
460                         break;
461                 case 8:
462                         func((void*)strtol(argv[2], 0, 16),
463                                     strtol(argv[3], 0, 16),
464                                     strtol(argv[4], 0, 16),
465                                     strtol(argv[5], 0, 16),
466                                     strtol(argv[6], 0, 16),
467                                     strtol(argv[7], 0, 16));
468                         break;
469                 default:
470                         printk("Bad number of arguments.\n");
471                         return -1;
472         }
473         return 0;
474 }
475
476 /* Sending a vcoreid forces an event and an IPI/notification */
477 int mon_notify(int argc, char **argv, struct hw_trapframe *hw_tf)
478 {
479         struct proc *p;
480         uint32_t vcoreid;
481         struct event_msg msg = {0};
482
483         if (argc < 3) {
484                 printk("Usage: notify PID NUM [VCOREID]\n");
485                 return 1;
486         }
487         p = pid2proc(strtol(argv[1], 0, 0));
488         if (!p) {
489                 printk("No such proc\n");
490                 return 1;
491         }
492         msg.ev_type = strtol(argv[2], 0, 0);
493         if (argc == 4) {
494                 vcoreid = strtol(argv[3], 0, 0);
495                 /* This will go to the private mbox */
496                 post_vcore_event(p, &msg, vcoreid, EVENT_VCORE_PRIVATE);
497                 proc_notify(p, vcoreid);
498         } else {
499                 /* o/w, try and do what they want */
500                 send_kernel_event(p, &msg, 0);
501         }
502         proc_decref(p);
503         return 0;
504 }
505
506 /* Micro-benchmarky Measurements.  This is really fragile code that probably
507  * won't work perfectly, esp as the kernel evolves. */
508 int mon_measure(int argc, char **argv, struct hw_trapframe *hw_tf)
509 {
510         uint64_t begin = 0, diff = 0;
511         uint32_t end_refcnt = 0;
512         int8_t irq_state = 0;
513
514         if (argc < 2) {
515                 printk("Usage: measure OPTION\n");
516                 printk("\tkill PID : kill proc PID\n");
517                 printk("\tpreempt PID : preempt proc PID (no delay)\n");
518                 printk("\tpreempt PID [pcore] : preempt PID's pcore (no delay)\n");
519                 printk("\tpreempt-warn PID : warn-preempt proc PID (pending)\n");
520                 printk("\tpreempt-warn PID [pcore] : warn-preempt proc PID's pcore\n");
521                 printk("\tpreempt-raw PID : raw-preempt proc PID\n");
522                 printk("\tpreempt-raw PID [pcore] : raw-preempt proc PID's pcore\n");
523                 return 1;
524         }
525         if (!strcmp(argv[1], "kill")) {
526                 if (argc < 3) {
527                         printk("Give me a pid number.\n");
528                         return 1;
529                 }
530                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
531                 if (!p) {
532                         printk("No such proc\n");
533                         return 1;
534                 }
535                 begin = start_timing();
536 #ifdef CONFIG_APPSERVER
537                 printk("Warning: this will be inaccurate due to the appserver.\n");
538                 end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores - 1;
539 #endif /* CONFIG_APPSERVER */
540                 enable_irqsave(&irq_state);
541                 proc_destroy(p);
542                 disable_irqsave(&irq_state);
543                 proc_decref(p);
544 #ifdef CONFIG_APPSERVER
545                 /* Won't be that accurate, since it's not actually going through the
546                  * __proc_free() path. */
547                 spin_on(kref_refcnt(&p->p_kref) != end_refcnt); 
548 #else
549                 /* this is a little ghetto. it's not fully free yet, but we are also
550                  * slowing it down by messing with it, esp with the busy waiting on a
551                  * hyperthreaded core. */
552                 spin_on(p->env_cr3);
553 #endif /* CONFIG_APPSERVER */
554                 /* No noticeable difference using stop_timing instead of read_tsc() */
555                 diff = stop_timing(begin);
556         } else if (!strcmp(argv[1], "preempt")) {
557                 if (argc < 3) {
558                         printk("Give me a pid number.\n");
559                         return 1;
560                 }
561                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
562                 if (!p) {
563                         printk("No such proc\n");
564                         return 1;
565                 }
566                 if (argc == 4) { /* single core being preempted, warned but no delay */
567                         uint32_t pcoreid = strtol(argv[3], 0, 0);
568                         begin = start_timing();
569                         if (proc_preempt_core(p, pcoreid, 1000000)) {
570                                 __sched_put_idle_core(p, pcoreid);
571                                 /* done when unmapped (right before abandoning) */
572                                 spin_on(p->procinfo->pcoremap[pcoreid].valid);
573                         } else {
574                                 printk("Core %d was not mapped to proc\n", pcoreid);
575                         }
576                         diff = stop_timing(begin);
577                 } else { /* preempt all cores, warned but no delay */
578                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
579                         begin = start_timing();
580                         proc_preempt_all(p, 1000000);
581                         /* a little ghetto, implies no one is using p */
582                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
583                         diff = stop_timing(begin);
584                 }
585                 proc_decref(p);
586         } else if (!strcmp(argv[1], "preempt-warn")) {
587                 if (argc < 3) {
588                         printk("Give me a pid number.\n");
589                         return 1;
590                 }
591                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
592                 if (!p) {
593                         printk("No such proc\n");
594                         return 1;
595                 }
596                 printk("Careful: if this hangs, then the process isn't responding.\n");
597                 if (argc == 4) { /* single core being preempted-warned */
598                         uint32_t pcoreid = strtol(argv[3], 0, 0);
599                         spin_lock(&p->proc_lock);
600                         uint32_t vcoreid = p->procinfo->pcoremap[pcoreid].vcoreid;
601                         if (!p->procinfo->pcoremap[pcoreid].valid) {
602                                 printk("Pick a mapped pcore\n");
603                                 spin_unlock(&p->proc_lock);
604                                 return 1;
605                         }
606                         begin = start_timing();
607                         __proc_preempt_warn(p, vcoreid, 1000000); // 1 sec
608                         spin_unlock(&p->proc_lock);
609                         /* done when unmapped (right before abandoning) */
610                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
611                         diff = stop_timing(begin);
612                 } else { /* preempt-warn all cores */
613                         printk("Warning, this won't work if they can't yield their "
614                                "last vcore, will stop at 1!\n");
615                         spin_lock(&p->proc_lock);
616                         begin = start_timing();
617                         __proc_preempt_warnall(p, 1000000);
618                         spin_unlock(&p->proc_lock);
619                         /* target cores do the unmapping / changing of the num_vcores */
620                         spin_on(p->procinfo->num_vcores > 1);
621                         diff = stop_timing(begin);
622                 }
623                 proc_decref(p);
624         } else if (!strcmp(argv[1], "preempt-raw")) {
625                 if (argc < 3) {
626                         printk("Give me a pid number.\n");
627                         return 1;
628                 }
629                 struct proc *p = pid2proc(strtol(argv[2], 0, 0));
630                 if (!p) {
631                         printk("No such proc\n");
632                         return 1;
633                 }
634                 if (argc == 4) { /* single core preempted, no warning or waiting */
635                         uint32_t pcoreid = strtol(argv[3], 0, 0);
636                         spin_lock(&p->proc_lock);
637                         if (!p->procinfo->pcoremap[pcoreid].valid) {
638                                 printk("Pick a mapped pcore\n");
639                                 spin_unlock(&p->proc_lock);
640                                 return 1;
641                         }
642                         begin = start_timing();
643                         __proc_preempt_core(p, pcoreid);
644                         if (!p->procinfo->num_vcores)
645                                 __proc_set_state(p, PROC_RUNNABLE_M);
646                         spin_unlock(&p->proc_lock);
647                         /* ghetto, since the ksched should be calling all of this */
648                         __sched_put_idle_core(p, pcoreid);
649                         /* done when unmapped (right before abandoning) */
650                         spin_on(p->procinfo->pcoremap[pcoreid].valid);
651                         diff = stop_timing(begin);
652                 } else { /* preempt all cores, no warning or waiting */
653                         spin_lock(&p->proc_lock);
654                         uint32_t pc_arr[p->procinfo->num_vcores];
655                         uint32_t num_revoked;
656                         end_refcnt = kref_refcnt(&p->p_kref) - p->procinfo->num_vcores;
657                         begin = start_timing();
658                         num_revoked = __proc_preempt_all(p, pc_arr);
659                         __proc_set_state(p, PROC_RUNNABLE_M);
660                         spin_unlock(&p->proc_lock);
661                         if (num_revoked)
662                                 __sched_put_idle_cores(p, pc_arr, num_revoked);
663                         /* a little ghetto, implies no one else is using p */
664                         spin_on(kref_refcnt(&p->p_kref) != end_refcnt);
665                         diff = stop_timing(begin);
666                 }
667                 proc_decref(p);
668         } else {
669                 printk("Bad option\n");
670                 return 1;
671         }
672         printk("[Tired Giraffe Accent] Took %llu usec (%llu nsec) to finish.\n",
673                tsc2usec(diff), tsc2nsec(diff));
674         return 0;
675 }
676
677 /* Used in various debug locations.  Not a kernel API or anything. */
678 bool mon_verbose_trace = FALSE;
679
680 int mon_trace(int argc, char **argv, struct hw_trapframe *hw_tf)
681 {
682         int core;
683         if (argc < 2) {
684                 printk("Usage: trace OPTION\n");
685                 printk("\tsyscall start [silent] [pid]: starts tracing\n");
686                 printk("\tsyscall stop: stops tracing, prints if it was silent\n");
687                 printk("\tcoretf COREID: prints PC, -1 for all cores, verbose => TF\n");
688                 printk("\tpcpui [type [coreid]]: runs pcpui trace ring handlers\n");
689                 printk("\tpcpui-reset [noclear]: resets/clears pcpui trace ring\n");
690                 printk("\tverbose: toggles verbosity, depends on trace command\n");
691                 return 1;
692         }
693         if (!strcmp(argv[1], "syscall")) {
694                 if (argc < 3) {
695                         printk("Need a start or stop.\n");
696                         return 1;
697                 }
698                 if (!strcmp(argv[2], "start")) {
699                         bool all = TRUE;
700                         bool silent = FALSE;
701                         struct proc *p = NULL;
702                         if (argc >= 4) {
703                                 silent = (bool)strtol(argv[3], 0, 0);
704                         }
705                         if (argc >= 5) {
706                                 all = FALSE;
707                                 p = pid2proc(strtol(argv[4], 0, 0));
708                                 if (!p) {
709                                         printk("No such process\n");
710                                         return 1;
711                                 }
712                         }
713                         systrace_start(silent);
714                         if (systrace_reg(all, p))
715                                 printk("No room to trace more processes\n");
716                 } else if (!strcmp(argv[2], "stop")) {
717                         /* Stop and print for all processes */
718                         systrace_stop();
719                         systrace_print(TRUE, 0);
720                         systrace_clear_buffer();
721                 }
722         } else if (!strcmp(argv[1], "coretf")) {
723                 if (argc != 3) {
724                         printk("Need a coreid, fool.\n");
725                         return 1;
726                 }
727                 core = strtol(argv[2], 0, 0);
728                 if (core < 0) {
729                         printk("Sending NMIs to all cores:\n");
730                         for (int i = 0; i < num_cpus; i++)
731                                 send_nmi(i);
732                 } else {
733                         printk("Sending NMI core %d:\n", core);
734                         if (core >= num_cpus) {
735                                 printk("No such core!  Maybe it's in another cell...\n");
736                                 return 1;
737                         }
738                         send_nmi(core);
739                 }
740                 udelay(1000000);
741         } else if (!strcmp(argv[1], "pcpui")) {
742                 int pcpui_type, pcpui_coreid;
743                 if (argc >= 3)
744                         pcpui_type = strtol(argv[2], 0, 0);
745                 else
746                         pcpui_type = 0;
747                 printk("\nRunning PCPUI Trace Ring handlers for type %d\n", pcpui_type);
748                 if (argc >= 4) {
749                         pcpui_coreid = strtol(argv[3], 0, 0); 
750                         pcpui_tr_foreach(pcpui_coreid, pcpui_type);
751                 } else {
752                         pcpui_tr_foreach_all(pcpui_type);
753                 }
754         } else if (!strcmp(argv[1], "pcpui-reset")) {
755                 if (argc >= 3) {
756                         printk("\nResetting all PCPUI Trace Rings\n");
757                         pcpui_tr_reset_all();
758                 } else {
759                         printk("\nResetting and clearing all PCPUI Trace Rings\n");
760                         pcpui_tr_reset_and_clear_all();
761                 }
762         } else if (!strcmp(argv[1], "verbose")) {
763                 if (mon_verbose_trace) {
764                         printk("Turning trace verbosity off\n");
765                         mon_verbose_trace = FALSE;
766                 } else {
767                         printk("Turning trace verbosity on\n");
768                         mon_verbose_trace = TRUE;
769                 }
770         } else if (!strcmp(argv[1], "opt2")) {
771                 if (argc != 3) {
772                         printk("ERRRRRRRRRR.\n");
773                         return 1;
774                 }
775                 print_proc_info(strtol(argv[2], 0, 0));
776         } else {
777                 printk("Bad option\n");
778                 return 1;
779         }
780         return 0;
781 }
782
783 int mon_monitor(int argc, char **argv, struct hw_trapframe *hw_tf)
784 {
785         if (argc < 2) {
786                 printk("Usage: monitor COREID\n");
787                 return 1;
788         }
789         uint32_t core = strtol(argv[1], 0, 0);
790         if (core >= num_cpus) {
791                 printk("No such core!  Maybe it's in another cell...\n");
792                 return 1;
793         }
794         send_kernel_message(core, __run_mon, 0, 0, 0, KMSG_ROUTINE);
795         return 0;
796 }
797
798 /***** Kernel monitor command interpreter *****/
799
800 #define WHITESPACE "\t\r\n "
801 #define MAXARGS 16
802
803 static int runcmd(char *NTS real_buf, struct hw_trapframe *hw_tf) {
804         char * buf = NTEXPAND(real_buf);
805         int argc;
806         char *NTS argv[MAXARGS];
807         int i;
808
809         // Parse the command buffer into whitespace-separated arguments
810         argc = 0;
811         argv[argc] = 0;
812         while (1) {
813                 // gobble whitespace
814                 while (*buf && strchr(WHITESPACE, *buf))
815                         *buf++ = 0;
816                 if (*buf == 0)
817                         break;
818
819                 // save and scan past next arg
820                 if (argc == MAXARGS-1) {
821                         cprintf("Too many arguments (max %d)\n", MAXARGS);
822                         return 0;
823                 }
824                 //This will get fucked at runtime..... in the ASS
825                 argv[argc++] = buf;
826                 while (*buf && !strchr(WHITESPACE, *buf))
827                         buf++;
828         }
829         argv[argc] = 0;
830
831         // Lookup and invoke the command
832         if (argc == 0)
833                 return 0;
834         for (i = 0; i < NCOMMANDS; i++) {
835                 if (strcmp(argv[0], commands[i].name) == 0)
836                         return commands[i].func(argc, argv, hw_tf);
837         }
838         cprintf("Unknown command '%s'\n", argv[0]);
839         return 0;
840 }
841
842 void monitor(struct hw_trapframe *hw_tf)
843 {
844         #define MON_CMD_LENGTH 256
845         char buf[MON_CMD_LENGTH];
846         int cnt;
847         int coreid = core_id_early();
848
849         /* they are always disabled, since we have this irqsave lock */
850         if (irq_is_enabled())
851                 printk("Entering Nanwan's Dungeon on Core %d (Ints on):\n", coreid);
852         else
853                 printk("Entering Nanwan's Dungeon on Core %d (Ints off):\n", coreid);
854         printk("Type 'help' for a list of commands.\n");
855
856         if (hw_tf != NULL)
857                 print_trapframe(hw_tf);
858
859         while (1) {
860                 /* on occasion, the kernel monitor can migrate (like if you run
861                  * something that blocks / syncs and wakes up on another core) */
862                 cmb();
863                 cnt = readline(buf, MON_CMD_LENGTH, "ROS(Core %d)> ", core_id_early());
864                 if (cnt > 0) {
865                         buf[cnt] = 0;
866                         if (runcmd(buf, hw_tf) < 0)
867                                 break;
868                 }
869         }
870 }
871
872 static void pm_flusher(void *unused)
873 {
874         struct super_block *sb;
875         struct inode *inode;
876         unsigned long nr_pages;
877
878         /* could also put the delay between calls, or even within remove, during the
879          * WB phase. */
880         while (1) {
881                 udelay_sched(5000);
882                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
883                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
884                                 nr_pages = ROUNDUP(inode->i_size, PGSIZE) >> PGSHIFT;
885                                 if (nr_pages)
886                                         pm_remove_contig(inode->i_mapping, 0, nr_pages);
887                         }
888                 }
889         }
890 }
891
892 int mon_fs(int argc, char **argv, struct hw_trapframe *hw_tf)
893 {
894         /* this assumes one mounted FS at the NS root */
895         struct super_block *sb;
896         struct file *file;
897         struct inode *inode;
898         struct dentry *dentry;
899         if (argc < 2) {
900                 printk("Usage: fs OPTION\n");
901                 printk("\topen: show all open files\n");
902                 printk("\tinodes: show all inodes\n");
903                 printk("\tdentries [lru|prune]: show all dentries, opt LRU/prune\n");
904                 printk("\tls DIR: print the dir tree starting with DIR\n");
905                 printk("\tpid: proc PID's fs crap placeholder\n");
906                 printk("\tpmflusher: start a ktask to keep flushing all PMs\n");
907                 return 1;
908         }
909         if (!strcmp(argv[1], "open")) {
910                 printk("Open Files:\n----------------------------\n");
911                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
912                         printk("Superblock for %s\n", sb->s_name);
913                         TAILQ_FOREACH(file, &sb->s_files, f_list)
914                                 printk("File: %p, %s, Refs: %d, Drefs: %d, Irefs: %d PM: %p\n",
915                                        file, file_name(file), kref_refcnt(&file->f_kref),
916                                        kref_refcnt(&file->f_dentry->d_kref),
917                                        kref_refcnt(&file->f_dentry->d_inode->i_kref),
918                                            file->f_mapping);
919                 }
920         } else if (!strcmp(argv[1], "inodes")) {
921                 printk("Mounted FS Inodes:\n----------------------------\n");
922                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
923                         printk("Superblock for %s\n", sb->s_name);
924                         TAILQ_FOREACH(inode, &sb->s_inodes, i_sb_list) {
925                                 printk("Inode: %p, Refs: %d, Nlinks: %d, Size(B): %d\n",
926                                        inode, kref_refcnt(&inode->i_kref), inode->i_nlink,
927                                        inode->i_size);
928                                 TAILQ_FOREACH(dentry, &inode->i_dentry, d_alias)
929                                         printk("\t%s: Dentry: %p, Refs: %d\n",
930                                                dentry->d_name.name, dentry,
931                                                kref_refcnt(&dentry->d_kref));
932                         }
933                 }
934         } else if (!strcmp(argv[1], "dentries")) {
935                 printk("Dentry Cache:\n----------------------------\n");
936                 TAILQ_FOREACH(sb, &super_blocks, s_list) {
937                         printk("Superblock for %s\n", sb->s_name);
938                         printk("DENTRY     FLAGS      REFCNT NAME\n");
939                         printk("--------------------------------\n");
940                         /* Hash helper */
941                         void print_dcache_entry(void *item)
942                         {
943                                 struct dentry *d_i = (struct dentry*)item;
944                                 printk("%p %p %02d     %s\n", d_i, d_i->d_flags,
945                                        kref_refcnt(&d_i->d_kref), d_i->d_name.name);
946                         }
947                         hash_for_each(sb->s_dcache, print_dcache_entry);
948                 }
949                 if (argc < 3)
950                         return 0;
951                 if (!strcmp(argv[2], "lru")) {
952                         printk("LRU lists:\n");
953                         TAILQ_FOREACH(sb, &super_blocks, s_list) {
954                                 printk("Superblock for %s\n", sb->s_name);
955                                 TAILQ_FOREACH(dentry, &sb->s_lru_d, d_lru)
956                                         printk("Dentry: %p, Name: %s\n", dentry,
957                                                dentry->d_name.name);
958                         }
959                 } else if (!strcmp(argv[2], "prune")) {
960                         printk("Pruning unused dentries\n");
961                         TAILQ_FOREACH(sb, &super_blocks, s_list)
962                                 dcache_prune(sb, FALSE);
963                 }
964         } else if (!strcmp(argv[1], "ls")) {
965                 if (argc != 3) {
966                         printk("Give me a dir.\n");
967                         return 1;
968                 }
969                 if (argv[2][0] != '/') {
970                         printk("Dear fellow giraffe lover, Use absolute paths.\n");
971                         return 1;
972                 }
973                 ls_dash_r(argv[2]);
974                 /* whatever.  placeholder. */
975         } else if (!strcmp(argv[1], "pid")) {
976                 if (argc != 3) {
977                         printk("Give me a pid number.\n");
978                         return 1;
979                 }
980                 /* whatever.  placeholder. */
981         } else if (!strcmp(argv[1], "pmflusher")) {
982                 ktask("pm_flusher", pm_flusher, 0);
983         } else {
984                 printk("Bad option\n");
985                 return 1;
986         }
987         return 0;
988 }
989
990 int mon_bb(int argc, char **argv, struct hw_trapframe *hw_tf)
991 {
992         char *l_argv[3] = {"", "busybox", "ash"};
993         return mon_bin_run(3, l_argv, hw_tf);
994 }
995
996 int mon_alarm(int argc, char **argv, struct hw_trapframe *hw_tf)
997 {
998         if (argc < 2) {
999                 printk("Usage: alarm OPTION\n");
1000                 printk("\tpcpu: print full alarm tchains from every core\n");
1001                 return 1;
1002         }
1003         if (!strcmp(argv[1], "pcpu")) {
1004                 print_pcpu_chains();
1005         } else {
1006                 printk("Bad option\n");
1007                 return 1;
1008         }
1009         return 0;
1010 }
1011
1012 static void show_msr(struct hw_trapframe *unused, void *v)
1013 {
1014         int core = core_id();
1015         uint64_t val;
1016         uint32_t msr = *(uint32_t *)v;
1017         val = read_msr(msr);
1018         printk("%d: %08x: %016llx\n", core, msr, val);
1019 }
1020
1021 struct set {
1022         uint32_t msr;
1023         uint64_t val;
1024 };
1025
1026 static void set_msr(struct hw_trapframe *unused, void *v)
1027 {
1028         int core = core_id();
1029         struct set *s = v;
1030         uint32_t msr = s->msr;
1031         uint64_t val = s->val;
1032         write_msr(msr, val);
1033         val = read_msr(msr);
1034         printk("%d: %08x: %016llx\n", core, msr, val);
1035 }
1036
1037 int mon_msr(int argc, char **argv, struct hw_trapframe *hw_tf)
1038 {
1039 #ifndef CONFIG_X86
1040         cprintf("Not on this architecture\n");
1041         return 1;
1042 #else
1043         uint64_t val;
1044         uint32_t msr;
1045         if (argc < 2 || argc > 3) {
1046                 printk("Usage: msr register [value]\n");
1047                 return 1;
1048         }
1049         msr = strtoul(argv[1], 0, 16);
1050         handler_wrapper_t *w;
1051         smp_call_function_all(show_msr, &msr, &w);
1052         smp_call_wait(w);
1053
1054         if (argc < 3)
1055                 return 0;
1056         /* somewhat bogus on 32 bit. */
1057         val = strtoul(argv[2], 0, 16);
1058
1059         struct set set;
1060         set.msr = msr;
1061         set.val = val;
1062         smp_call_function_all(set_msr, &set, &w);
1063         smp_call_wait(w);
1064         return 0;
1065 #endif
1066 }
1067
1068 int mon_db(int argc, char **argv, struct hw_trapframe *hw_tf)
1069 {
1070         if (argc < 2) {
1071                 printk("Usage: db OPTION\n");
1072                 printk("\tsem: print all semaphore info\n");
1073                 return 1;
1074         }
1075         if (!strcmp(argv[1], "sem")) {
1076                 print_all_sem_info();
1077         } else {
1078                 printk("Bad option\n");
1079                 return 1;
1080         }
1081         return 0;
1082 }