Rename RCU CB context to 'cannot block' context
[akaros.git] / kern / src / init.c
1 /* See COPYRIGHT for copyright information. */
2
3 #ifdef CONFIG_BSD_ON_CORE0
4 #error "Yeah, it's not possible to build ROS with BSD on Core 0, sorry......"
5 #else
6
7 #include <arch/arch.h>
8 #include <arch/topology.h>
9 #include <arch/console.h>
10 #include <multiboot.h>
11 #include <smp.h>
12
13 #include <time.h>
14 #include <atomic.h>
15 #include <stdio.h>
16 #include <string.h>
17 #include <assert.h>
18 #include <monitor.h>
19 #include <pmap.h>
20 #include <process.h>
21 #include <trap.h>
22 #include <syscall.h>
23 #include <manager.h>
24 #include <testing.h>
25 #include <kmalloc.h>
26 #include <hashtable.h>
27 #include <radix.h>
28 #include <mm.h>
29 #include <ex_table.h>
30 #include <percpu.h>
31
32 #include <arch/init.h>
33 #include <bitmask.h>
34 #include <slab.h>
35 #include <kthread.h>
36 #include <linker_func.h>
37 #include <net/ip.h>
38 #include <acpi.h>
39 #include <coreboot_tables.h>
40 #include <rcu.h>
41
42 #define MAX_BOOT_CMDLINE_SIZE 4096
43
44 #define ASSIGN_PTRVAL(prm, top, val)                    \
45         do {                                                                            \
46                 if (prm && (prm < top)) {                               \
47                         *prm = val;                                                     \
48                         prm++;                                                          \
49                 }                                                                               \
50         } while (0)
51
52 bool booting = TRUE;
53 struct proc_global_info __proc_global_info;
54 struct sysinfo_t sysinfo;
55 static char boot_cmdline[MAX_BOOT_CMDLINE_SIZE];
56
57 static void run_linker_funcs(void);
58 static int run_init_script(void);
59
60 const char *get_boot_option(const char *base, const char *option, char *param,
61                                                         size_t max_param)
62 {
63         size_t optlen = strlen(option);
64         char *ptop = param + max_param - 1;
65         const char *opt, *arg;
66
67         if (!base)
68                 base = boot_cmdline;
69         for (;;) {
70                 opt = strstr(base, option);
71                 if (!opt)
72                         return NULL;
73                 if (((opt == base) || (opt[-1] == ' ')) &&
74                         ((opt[optlen] == 0) || (opt[optlen] == '=') ||
75                          (opt[optlen] == ' ')))
76                         break;
77                 base = opt + optlen;
78         }
79         arg = opt + optlen;
80         if (*arg == '=') {
81                 arg++;
82                 if (*arg == '\'') {
83                         arg++;
84                         for (; *arg; arg++) {
85                                 if (*arg == '\\')
86                                         arg++;
87                                 else if (*arg == '\'')
88                                         break;
89                                 ASSIGN_PTRVAL(param, ptop, *arg);
90                         }
91                 } else {
92                         for (; *arg && (*arg != ' '); arg++)
93                                 ASSIGN_PTRVAL(param, ptop, *arg);
94                 }
95         }
96         ASSIGN_PTRVAL(param, ptop, 0);
97
98         return arg;
99 }
100
101 static void extract_multiboot_cmdline(struct multiboot_info *mbi)
102 {
103         if (mbi && (mbi->flags & MULTIBOOT_INFO_CMDLINE) && mbi->cmdline) {
104                 const char *cmdln = (const char *) KADDR(mbi->cmdline);
105
106                 /* We need to copy the command line in a permanent buffer, since the
107                  * multiboot memory where it is currently residing will be part of the
108                  * free boot memory later on in the boot process.
109                  */
110                 strlcpy(boot_cmdline, cmdln, sizeof(boot_cmdline));
111         }
112 }
113
114 static void __kernel_init_part_deux(void *arg);
115
116 void kernel_init(multiboot_info_t *mboot_info)
117 {
118         extern char __start_bss[], __stop_bss[];
119
120         memset(__start_bss, 0, __stop_bss - __start_bss);
121         /* mboot_info is a physical address.  while some arches currently have the
122          * lower memory mapped, everyone should have it mapped at kernbase by now.
123          * also, it might be in 'free' memory, so once we start dynamically using
124          * memory, we may clobber it. */
125         multiboot_kaddr = (struct multiboot_info*)((physaddr_t)mboot_info
126                                                + KERNBASE);
127         extract_multiboot_cmdline(multiboot_kaddr);
128
129         cons_init();
130         print_cpuinfo();
131
132         printk("Boot Command Line: '%s'\n", boot_cmdline);
133
134         exception_table_init();
135         num_cores = get_early_num_cores();
136         pmem_init(multiboot_kaddr);
137         kmalloc_init();
138         vmap_init();
139         hashtable_init();
140         radix_init();
141         acpiinit();
142         topology_init();
143         percpu_init();
144         kthread_init();                                 /* might need to tweak when this happens */
145         vmr_init();
146         page_check();
147         idt_init();
148         /* After kthread_init and idt_init, we can use a real kstack. */
149         __use_real_kstack(__kernel_init_part_deux);
150 }
151
152 static void __kernel_init_part_deux(void *arg)
153 {
154         kernel_msg_init();
155         timer_init();
156         time_init();
157         arch_init();
158         rcu_init();
159         enable_irq();
160         run_linker_funcs();
161         /* reset/init devtab after linker funcs 3 and 4.  these run NIC and medium
162          * pre-inits, which need to happen before devether. */
163         devtabreset();
164         devtabinit();
165
166 #ifdef CONFIG_ETH_AUDIO
167         eth_audio_init();
168 #endif /* CONFIG_ETH_AUDIO */
169         get_coreboot_info(&sysinfo);
170         booting = FALSE;
171
172 #ifdef CONFIG_RUN_INIT_SCRIPT
173         if (run_init_script()) {
174                 printk("Configured to run init script, but no script specified!\n");
175                 manager();
176         }
177 #else
178         manager();
179 #endif
180 }
181
182 #ifdef CONFIG_RUN_INIT_SCRIPT
183 static int run_init_script(void)
184 {
185         /* If we have an init script path specified */
186         if (strlen(CONFIG_INIT_SCRIPT_PATH_AND_ARGS) != 0) {
187                 int vargs = 0;
188                 char *sptr = &CONFIG_INIT_SCRIPT_PATH_AND_ARGS[0];
189
190                 /* Figure out how many arguments there are, by finding the spaces */
191                 /* TODO: consider rewriting this stuff with parsecmd */
192                 while (*sptr != '\0') {
193                         if (*(sptr++) != ' ') {
194                                 vargs++;
195                                 while ((*sptr != ' ') && (*sptr != '\0'))
196                                         sptr++;
197                         }
198                 }
199
200                 /* Initialize l_argv with its first three arguments, but allocate space
201                  * for all arguments as calculated above */
202                 int static_args = 2;
203                 int total_args = vargs + static_args;
204                 char *l_argv[total_args];
205                 l_argv[0] = "/bin/bash";
206                 l_argv[1] = "bash";
207
208                 /* Initialize l_argv with the rest of the arguments */
209                 int i = static_args;
210                 sptr = &CONFIG_INIT_SCRIPT_PATH_AND_ARGS[0];
211                 while (*sptr != '\0') {
212                         if (*sptr != ' ') {
213                                 l_argv[i++] = sptr;
214                                 while ((*sptr != ' ') && (*sptr != '\0'))
215                                         sptr++;
216                                 if (*sptr == '\0')
217                                         break;
218                                 *sptr = '\0';
219                         }
220                         sptr++;
221                 }
222
223                 /* Run the script with its arguments */
224                 mon_bin_run(total_args, l_argv, NULL);
225         }
226         return -1;
227 }
228 #endif
229
230 /* Multiple cores can panic concurrently.  We could also panic recursively,
231  * which could deadlock.  We also only want to automatically backtrace the first
232  * time through, since BTs are often the source of panics.  Finally, we want to
233  * know when the other panicking cores are done (or likely to be done) before
234  * entering the monitor.
235  *
236  * We'll use the print_lock(), which is recursive, to protect panic_printing. */
237 static bool panic_printing;
238 static DEFINE_PERCPU(int, panic_depth);
239
240 /*
241  * Panic is called on unresolvable fatal errors.
242  * It prints "panic: mesg", and then enters the kernel monitor.
243  */
244 void _panic(struct hw_trapframe *hw_tf, const char *file, int line,
245             const char *fmt, ...)
246 {
247         struct per_cpu_info *pcpui = &per_cpu_info[core_id_early()];
248         va_list ap;
249
250         print_lock();
251         panic_printing = true;
252         PERCPU_VAR(panic_depth)++;
253
254         va_start(ap, fmt);
255         printk("\nkernel panic at %s:%d, from core %d: ", file, line,
256                core_id_early());
257         vcprintf(fmt, ap);
258         printk("\n");
259         va_end(ap);
260         /* Recursive panics are usually backtrace problems.  Possibly printk.
261          * Locking panics might recurse forever. */
262         if (PERCPU_VAR(panic_depth) == 1) {
263                 if (hw_tf) {
264                         print_trapframe(hw_tf);
265                         backtrace_hwtf(hw_tf);
266                 } else {
267                         backtrace();
268                 }
269         } else {
270                 printk("\tRecursive kernel panic on core %d (depth %d)\n",
271                        core_id_early(), PERCPU_VAR(panic_depth));
272         }
273         printk("\n");
274
275         /* If we're here, we panicked and currently hold the print_lock.  We might
276          * have panicked recursively.  We must unlock unconditionally, since the
277          * initial panic (which grabbed the lock) will never run again. */
278         panic_printing = false;
279         print_unlock_force();
280         /* And we have to clear the depth, so that we lock again next time in.
281          * Otherwise, we'd be unlocking without locking (which is another panic). */
282         PERCPU_VAR(panic_depth) = 0;
283
284         /* Let's wait long enough for other printers to finish before entering the
285          * monitor. */
286         do {
287                 udelay(500000);
288                 cmb();
289         } while (panic_printing);
290
291         /* Yikes!  We're claiming to be not in IRQ/trap ctx and not holding any
292          * locks.  Obviously we could be wrong, and could easily deadlock.  We could
293          * be in an IRQ handler, an unhandled kernel fault, or just a 'normal' panic
294          * in a syscall - any of which can involve unrestore invariants. */
295         pcpui->__ctx_depth = 0;
296         pcpui->lock_depth = 0;
297         /* And keep this off, for good measure. */
298         pcpui->__lock_checking_enabled--;
299
300         monitor(NULL);
301
302         if (pcpui->cur_proc) {
303                 printk("panic killing proc %d\n", pcpui->cur_proc->pid);
304                 proc_destroy(pcpui->cur_proc);
305         }
306         if (pcpui->cur_kthread)
307                 kth_panic_sysc(pcpui->cur_kthread);
308         smp_idle();
309 }
310
311 void _warn(const char *file, int line, const char *fmt,...)
312 {
313         va_list ap;
314
315         print_lock();
316         va_start(ap, fmt);
317         printk("\nkernel warning at %s:%d, from core %d: ", file, line,
318                core_id_early());
319         vcprintf(fmt, ap);
320         printk("\n");
321         va_end(ap);
322         backtrace();
323         printk("\n");
324         print_unlock();
325 }
326
327 static void run_links(linker_func_t *linkstart, linker_func_t *linkend)
328 {
329         /* Unlike with devtab, our linker sections for the function pointers are
330          * 8 byte aligned (4 on 32 bit) (done by the linker/compiler), so we don't
331          * have to worry about that.  */
332         printd("linkstart %p, linkend %p\n", linkstart, linkend);
333         for (int i = 0; &linkstart[i] < linkend; i++) {
334                 printd("i %d, linkfunc %p\n", i, linkstart[i]);
335                 linkstart[i]();
336         }
337 }
338
339 static void run_linker_funcs(void)
340 {
341         run_links(__linkerfunc1start, __linkerfunc1end);
342         run_links(__linkerfunc2start, __linkerfunc2end);
343         run_links(__linkerfunc3start, __linkerfunc3end);
344         run_links(__linkerfunc4start, __linkerfunc4end);
345 }
346
347 /* You need to reference PROVIDE symbols somewhere, or they won't be included.
348  * Only really a problem for debugging. */
349 void debug_linker_tables(void)
350 {
351         extern struct dev __devtabstart[];
352         extern struct dev __devtabend[];
353         printk("devtab %p %p\nlink1 %p %p\nlink2 %p %p\nlink3 %p %p\nlink4 %p %p\n",
354                __devtabstart,
355                __devtabend,
356                    __linkerfunc1start,
357                    __linkerfunc1end,
358                    __linkerfunc2start,
359                    __linkerfunc2end,
360                    __linkerfunc3start,
361                    __linkerfunc3end,
362                    __linkerfunc4start,
363                    __linkerfunc4end);
364 }
365
366 #endif //Everything For Free