Process management work, yield syscall
[akaros.git] / kern / src / trap.c
1 #ifdef __DEPUTY__
2 #pragma noasync
3 #endif
4
5 #include <arch/mmu.h>
6 #include <arch/x86.h>
7 #include <arch/console.h>
8 #include <arch/apic.h>
9 #include <arch/smp.h>
10 #include <assert.h>
11 #include <pmap.h>
12 #include <trap.h>
13 #include <monitor.h>
14 #include <env.h>
15
16 #include <syscall.h>
17
18 taskstate_t ts;
19
20 /* Interrupt descriptor table.  (Must be built at run time because
21  * shifted function addresses can't be represented in relocation records.)
22  */
23 // Aligned on an 8 byte boundary (SDM V3A 5-13)
24 gatedesc_t __attribute__ ((aligned (8))) idt[256] = { { 0 } };
25 pseudodesc_t idt_pd = {
26         sizeof(idt) - 1, (uint32_t) idt
27 };
28
29 /* global handler table, used by core0 (for now).  allows the registration
30  * of functions to be called when servicing an interrupt.  other cores
31  * can set up their own later.
32  */
33 handler_t interrupt_handlers[256];
34
35 static const char *NTS (IN_HANDLER trapname)(int trapno)
36 {
37     // zra: excnames is NORACE because Ivy doesn't trust const
38         static const char *NT const (NORACE excnames)[] = {
39                 "Divide error",
40                 "Debug",
41                 "Non-Maskable Interrupt",
42                 "Breakpoint",
43                 "Overflow",
44                 "BOUND Range Exceeded",
45                 "Invalid Opcode",
46                 "Device Not Available",
47                 "Double Fault",
48                 "Coprocessor Segment Overrun",
49                 "Invalid TSS",
50                 "Segment Not Present",
51                 "Stack Fault",
52                 "General Protection",
53                 "Page Fault",
54                 "(unknown trap)",
55                 "x87 FPU Floating-Point Error",
56                 "Alignment Check",
57                 "Machine-Check",
58                 "SIMD Floating-Point Exception"
59         };
60
61         if (trapno < sizeof(excnames)/sizeof(excnames[0]))
62                 return excnames[trapno];
63         if (trapno == T_SYSCALL)
64                 return "System call";
65         return "(unknown trap)";
66 }
67
68
69 void
70 idt_init(void)
71 {
72         extern segdesc_t gdt[];
73
74         // This table is made in trapentry.S by each macro in that file.
75         // It is layed out such that the ith entry is the ith's traphandler's
76         // (uint32_t) trap addr, then (uint32_t) trap number
77         struct trapinfo { uint32_t trapaddr; uint32_t trapnumber; };
78         extern struct trapinfo (BND(__this,trap_tbl_end) trap_tbl)[];
79         extern struct trapinfo (SNT trap_tbl_end)[];
80         int i, trap_tbl_size = trap_tbl_end - trap_tbl;
81         extern void ISR_default(void);
82
83         // set all to default, to catch everything
84         for(i = 0; i < 256; i++)
85                 SETGATE(idt[i], 0, GD_KT, &ISR_default, 0);
86
87         // set all entries that have real trap handlers
88         // we need to stop short of the last one, since the last is the default
89         // handler with a fake interrupt number (500) that is out of bounds of
90         // the idt[]
91         // if we set these to trap gates, be sure to handle the IRQs separately
92         // and we might need to break our pretty tables
93         for(i = 0; i < trap_tbl_size - 1; i++)
94                 SETGATE(idt[trap_tbl[i].trapnumber], 0, GD_KT, trap_tbl[i].trapaddr, 0);
95
96         // turn on syscall handling and other user-accessible ints
97         // DPL 3 means this can be triggered by the int instruction
98         idt[T_SYSCALL].gd_dpl = 3;
99         idt[T_BRKPT].gd_dpl = 3;
100
101         // Setup a TSS so that we get the right stack
102         // when we trap to the kernel.
103         ts.ts_esp0 = KSTACKTOP;
104         ts.ts_ss0 = GD_KD;
105
106         // Initialize the TSS field of the gdt.
107         gdt[GD_TSS >> 3] = SEG16(STS_T32A, (uint32_t) (&ts),
108                                         sizeof(taskstate_t), 0);
109         gdt[GD_TSS >> 3].sd_s = 0;
110
111         // Load the TSS
112         ltr(GD_TSS);
113
114         // Load the IDT
115         asm volatile("lidt idt_pd");
116
117         // This will go away when we start using the IOAPIC properly
118         pic_remap();
119         // set LINT0 to receive ExtINTs (KVM's default).  At reset they are 0x1000.
120         write_mmreg32(LAPIC_LVT_LINT0, 0x700);
121         // mask it to shut it up for now
122         mask_lapic_lvt(LAPIC_LVT_LINT0);
123         // and turn it on
124         lapic_enable();
125 }
126
127 void
128 (IN_HANDLER print_trapframe)(trapframe_t *tf)
129 {
130         cprintf("TRAP frame at %p on core %d\n", tf, lapic_get_id());
131         print_regs(&tf->tf_regs);
132         cprintf("  es   0x----%04x\n", tf->tf_es);
133         cprintf("  ds   0x----%04x\n", tf->tf_ds);
134         cprintf("  trap 0x%08x %s\n", tf->tf_trapno, trapname(tf->tf_trapno));
135         cprintf("  err  0x%08x\n", tf->tf_err);
136         cprintf("  eip  0x%08x\n", tf->tf_eip);
137         cprintf("  cs   0x----%04x\n", tf->tf_cs);
138         cprintf("  flag 0x%08x\n", tf->tf_eflags);
139         cprintf("  esp  0x%08x\n", tf->tf_esp);
140         cprintf("  ss   0x----%04x\n", tf->tf_ss);
141 }
142
143 void
144 (IN_HANDLER print_regs)(push_regs_t *regs)
145 {
146         cprintf("  edi  0x%08x\n", regs->reg_edi);
147         cprintf("  esi  0x%08x\n", regs->reg_esi);
148         cprintf("  ebp  0x%08x\n", regs->reg_ebp);
149         cprintf("  oesp 0x%08x\n", regs->reg_oesp);
150         cprintf("  ebx  0x%08x\n", regs->reg_ebx);
151         cprintf("  edx  0x%08x\n", regs->reg_edx);
152         cprintf("  ecx  0x%08x\n", regs->reg_ecx);
153         cprintf("  eax  0x%08x\n", regs->reg_eax);
154 }
155
156 static void
157 (IN_HANDLER trap_dispatch)(trapframe_t *tf)
158 {
159         env_t* curenv = curenvs[lapic_get_id()];
160
161         // Handle processor exceptions.
162         switch(tf->tf_trapno) {
163                 case T_BRKPT:
164                         while (1)
165                                 monitor(tf);
166                         // never get to this
167                         assert(0);
168                 case T_PGFLT:
169                         page_fault_handler(tf);
170                         break;
171                 case T_SYSCALL:
172                         // check for userspace, for now
173                         assert(tf->tf_cs != GD_KT);
174                         tf->tf_regs.reg_eax =
175                                 syscall(curenv, tf->tf_regs.reg_eax, tf->tf_regs.reg_edx,
176                                         tf->tf_regs.reg_ecx, tf->tf_regs.reg_ebx,
177                                         tf->tf_regs.reg_edi, tf->tf_regs.reg_esi);
178                         env_run(curenv);
179                         break;
180                 default:
181                         // Unexpected trap: The user process or the kernel has a bug.
182                         print_trapframe(tf);
183                         if (tf->tf_cs == GD_KT)
184                                 panic("Damn Damn!  Unhandled trap in the kernel!");
185                         else {
186                                 warn("Unexpected trap from userspace");
187                                 env_destroy(curenv);
188                                 return;
189                         }
190         }
191         return;
192 }
193
194 void
195 (IN_HANDLER trap)(trapframe_t *tf)
196 {
197         //cprintf("Incoming TRAP frame at %p\n", tf);
198
199         env_t* curenv = curenvs[lapic_get_id()];
200         if ((tf->tf_cs & ~3) != GD_UT && (tf->tf_cs & ~3) != GD_KT) {
201                 print_trapframe(tf);
202                 panic("Trapframe with invalid CS!");
203         }
204
205         if ((tf->tf_cs & 3) == 3) {
206                 // Trapped from user mode.
207                 // TODO: this will change when an env has more than one context
208                 // Copy trap frame (which is currently on the stack)
209                 // into 'curenv->env_tf', so that running the environment
210                 // will restart at the trap point.
211                 assert(curenv);
212                 curenv->env_tf = *tf;
213                 // The trapframe on the stack should be ignored from here on.
214                 tf = &curenv->env_tf;
215         }
216
217         // Dispatch based on what type of trap occurred
218         trap_dispatch(tf);
219
220         // should this be if == 3?  Sort out later when we handle traps.
221         // so far we never get here
222         assert(0);
223         // Return to the current environment, which should be runnable.
224         assert(curenv && curenv->env_status == ENV_RUNNABLE);
225         env_run(curenv);
226 }
227
228 void
229 (IN_HANDLER irq_handler)(trapframe_t *tf)
230 {
231         //if (lapic_get_id())
232         //      cprintf("Incoming IRQ, ISR: %d on core %d\n", tf->tf_trapno, lapic_get_id());
233         // merge this with alltraps?  other than the EOI... or do the same in all traps
234
235         extern handler_wrapper_t handler_wrappers[NUM_HANDLER_WRAPPERS];
236
237         // determine the interrupt handler table to use.  for now, pick the global
238         handler_t* handler_tbl = interrupt_handlers;
239
240         if (handler_tbl[tf->tf_trapno].isr != 0)
241                 handler_tbl[tf->tf_trapno].isr(tf, handler_tbl[tf->tf_trapno].data);
242         // if we're a general purpose IPI function call, down the cpu_list
243         if ((0xf0 <= tf->tf_trapno) && (tf->tf_trapno < 0xf0 +NUM_HANDLER_WRAPPERS))
244                 down_checklist(handler_wrappers[tf->tf_trapno & 0x0f].cpu_list);
245
246         // Send EOI.  might want to do this in assembly, and possibly earlier
247         // This is set up to work with an old PIC for now
248         // Convention is that all IRQs between 32 and 47 are for the PIC.
249         // All others are LAPIC (timer, IPIs, perf, non-ExtINT LINTS, etc)
250         // For now, only 235-255 are available
251         assert(tf->tf_trapno >= 32); // slows us down, but we should never have this
252         if (tf->tf_trapno < 48)
253                 pic_send_eoi(tf->tf_trapno - PIC1_OFFSET);
254         else
255                 lapic_send_eoi();
256 }
257
258 void
259 register_interrupt_handler(handler_t table[], uint8_t int_num, isr_t handler,
260                            void* data)
261 {
262         table[int_num].isr = handler;
263         table[int_num].data = data;
264 }
265
266 void
267 page_fault_handler(trapframe_t *tf)
268 {
269         uint32_t fault_va;
270
271         // Read processor's CR2 register to find the faulting address
272         fault_va = rcr2();
273
274         // Handle kernel-mode page faults.
275
276         // TODO - one day, we'll want to handle this.
277         if ((tf->tf_cs & 3) == 0) {
278                 print_trapframe(tf);
279                 panic("Page Fault in the Kernel at 0x%08x!", fault_va);
280         }
281
282         // We've already handled kernel-mode exceptions, so if we get here,
283         // the page fault happened in user mode.
284
285         // Call the environment's page fault upcall, if one exists.  Set up a
286         // page fault stack frame on the user exception stack (below
287         // UXSTACKTOP), then branch to curenv->env_pgfault_upcall.
288         //
289         // The page fault upcall might cause another page fault, in which case
290         // we branch to the page fault upcall recursively, pushing another
291         // page fault stack frame on top of the user exception stack.
292         //
293         // The trap handler needs one word of scratch space at the top of the
294         // trap-time stack in order to return.  In the non-recursive case, we
295         // don't have to worry about this because the top of the regular user
296         // stack is free.  In the recursive case, this means we have to leave
297         // an extra word between the current top of the exception stack and
298         // the new stack frame because the exception stack _is_ the trap-time
299         // stack.
300         //
301         // If there's no page fault upcall, the environment didn't allocate a
302         // page for its exception stack, or the exception stack overflows,
303         // then destroy the environment that caused the fault.
304         //
305         // Hints:
306         //   user_mem_assert() and env_run() are useful here.
307         //   To change what the user environment runs, modify 'curenv->env_tf'
308         //   (the 'tf' variable points at 'curenv->env_tf').
309
310         // LAB 4: Your code here.
311
312         // Destroy the environment that caused the fault.
313         env_t* curenv = curenvs[lapic_get_id()];
314         cprintf("[%08x] user fault va %08x ip %08x from core %d\n",
315                 curenv->env_id, fault_va, tf->tf_eip, lapic_get_id());
316         print_trapframe(tf);
317         env_destroy(curenv);
318 }
319
320 void sysenter_init(void)
321 {
322         write_msr(MSR_IA32_SYSENTER_CS, GD_KT);
323         write_msr(MSR_IA32_SYSENTER_ESP, ts.ts_esp0);
324         write_msr(MSR_IA32_SYSENTER_EIP, (uint32_t) &sysenter_handler);
325 }