Fixes sysenter stack pointer bug
[akaros.git] / kern / arch / i386 / env.c
1 /* See COPYRIGHT for copyright information. */
2 #ifdef __SHARC__
3 #pragma nosharc
4 #endif
5
6 #include <arch/trap.h>
7 #include <env.h>
8 #include <assert.h>
9 #include <pmap.h>
10
11 //
12 // This exits the kernel and starts executing some environment's code.
13 // This function does not return.
14 // Uses 'iret' or 'sysexit' depending on CS.
15 //
16 void env_pop_tf(trapframe_t *tf)
17 {
18         /* In case they are enabled elsewhere.  We can't take an interrupt in these
19          * routines, due to how they play with the kernel stack pointer. */
20         disable_irq();
21         /*
22          * If the process entered the kernel via sysenter, we need to leave via
23          * sysexit.  sysenter trapframes have 0 for a CS, which is pushed in
24          * sysenter_handler.
25          */
26         if(tf->tf_cs) {
27                 /*
28                  * Restores the register values in the Trapframe with the 'iret'
29                  * instruction.  This exits the kernel and starts executing some
30                  * environment's code.  This function does not return.
31                  */
32                 asm volatile ("movl %0,%%esp;           "
33                               "popal;                   "
34                               "popl %%es;               "
35                               "popl %%ds;               "
36                               "addl $0x8,%%esp;         "
37                               "iret                     "
38                               : : "g" (tf) : "memory");
39                 panic("iret failed");  /* mostly to placate the compiler */
40         } else {
41                 /* Return path of sysexit.  See sysenter_handler's asm for details.
42                  * One difference is that this tf could be somewhere other than a stack
43                  * (like in a struct proc).  We need to make sure esp is valid once
44                  * interrupts are turned on (which would happen on popfl normally), so
45                  * we need to save and restore a decent esp (the current one).  We need
46                  * a place to save it that is accessible after we change the stack
47                  * pointer to the tf *and* that is specific to this core/instance of
48                  * sysexit.  The simplest and nicest is to use the tf_esp, which we
49                  * can just pop.  Incidentally, the value in oesp would work too.
50                  * To prevent popfl from turning interrupts on, we hack the tf's eflags
51                  * so that we have a chance to change esp to a good value before
52                  * interrupts are enabled.  The other option would be to throw away the
53                  * eflags, but that's less desirable. */
54                 tf->tf_eflags &= !FL_IF;
55                 tf->tf_esp = read_esp();
56                 asm volatile ("movl %0,%%esp;           "
57                               "popal;                   "
58                               "popl %%es;               "
59                               "popl %%ds;               "
60                               "addl $0x10,%%esp;        "
61                               "popfl;                   "
62                               "movl %%ebp,%%ecx;        "
63                               "movl %%esi,%%edx;        "
64                               "popl %%esp;              "
65                               "sti;                     "
66                               "sysexit                  "
67                               : : "g" (tf) : "memory");
68                 panic("sysexit failed");  /* mostly to placate your mom */
69         }
70 }
71
72 // Flush all mapped pages in the user portion of the address space
73 void
74 env_user_mem_free(env_t* e)
75 {
76         pte_t *pt;
77         uint32_t pdeno, pteno;
78         physaddr_t pa;
79
80         static_assert(UTOP % PTSIZE == 0);
81         for (pdeno = 0; pdeno < PDX(UTOP); pdeno++) {
82
83                 // only look at mapped page tables
84                 if (!(e->env_pgdir[pdeno] & PTE_P))
85                         continue;
86
87                 // find the pa and va of the page table
88                 pa = PTE_ADDR(e->env_pgdir[pdeno]);
89                 pt = (pte_t*COUNT(NPTENTRIES)) KADDR(pa);
90
91                 // unmap all PTEs in this page table 
92                 for (pteno = 0; pteno <= PTX(~0); pteno++) {
93                         if (pt[pteno] & PTE_P)
94                                 page_remove(e->env_pgdir, PGADDR(pdeno, pteno, 0));
95                 }
96
97                 // free the page table itself
98                 e->env_pgdir[pdeno] = 0;
99                 page_decref(pa2page(pa));
100         }
101 }