Userspace no longer includes the kernel's arch/*
[akaros.git] / kern / arch / i686 / env.c
1 /* See COPYRIGHT for copyright information. */
2 #ifdef __SHARC__
3 #pragma nosharc
4 #endif
5
6 #include <arch/trap.h>
7 #include <env.h>
8 #include <assert.h>
9 #include <pmap.h>
10
11 //
12 // This exits the kernel and starts executing some environment's code.
13 // This function does not return.
14 // Uses 'iret' or 'sysexit' depending on CS.
15 //
16 void env_pop_tf(trapframe_t *tf)
17 {
18         /* Bug with this whole idea (TODO: (TLSV))*/
19         /* Load the LDT for this process.  Slightly ghetto doing it here. */
20         segdesc_t *my_gdt = per_cpu_info[core_id()].gdt;
21         /* copy-in and check the LDT location.  the segmentation hardware write the
22          * accessed bit, so we want the memory to be in the user-writeable area. */
23         segdesc_t *ldt = current->procdata->ldt;
24         ldt = (segdesc_t*)MIN((uintptr_t)ldt, UTOP - LDT_SIZE);
25         segdesc_t ldt_temp = SEG_SYS(STS_LDT, (uint32_t)ldt, LDT_SIZE, 3);
26         my_gdt[GD_LDT >> 3] = ldt_temp;
27         asm volatile("lldt %%ax" :: "a"(GD_LDT));
28
29         /* In case they are enabled elsewhere.  We can't take an interrupt in these
30          * routines, due to how they play with the kernel stack pointer. */
31         disable_irq();
32         /*
33          * If the process entered the kernel via sysenter, we need to leave via
34          * sysexit.  sysenter trapframes have 0 for a CS, which is pushed in
35          * sysenter_handler.
36          */
37         if(tf->tf_cs) {
38                 /*
39                  * Restores the register values in the Trapframe with the 'iret'
40                  * instruction.  This exits the kernel and starts executing some
41                  * environment's code.  This function does not return.
42                  */
43                 asm volatile ("movl %0,%%esp;           "
44                               "popal;                   "
45                               "popl %%gs;               "
46                               "popl %%fs;               "
47                               "popl %%es;               "
48                               "popl %%ds;               "
49                               "addl $0x8,%%esp;         "
50                               "iret                     "
51                               : : "g" (tf) : "memory");
52                 panic("iret failed");  /* mostly to placate the compiler */
53         } else {
54                 /* Return path of sysexit.  See sysenter_handler's asm for details.
55                  * One difference is that this tf could be somewhere other than a stack
56                  * (like in a struct proc).  We need to make sure esp is valid once
57                  * interrupts are turned on (which would happen on popfl normally), so
58                  * we need to save and restore a decent esp (the current one).  We need
59                  * a place to save it that is accessible after we change the stack
60                  * pointer to the tf *and* that is specific to this core/instance of
61                  * sysexit.  The simplest and nicest is to use the tf_esp, which we
62                  * can just pop.  Incidentally, the value in oesp would work too.
63                  * To prevent popfl from turning interrupts on, we hack the tf's eflags
64                  * so that we have a chance to change esp to a good value before
65                  * interrupts are enabled.  The other option would be to throw away the
66                  * eflags, but that's less desirable. */
67                 tf->tf_eflags &= !FL_IF;
68                 tf->tf_esp = read_esp();
69                 asm volatile ("movl %0,%%esp;           "
70                               "popal;                   "
71                               "popl %%gs;               "
72                               "popl %%fs;               "
73                               "popl %%es;               "
74                               "popl %%ds;               "
75                               "addl $0x10,%%esp;        "
76                               "popfl;                   "
77                               "movl %%ebp,%%ecx;        "
78                               "popl %%esp;              "
79                               "sti;                     "
80                               "sysexit                  "
81                               : : "g" (tf) : "memory");
82                 panic("sysexit failed");  /* mostly to placate your mom */
83         }
84 }
85
86 /* Walks len bytes from start, executing 'callback' on every PTE, passing it a
87  * specific VA and whatever arg is passed in.  Note, this cannot handle jumbo
88  * pages. */
89 int env_user_mem_walk(env_t* e, void* start, size_t len,
90                       mem_walk_callback_t callback, void* arg)
91 {
92         pte_t *pt;
93         uint32_t pdeno, pteno;
94         physaddr_t pa;
95
96         assert((uintptr_t)start % PGSIZE == 0 && len % PGSIZE == 0);
97         void* end = (char*)start+len;
98         uint32_t pdeno_start = PDX(start);
99         uint32_t pdeno_end = PDX(ROUNDUP(end,PTSIZE));
100         /* concerned about overflow.  this should catch it for now, given the above
101          * assert. */
102         assert((len == 0) || (pdeno_start < pdeno_end));
103
104         for (pdeno = pdeno_start; pdeno < pdeno_end; pdeno++) {
105                 if (!(e->env_pgdir[pdeno] & PTE_P))
106                         continue;
107                 /* find the pa and a pointer to the page table */
108                 pa = PTE_ADDR(e->env_pgdir[pdeno]);
109                 pt = (pte_t*COUNT(NPTENTRIES)) KADDR(pa);
110                 /* figure out where we start and end within the page table */
111                 uint32_t pteno_start = (pdeno == pdeno_start ? PTX(start) : 0);
112                 uint32_t pteno_end = (pdeno == pdeno_end - 1 && PTX(end) != 0 ?
113                                       PTX(end) : NPTENTRIES );
114                 int ret;
115                 for (pteno = pteno_start; pteno < pteno_end; pteno++) {
116                         if (!PAGE_UNMAPPED(pt[pteno]))
117                                 if((ret = callback(e, &pt[pteno], PGADDR(pdeno, pteno, 0), arg)))
118                                         return ret;
119                 }
120         }
121         return 0;
122 }
123
124 /* Frees (decrefs) all pages of the process's page table, including the page
125  * directory.  Does not free the memory that is actually mapped. */
126 void env_pagetable_free(env_t* e)
127 {
128         static_assert(UVPT % PTSIZE == 0);
129         assert(e->env_cr3 != rcr3());
130         for(uint32_t pdeno = 0; pdeno < PDX(UVPT); pdeno++)
131         {
132                 // only look at mapped page tables
133                 if (!(e->env_pgdir[pdeno] & PTE_P))
134                         continue;
135
136                 // find the pa and va of the page table
137                 physaddr_t pa = PTE_ADDR(e->env_pgdir[pdeno]);
138
139                 // free the page table itself
140                 e->env_pgdir[pdeno] = 0;
141                 page_decref(pa2page(pa));
142         }
143
144         // free the page directory
145         physaddr_t pa = e->env_cr3;
146         e->env_cr3 = 0;
147         page_decref(pa2page(pa));
148         tlbflush();
149 }
150