15f85542c4f279ab77c48c25b8464a7b263c2085
[akaros.git] / kern / arch / i686 / env.c
1 /* See COPYRIGHT for copyright information. */
2 #ifdef __SHARC__
3 #pragma nosharc
4 #endif
5
6 #include <arch/trap.h>
7 #include <env.h>
8 #include <assert.h>
9 #include <pmap.h>
10
11 //
12 // This exits the kernel and starts executing some environment's code.
13 // This function does not return.
14 // Uses 'iret' or 'sysexit' depending on CS.
15 //
16 void env_pop_tf(trapframe_t *tf)
17 {
18         /* Load the LDT for this process.  Slightly ghetto doing it here. */
19         segdesc_t *my_gdt = per_cpu_info[core_id()].gdt;
20         /* copy-in and check the LDT location.  the segmentation hardware write the
21          * accessed bit, so we want the memory to be in the user-writeable area. */
22         segdesc_t *ldt = current->procdata->ldt;
23         ldt = (segdesc_t*)MIN((uintptr_t)ldt, UTOP - LDT_SIZE);
24         segdesc_t ldt_temp = SEG_SYS(STS_LDT, (uint32_t)ldt, LDT_SIZE, 3);
25         my_gdt[GD_LDT >> 3] = ldt_temp;
26         asm volatile("lldt %%ax" :: "a"(GD_LDT));
27
28         /* In case they are enabled elsewhere.  We can't take an interrupt in these
29          * routines, due to how they play with the kernel stack pointer. */
30         disable_irq();
31         /*
32          * If the process entered the kernel via sysenter, we need to leave via
33          * sysexit.  sysenter trapframes have 0 for a CS, which is pushed in
34          * sysenter_handler.
35          */
36         if(tf->tf_cs) {
37                 /*
38                  * Restores the register values in the Trapframe with the 'iret'
39                  * instruction.  This exits the kernel and starts executing some
40                  * environment's code.  This function does not return.
41                  */
42                 asm volatile ("movl %0,%%esp;           "
43                               "popal;                   "
44                               "popl %%gs;               "
45                               "popl %%fs;               "
46                               "popl %%es;               "
47                               "popl %%ds;               "
48                               "addl $0x8,%%esp;         "
49                               "iret                     "
50                               : : "g" (tf) : "memory");
51                 panic("iret failed");  /* mostly to placate the compiler */
52         } else {
53                 /* Return path of sysexit.  See sysenter_handler's asm for details.
54                  * One difference is that this tf could be somewhere other than a stack
55                  * (like in a struct proc).  We need to make sure esp is valid once
56                  * interrupts are turned on (which would happen on popfl normally), so
57                  * we need to save and restore a decent esp (the current one).  We need
58                  * a place to save it that is accessible after we change the stack
59                  * pointer to the tf *and* that is specific to this core/instance of
60                  * sysexit.  The simplest and nicest is to use the tf_esp, which we
61                  * can just pop.  Incidentally, the value in oesp would work too.
62                  * To prevent popfl from turning interrupts on, we hack the tf's eflags
63                  * so that we have a chance to change esp to a good value before
64                  * interrupts are enabled.  The other option would be to throw away the
65                  * eflags, but that's less desirable. */
66                 tf->tf_eflags &= !FL_IF;
67                 tf->tf_esp = read_esp();
68                 asm volatile ("movl %0,%%esp;           "
69                               "popal;                   "
70                               "popl %%gs;               "
71                               "popl %%fs;               "
72                               "popl %%es;               "
73                               "popl %%ds;               "
74                               "addl $0x10,%%esp;        "
75                               "popfl;                   "
76                               "movl %%ebp,%%ecx;        "
77                               "popl %%esp;              "
78                               "sti;                     "
79                               "sysexit                  "
80                               : : "g" (tf) : "memory");
81                 panic("sysexit failed");  /* mostly to placate your mom */
82         }
83 }
84
85 /* Walks len bytes from start, executing 'callback' on every PTE, passing it a
86  * specific VA and whatever arg is passed in.  Note, this cannot handle jumbo
87  * pages. */
88 int env_user_mem_walk(env_t* e, void* start, size_t len,
89                       mem_walk_callback_t callback, void* arg)
90 {
91         pte_t *pt;
92         uint32_t pdeno, pteno;
93         physaddr_t pa;
94
95         assert((uintptr_t)start % PGSIZE == 0 && len % PGSIZE == 0);
96         void* end = (char*)start+len;
97         uint32_t pdeno_start = PDX(start);
98         uint32_t pdeno_end = PDX(ROUNDUP(end,PTSIZE));
99         /* concerned about overflow.  this should catch it for now, given the above
100          * assert. */
101         assert((len == 0) || (pdeno_start < pdeno_end));
102
103         for (pdeno = pdeno_start; pdeno < pdeno_end; pdeno++) {
104                 if (!(e->env_pgdir[pdeno] & PTE_P))
105                         continue;
106                 /* find the pa and a pointer to the page table */
107                 pa = PTE_ADDR(e->env_pgdir[pdeno]);
108                 pt = (pte_t*COUNT(NPTENTRIES)) KADDR(pa);
109                 /* figure out where we start and end within the page table */
110                 uint32_t pteno_start = (pdeno == pdeno_start ? PTX(start) : 0);
111                 uint32_t pteno_end = (pdeno == pdeno_end - 1 && PTX(end) != 0 ?
112                                       PTX(end) : NPTENTRIES );
113                 int ret;
114                 for (pteno = pteno_start; pteno < pteno_end; pteno++) {
115                         if (!PAGE_UNMAPPED(pt[pteno]))
116                                 if((ret = callback(e, &pt[pteno], PGADDR(pdeno, pteno, 0), arg)))
117                                         return ret;
118                 }
119         }
120         return 0;
121 }
122
123 /* Frees (decrefs) all pages of the process's page table, including the page
124  * directory.  Does not free the memory that is actually mapped. */
125 void env_pagetable_free(env_t* e)
126 {
127         static_assert(UVPT % PTSIZE == 0);
128         assert(e->env_cr3 != rcr3());
129         for(uint32_t pdeno = 0; pdeno < PDX(UVPT); pdeno++)
130         {
131                 // only look at mapped page tables
132                 if (!(e->env_pgdir[pdeno] & PTE_P))
133                         continue;
134
135                 // find the pa and va of the page table
136                 physaddr_t pa = PTE_ADDR(e->env_pgdir[pdeno]);
137
138                 // free the page table itself
139                 e->env_pgdir[pdeno] = 0;
140                 page_decref(pa2page(pa));
141         }
142
143         // free the page directory
144         physaddr_t pa = e->env_cr3;
145         e->env_cr3 = 0;
146         page_decref(pa2page(pa));
147         tlbflush();
148 }
149