Added arch framework for handling page faults
[akaros.git] / kern / src / mm.c
1 /*
2  * Copyright (c) 2009 The Regents of the University of California
3  * Barret Rhoden <brho@cs.berkeley.edu>
4  * See LICENSE for details.
5  *
6  */
7
8 #include <frontend.h>
9 #include <ros/common.h>
10 #include <ros/mman.h>
11 #include <pmap.h>
12 #include <mm.h>
13 #include <process.h>
14 #include <stdio.h>
15 #include <syscall.h>
16
17 void *mmap(struct proc *p, uintptr_t addr, size_t len, int prot, int flags,
18            int fd, size_t offset)
19 {
20         printd("mmap(addr %x, len %x, prot %x, flags %x, fd %x, off %x)\n", addr,
21                len, prot, flags, fd, offset);
22         if (fd >= 0 && (flags & MAP_SHARED)) {
23                 printk("[kernel] mmap() for files requires !MAP_SHARED.\n");
24                 return (void*)-1;
25         }
26         if (fd >= 0 && (flags & MAP_ANON)) {
27                 printk("[kernel] mmap() with MAP_ANONYMOUS requires fd == -1.\n");
28                 return (void*)-1;
29         }
30
31         /* TODO: make this work, instead of a ghetto hack
32          * Find a valid range, make sure it doesn't run into the kernel
33          * make sure there's enough memory (not exceeding quotas)
34          * allocate and map the pages, update appropriate structures (vm_region)
35          * return appropriate pointer
36          * Right now, all we can do is give them the range they ask for.
37          * (or try to find one on sparc) */
38
39         if((flags & MAP_FIXED) && PGOFF(addr)) {
40                 printk("[kernel] mmap() page align your addr.\n");
41                 return (void*SAFE)TC(-1);
42         }
43
44         // TODO: grab the appropriate mm_lock
45         spin_lock_irqsave(&p->proc_lock);
46
47         int num_pages = ROUNDUP(len, PGSIZE) / PGSIZE;
48
49         if(!(flags & MAP_FIXED))
50         {
51                 addr = (uintptr_t)get_free_va_range(p->env_pgdir,addr,len);
52                 if(!addr)
53                         goto mmap_abort;
54
55                 assert(!PGOFF(addr));
56                 assert(addr + num_pages*PGSIZE <= USTACKBOT);
57         }
58
59         page_t *a_page;
60         for (int i = 0; i < num_pages; i++) {
61                 if (upage_alloc(p, &a_page, 1))
62                         goto mmap_abort;
63
64                 // This is dumb--should not read until faulted in.
65                 // This is just to get it correct at first
66                 if(!(flags & MAP_ANON))
67                 {
68                         if(read_page(p,fd,page2pa(a_page),offset+i) < 0)
69                                 goto mmap_abort;
70
71                         // zero-fill end of last page
72                         if(len % PGSIZE && i == num_pages-1)
73                                 memset(page2kva(a_page)+len%PGSIZE,0,PGSIZE-len%PGSIZE);
74                 }
75
76                 // TODO: TLB shootdown if replacing an old mapping
77                 // TODO: handle all PROT flags
78                 if (page_insert(p->env_pgdir, a_page, (void*SNT)(addr + i*PGSIZE),
79                                 (prot & PROT_WRITE) ? PTE_USER_RW : PTE_USER_RO)) {
80                         page_free(a_page);
81                         goto mmap_abort;
82                 }
83         }
84
85         // TODO: release the appropriate mm_lock
86         spin_unlock_irqsave(&p->proc_lock);
87         return (void*SAFE)TC(addr);
88
89         // TODO: if there's a failure, we should go back through the addr+len range
90         // and dealloc everything.  or at least define what we want to do if we run
91         // out of memory.
92         mmap_abort:
93                 // TODO: release the appropriate mm_lock
94                 spin_unlock_irqsave(&p->proc_lock);
95                 // not a kernel problem, like if they ask to mmap a mapped location.
96                 printk("[kernel] mmap() aborted!\n");
97                 // mmap's semantics.  we need a better error propagation system
98                 return (void*SAFE)TC(-1); // this is also ridiculous
99 }
100
101 int mprotect(struct proc* p, void* addr, size_t len, int prot)
102 {
103         printd("mprotect(addr %x, len %x, prot %x)\n",addr,len,prot);
104         if((uintptr_t)addr % PGSIZE || (len == 0 && (prot & PROT_UNMAP)))
105         {
106                 set_errno(current_tf,EINVAL);
107                 return -1;
108         }
109
110         // overflow of end is handled in the for loop's parameters
111         char* end = ROUNDUP((char*)addr+len,PGSIZE);
112         if(addr >= (void*)UTOP || end > (char*)UTOP)
113         {
114                 set_errno(current_tf, (prot & PROT_UNMAP) ? EINVAL : ENOMEM);
115                 return -1;
116         }
117
118         spin_lock_irqsave(&p->proc_lock);
119
120         int newperm = (prot & PROT_WRITE) ? PTE_USER_RW :
121                       (prot & (PROT_READ|PROT_EXEC)) ? PTE_USER_RO : 0;
122
123         for(char* a = (char*)addr; a < end; a += PGSIZE)
124         {
125                 pte_t* pte = pgdir_walk(p->env_pgdir,a,0);
126                 if(pte && *pte & PTE_P)
127                 {
128                         // TODO: do munmap() in munmap(), instead of mprotect()
129                         if(prot & PROT_UNMAP)
130                         {
131                                 page_t* page = ppn2page(PTE2PPN(*pte));
132                                 *pte = 0;
133                                 page_decref(page);
134                         }
135                         else
136                                 *pte = (*pte & ~PTE_PERM) | newperm;
137                 }
138                 else
139                 {
140                         set_errno(current_tf,ENOMEM);
141                         return -1;
142                 }
143         }
144
145         spin_unlock_irqsave(&p->proc_lock);
146
147         //TODO: TLB shootdown - needs to be process wide
148         tlbflush();
149         return 0;
150 }
151
152 int munmap(struct proc* p, void* addr, size_t len)
153 {
154         return mprotect(p, addr, len, PROT_UNMAP);
155 }
156
157 int handle_page_fault(struct proc* p, uintptr_t va, int prot)
158 {
159         int ret = -1;
160         va = ROUNDDOWN(va,PGSIZE);
161
162         spin_lock_irqsave(&p->proc_lock);
163
164
165 out:
166         spin_unlock_irqsave(&p->proc_lock);
167         return ret;
168 }
169