First run at integrating LWIP into the tree (again)
[akaros.git] / kern / src / syscall.c
1 /* See COPYRIGHT for copyright information. */
2
3 #ifdef __SHARC__
4 #pragma nosharc
5 #endif
6
7 #include <ros/common.h>
8 #include <arch/types.h>
9 #include <arch/arch.h>
10 #include <arch/mmu.h>
11 #include <arch/console.h>
12 #include <ros/timer.h>
13 #include <ros/error.h>
14
15 #include <string.h>
16 #include <assert.h>
17 #include <process.h>
18 #include <schedule.h>
19 #include <pmap.h>
20 #include <mm.h>
21 #include <trap.h>
22 #include <syscall.h>
23 #include <kmalloc.h>
24 #include <stdio.h>
25 #include <resource.h>
26 #include <colored_caches.h>
27 #include <arch/bitmask.h>
28 #include <kfs.h> // eventually replace this with vfs.h
29
30 #ifdef __sparc_v8__
31 #include <arch/frontend.h>
32 #endif 
33
34 #ifdef __NETWORK__
35 #include <arch/nic_common.h>
36 extern char *CT(PACKET_HEADER_SIZE + len) (*packet_wrap)(const char *CT(len) data, size_t len);
37 extern int (*send_frame)(const char *CT(len) data, size_t len);
38 #endif
39
40 /************** Utility Syscalls **************/
41
42 static int sys_null(void)
43 {
44         return 0;
45 }
46
47 // Writes 'val' to 'num_writes' entries of the well-known array in the kernel
48 // address space.  It's just #defined to be some random 4MB chunk (which ought
49 // to be boot_alloced or something).  Meant to grab exclusive access to cache
50 // lines, to simulate doing something useful.
51 static int sys_cache_buster(struct proc *p, uint32_t num_writes,
52                              uint32_t num_pages, uint32_t flags)
53 { TRUSTEDBLOCK /* zra: this is not really part of the kernel */
54         #define BUSTER_ADDR             0xd0000000  // around 512 MB deep
55         #define MAX_WRITES              1048576*8
56         #define MAX_PAGES               32
57         #define INSERT_ADDR     (UINFO + 2*PGSIZE) // should be free for these tests
58         uint32_t* buster = (uint32_t*)BUSTER_ADDR;
59         static spinlock_t buster_lock = SPINLOCK_INITIALIZER;
60         uint64_t ticks = -1;
61         page_t* a_page[MAX_PAGES];
62
63         /* Strided Accesses or Not (adjust to step by cachelines) */
64         uint32_t stride = 1;
65         if (flags & BUSTER_STRIDED) {
66                 stride = 16;
67                 num_writes *= 16;
68         }
69
70         /* Shared Accesses or Not (adjust to use per-core regions)
71          * Careful, since this gives 8MB to each core, starting around 512MB.
72          * Also, doesn't separate memory for core 0 if it's an async call.
73          */
74         if (!(flags & BUSTER_SHARED))
75                 buster = (uint32_t*)(BUSTER_ADDR + core_id() * 0x00800000);
76
77         /* Start the timer, if we're asked to print this info*/
78         if (flags & BUSTER_PRINT_TICKS)
79                 ticks = start_timing();
80
81         /* Allocate num_pages (up to MAX_PAGES), to simulate doing some more
82          * realistic work.  Note we don't write to these pages, even if we pick
83          * unshared.  Mostly due to the inconvenience of having to match up the
84          * number of pages with the number of writes.  And it's unnecessary.
85          */
86         if (num_pages) {
87                 spin_lock(&buster_lock);
88                 for (int i = 0; i < MIN(num_pages, MAX_PAGES); i++) {
89                         upage_alloc(p, &a_page[i],1);
90                         page_insert(p->env_pgdir, a_page[i], (void*)INSERT_ADDR + PGSIZE*i,
91                                     PTE_USER_RW);
92                 }
93                 spin_unlock(&buster_lock);
94         }
95
96         if (flags & BUSTER_LOCKED)
97                 spin_lock(&buster_lock);
98         for (int i = 0; i < MIN(num_writes, MAX_WRITES); i=i+stride)
99                 buster[i] = 0xdeadbeef;
100         if (flags & BUSTER_LOCKED)
101                 spin_unlock(&buster_lock);
102
103         if (num_pages) {
104                 spin_lock(&buster_lock);
105                 for (int i = 0; i < MIN(num_pages, MAX_PAGES); i++) {
106                         page_remove(p->env_pgdir, (void*)(INSERT_ADDR + PGSIZE * i));
107                         page_decref(a_page[i]);
108                 }
109                 spin_unlock(&buster_lock);
110         }
111
112         /* Print info */
113         if (flags & BUSTER_PRINT_TICKS) {
114                 ticks = stop_timing(ticks);
115                 printk("%llu,", ticks);
116         }
117         return 0;
118 }
119
120 static int sys_cache_invalidate(void)
121 {
122         #ifdef __i386__
123                 wbinvd();
124         #endif
125         return 0;
126 }
127
128 /* sys_reboot(): called directly from dispatch table. */
129
130 // Print a string to the system console.
131 // The string is exactly 'len' characters long.
132 // Destroys the environment on memory errors.
133 static ssize_t sys_cputs(env_t* e, const char *DANGEROUS s, size_t len)
134 {
135         // Check that the user has permission to read memory [s, s+len).
136         // Destroy the environment if not.
137         char *COUNT(len) _s = user_mem_assert(e, s, len, PTE_USER_RO);
138
139         // Print the string supplied by the user.
140         printk("%.*s", len, _s);
141         return (ssize_t)len;
142 }
143
144 // Read a character from the system console.
145 // Returns the character.
146 static uint16_t sys_cgetc(env_t* e)
147 {
148         uint16_t c;
149
150         // The cons_getc() primitive doesn't wait for a character,
151         // but the sys_cgetc() system call does.
152         while ((c = cons_getc()) == 0)
153                 cpu_relax();
154
155         return c;
156 }
157
158 /* Returns the id of the cpu this syscall is executed on. */
159 static uint32_t sys_getcpuid(void)
160 {
161         return core_id();
162 }
163
164 // TODO: Temporary hack until thread-local storage is implemented on i386
165 static size_t sys_getvcoreid(env_t* e)
166 {
167         if(e->state == PROC_RUNNING_S)
168                 return 0;
169
170         size_t i;
171         for(i = 0; i < e->num_vcores; i++)
172                 if(core_id() == e->vcoremap[i])
173                         return i;
174
175         panic("virtual core id not found in sys_getvcoreid()!");
176 }
177
178 /************** Process management syscalls **************/
179
180 /* Returns the calling process's pid */
181 static pid_t sys_getpid(struct proc *p)
182 {
183         return p->pid;
184 }
185
186 /*
187  * Creates a process found at the user string 'path'.  Currently uses KFS.
188  * Not runnable by default, so it needs it's status to be changed so that the
189  * next call to schedule() will try to run it.
190  * TODO: once we have a decent VFS, consider splitting this up
191  * and once there's an mmap, can have most of this in process.c
192  */
193 static int sys_proc_create(struct proc *p, const char *DANGEROUS path)
194 {
195         #define MAX_PATH_LEN 256 // totally arbitrary
196         int pid = 0;
197         char tpath[MAX_PATH_LEN];
198         /*
199          * There's a bunch of issues with reading in the path, which we'll
200          * need to sort properly in the VFS.  Main concerns are TOCTOU (copy-in),
201          * whether or not it's a big deal that the pointer could be into kernel
202          * space, and resolving both of these without knowing the length of the
203          * string. (TODO)
204          * Change this so that all syscalls with a pointer take a length.
205          *
206          * zra: I've added this user_mem_strlcpy, which I think eliminates the
207      * the TOCTOU issue. Adding a length arg to this call would allow a more
208          * efficient implementation, though, since only one call to user_mem_check
209          * would be required.
210          */
211         int ret = user_mem_strlcpy(p,tpath, path, MAX_PATH_LEN, PTE_USER_RO);
212         int kfs_inode = kfs_lookup_path(tpath);
213         if (kfs_inode < 0)
214                 return -EINVAL;
215         struct proc *new_p = kfs_proc_create(kfs_inode);
216         pid = new_p->pid;
217         proc_decref(new_p, 1); // let go of the reference created in proc_create()
218         return pid;
219 }
220
221 /* Makes process PID runnable.  Consider moving the functionality to process.c */
222 static error_t sys_proc_run(struct proc *p, unsigned pid)
223 {
224         struct proc *target = pid2proc(pid);
225         error_t retval = 0;
226
227         if (!target)
228                 return -EBADPROC;
229         // note we can get interrupted here. it's not bad.
230         spin_lock_irqsave(&p->proc_lock);
231         // make sure we have access and it's in the right state to be activated
232         if (!proc_controls(p, target)) {
233                 proc_decref(target, 1);
234                 retval = -EPERM;
235         } else if (target->state != PROC_CREATED) {
236                 proc_decref(target, 1);
237                 retval = -EINVAL;
238         } else {
239                 __proc_set_state(target, PROC_RUNNABLE_S);
240                 schedule_proc(target);
241         }
242         spin_unlock_irqsave(&p->proc_lock);
243         proc_decref(target, 1);
244         return retval;
245 }
246
247 /* Destroy proc pid.  If this is called by the dying process, it will never
248  * return.  o/w it will return 0 on success, or an error.  Errors include:
249  * - EBADPROC: if there is no such process with pid
250  * - EPERM: if caller does not control pid */
251 static error_t sys_proc_destroy(struct proc *p, pid_t pid, int exitcode)
252 {
253         error_t r;
254         struct proc *p_to_die = pid2proc(pid);
255
256         if (!p_to_die)
257                 return -EBADPROC;
258         if (!proc_controls(p, p_to_die)) {
259                 proc_decref(p_to_die, 1);
260                 return -EPERM;
261         }
262         if (p_to_die == p) {
263                 // syscall code and pid2proc both have edible references, only need 1.
264                 p->exitcode = exitcode;
265                 proc_decref(p, 1);
266                 printd("[PID %d] proc exiting gracefully (code %d)\n", p->pid,exitcode);
267         } else {
268                 panic("Destroying other processes is not supported yet.");
269                 //printk("[%d] destroying proc %d\n", p->pid, p_to_die->pid);
270         }
271         proc_destroy(p_to_die);
272         return ESUCCESS;
273 }
274
275 static int sys_proc_yield(struct proc *p)
276 {
277         proc_yield(p);
278         return 0;
279 }
280
281 static ssize_t sys_run_binary(env_t* e, void *DANGEROUS binary_buf, size_t len,
282                               void*DANGEROUS arg, size_t num_colors)
283 {
284         env_t* env = proc_create(NULL,0);
285         assert(env != NULL);
286
287         static_assert(PROCINFO_NUM_PAGES == 1);
288         assert(memcpy_from_user(e,env->env_procinfo->argv_buf,arg,PROCINFO_MAX_ARGV_SIZE) == ESUCCESS);
289         *(intptr_t*)env->env_procinfo->env_buf = 0;
290
291         env_load_icode(env,e,binary_buf,len);
292         __proc_set_state(env, PROC_RUNNABLE_S);
293         schedule_proc(env);
294         if(num_colors > 0) {
295                 env->cache_colors_map = cache_colors_map_alloc();
296                 for(int i=0; i<num_colors; i++)
297                         cache_color_alloc(llc_cache, env->cache_colors_map);
298         }
299         proc_decref(env, 1);
300         proc_yield(e);
301         return 0;
302 }
303
304 static ssize_t sys_fork(env_t* e)
305 {
306         // TODO: right now we only support fork for single-core processes
307         if(e->state != PROC_RUNNING_S)
308         {
309                 set_errno(current_tf,EINVAL);
310                 return -1;
311         }
312
313         env_t* env = proc_create(NULL,0);
314         assert(env != NULL);
315
316         env->heap_bottom = e->heap_bottom;
317         env->heap_top = e->heap_top;
318         env->ppid = e->pid;
319         env->env_tf = *current_tf;
320
321         env->cache_colors_map = cache_colors_map_alloc();
322         for(int i=0; i < llc_cache->num_colors; i++)
323                 if(GET_BITMASK_BIT(e->cache_colors_map,i))
324                         cache_color_alloc(llc_cache, env->cache_colors_map);
325
326         int copy_page(env_t* e, pte_t* pte, void* va, void* arg)
327         {
328                 env_t* env = (env_t*)arg;
329
330                 page_t* pp;
331                 if(upage_alloc(env,&pp,0))
332                         return -1;
333                 if(page_insert(env->env_pgdir,pp,va,*pte & PTE_PERM))
334                 {
335                         page_decref(pp);
336                         return -1;
337                 }
338
339                 pagecopy(page2kva(pp),ppn2kva(PTE2PPN(*pte)));
340                 return 0;
341         }
342
343         if(env_user_mem_walk(e,0,UTOP,&copy_page,env))
344         {
345                 proc_decref(env,2);
346                 set_errno(current_tf,ENOMEM);
347                 return -1;
348         }
349
350         __proc_set_state(env, PROC_RUNNABLE_S);
351         schedule_proc(env);
352
353         // don't decref the new process.
354         // that will happen when the parent waits for it.
355
356         printd("[PID %d] fork PID %d\n",e->pid,env->pid);
357
358         return env->pid;
359 }
360
361 static ssize_t sys_exec(env_t* e, void *DANGEROUS binary_buf, size_t len,
362                         procinfo_t*DANGEROUS procinfo)
363 {
364         // TODO: right now we only support exec for single-core processes
365         if(e->state != PROC_RUNNING_S)
366                 return -1;
367
368         if(memcpy_from_user(e,e->env_procinfo,procinfo,sizeof(*procinfo)))
369                 return -1;
370         proc_init_procinfo(e);
371
372         void* binary = kmalloc(len,0);
373         if(binary == NULL)
374                 return -1;
375         if(memcpy_from_user(e,binary,binary_buf,len))
376         {
377                 kfree(binary);
378                 return -1;
379         }
380
381         env_segment_free(e,0,USTACKTOP);
382
383         proc_init_trapframe(current_tf,0);
384         env_load_icode(e,NULL,binary,len);
385
386         kfree(binary);
387         return 0;
388 }
389
390 static ssize_t sys_trywait(env_t* e, pid_t pid, int* status)
391 {
392         struct proc* p = pid2proc(pid);
393
394         // TODO: this syscall is racy, so we only support for single-core procs
395         if(e->state != PROC_RUNNING_S)
396                 return -1;
397
398         // TODO: need to use errno properly.  sadly, ROS error codes conflict..
399
400         if(p)
401         {
402                 ssize_t ret;
403
404                 if(current->pid == p->ppid)
405                 {
406                         if(p->state == PROC_DYING)
407                         {
408                                 memcpy_to_user(e,status,&p->exitcode,sizeof(int));
409                                 printd("[PID %d] waited for PID %d (code %d)\n",
410                                        e->pid,p->pid,p->exitcode);
411                                 ret = 0;
412                         }
413                         else // not dead yet
414                         {
415                                 set_errno(current_tf,0);
416                                 ret = -1;
417                         }
418                 }
419                 else // not a child of the calling process
420                 {
421                         set_errno(current_tf,1);
422                         ret = -1;
423                 }
424
425                 // if the wait succeeded, decref twice
426                 proc_decref(p,1 + (ret == 0));
427                 return ret;
428         }
429
430         set_errno(current_tf,1);
431         return -1;
432 }
433
434 /************** Memory Management Syscalls **************/
435
436 static void *sys_mmap(struct proc* p, uintreg_t a1, uintreg_t a2, uintreg_t a3,
437                       uintreg_t* a456)
438 {
439         uintreg_t _a456[3];
440         if(memcpy_from_user(p,_a456,a456,3*sizeof(uintreg_t)))
441                 sys_proc_destroy(p,p->pid,-1);
442         return mmap(p,a1,a2,a3,_a456[0],_a456[1],_a456[2]);
443 }
444
445 static intreg_t sys_mprotect(struct proc* p, void* addr, size_t len, int prot)
446 {
447         return mprotect(p, addr, len, prot);
448 }
449
450 static intreg_t sys_munmap(struct proc* p, void* addr, size_t len)
451 {
452         return munmap(p, addr, len);
453 }
454
455 static void* sys_brk(struct proc *p, void* addr) {
456         size_t range;
457
458         if((addr < p->heap_bottom) || (addr >= (void*)USTACKBOT))
459                 goto out;
460
461         if (addr > p->heap_top) {
462                 range = addr - p->heap_top;
463                 env_segment_alloc(p, p->heap_top, range);
464         }
465         else if (addr < p->heap_top) {
466                 range = p->heap_top - addr;
467                 env_segment_free(p, addr, range);
468         }
469         p->heap_top = addr;
470
471 out:
472         return p->heap_top;
473 }
474
475 static ssize_t sys_shared_page_alloc(env_t* p1,
476                                      void**DANGEROUS _addr, pid_t p2_id,
477                                      int p1_flags, int p2_flags
478                                     )
479 {
480         //if (!VALID_USER_PERMS(p1_flags)) return -EPERM;
481         //if (!VALID_USER_PERMS(p2_flags)) return -EPERM;
482
483         void * COUNT(1) * COUNT(1) addr = user_mem_assert(p1, _addr, sizeof(void *),
484                                                       PTE_USER_RW);
485         struct proc *p2 = pid2proc(p2_id);
486         if (!p2)
487                 return -EBADPROC;
488
489         page_t* page;
490         error_t e = upage_alloc(p1, &page,1);
491         if (e < 0) {
492                 proc_decref(p2, 1);
493                 return e;
494         }
495
496         void* p2_addr = page_insert_in_range(p2->env_pgdir, page,
497                         (void*SNT)UTEXT, (void*SNT)UTOP, p2_flags);
498         if (p2_addr == NULL) {
499                 page_free(page);
500                 proc_decref(p2, 1);
501                 return -EFAIL;
502         }
503
504         void* p1_addr = page_insert_in_range(p1->env_pgdir, page,
505                         (void*SNT)UTEXT, (void*SNT)UTOP, p1_flags);
506         if(p1_addr == NULL) {
507                 page_remove(p2->env_pgdir, p2_addr);
508                 page_free(page);
509                 proc_decref(p2, 1);
510                 return -EFAIL;
511         }
512         *addr = p1_addr;
513         proc_decref(p2, 1);
514         return ESUCCESS;
515 }
516
517 static int sys_shared_page_free(env_t* p1, void*DANGEROUS addr, pid_t p2)
518 {
519         return -1;
520 }
521
522
523 /************** Resource Request Syscalls **************/
524
525 /* sys_resource_req(): called directly from dispatch table. */
526
527 /************** Platform Specific Syscalls **************/
528
529 //Read a buffer over the serial port
530 static ssize_t sys_serial_read(env_t* e, char *DANGEROUS _buf, size_t len)
531 {
532         if (len == 0)
533                 return 0;
534
535         #ifdef SERIAL_IO
536             char *COUNT(len) buf = user_mem_assert(e, _buf, len, PTE_USER_RO);
537                 size_t bytes_read = 0;
538                 int c;
539                 while((c = serial_read_byte()) != -1) {
540                         buf[bytes_read++] = (uint8_t)c;
541                         if(bytes_read == len) break;
542                 }
543                 return (ssize_t)bytes_read;
544         #else
545                 return -EINVAL;
546         #endif
547 }
548
549 //Write a buffer over the serial port
550 static ssize_t sys_serial_write(env_t* e, const char *DANGEROUS buf, size_t len)
551 {
552         if (len == 0)
553                 return 0;
554         #ifdef SERIAL_IO
555                 char *COUNT(len) _buf = user_mem_assert(e, buf, len, PTE_USER_RO);
556                 for(int i =0; i<len; i++)
557                         serial_send_byte(buf[i]);
558                 return (ssize_t)len;
559         #else
560                 return -EINVAL;
561         #endif
562 }
563
564 #ifdef __NETWORK__
565 // This is not a syscall we want. Its hacky. Here just for syscall stuff until get a stack.
566 static ssize_t sys_eth_read(env_t* e, char *DANGEROUS buf, size_t len)
567 {
568         extern int eth_up;
569
570         if (eth_up) {
571                 extern int packet_waiting;
572                 extern int packet_buffer_size;
573                 extern char*CT(packet_buffer_size) packet_buffer;
574                 extern char*CT(MAX_FRAME_SIZE) packet_buffer_orig;
575                 extern int packet_buffer_pos;
576
577                 if (len == 0)
578                         return 0;
579
580                 char *CT(len) _buf = user_mem_assert(e, buf,len, PTE_U);
581
582                 if (packet_waiting == 0)
583                         return 0;
584
585                 int read_len = ((packet_buffer_pos + len) > packet_buffer_size) ? packet_buffer_size - packet_buffer_pos : len;
586
587                 memcpy(_buf, packet_buffer + packet_buffer_pos, read_len);
588
589                 packet_buffer_pos = packet_buffer_pos + read_len;
590
591                 if (packet_buffer_pos == packet_buffer_size) {
592                         kfree(packet_buffer_orig);
593                         packet_waiting = 0;
594                 }
595
596                 return read_len;
597         }
598         else
599                 return -EINVAL;
600 }
601
602 // This is not a syscall we want. Its hacky. Here just for syscall stuff until get a stack.
603 static ssize_t sys_eth_write(env_t* e, const char *DANGEROUS buf, size_t len)
604 {
605         extern int eth_up;
606
607         if (eth_up) {
608
609                 if (len == 0)
610                         return 0;
611
612                 char *COUNT(len) _buf = user_mem_assert(e, buf, len, PTE_U);
613                 int total_sent = 0;
614                 int just_sent = 0;
615                 int cur_packet_len = 0;
616                 while (total_sent != len) {
617                         cur_packet_len = ((len - total_sent) > MAX_PACKET_DATA) ? MAX_PACKET_DATA : (len - total_sent);
618                         char* wrap_buffer = packet_wrap(_buf + total_sent, cur_packet_len);
619                         just_sent = send_frame(wrap_buffer, cur_packet_len + PACKET_HEADER_SIZE);
620
621                         if (just_sent < 0)
622                                 return 0; // This should be an error code of its own
623
624                         if (wrap_buffer)
625                                 kfree(wrap_buffer);
626
627                         total_sent += cur_packet_len;
628                 }
629
630                 return (ssize_t)len;
631
632         }
633         else
634                 return -EINVAL;
635 }
636
637 static ssize_t sys_eth_get_mac_addr(env_t* e, char *DANGEROUS buf) {
638         
639         extern int eth_up;
640
641         if (eth_up) {
642                 extern char device_mac[];
643                 for (int i = 0; i < 6; i++)
644                         buf[i] = device_mac[i];
645                 return 0;
646         }
647         else
648                 return -EINVAL;
649 }
650
651 #endif // Network
652
653 /* sys_frontend_syscall_from_user(): called directly from dispatch table. */
654
655 /************** Syscall Invokation **************/
656
657 /* Executes the given syscall.
658  *
659  * Note tf is passed in, which points to the tf of the context on the kernel
660  * stack.  If any syscall needs to block, it needs to save this info, as well as
661  * any silly state.
662  *
663  * TODO: Build a dispatch table instead of switching on the syscallno
664  * Dispatches to the correct kernel function, passing the arguments.
665  */
666 intreg_t syscall(struct proc *p, uintreg_t syscallno, uintreg_t a1,
667                  uintreg_t a2, uintreg_t a3, uintreg_t a4, uintreg_t a5)
668 {
669         typedef intreg_t (*syscall_t)(struct proc*,uintreg_t,uintreg_t,
670                                       uintreg_t,uintreg_t,uintreg_t);
671
672         const static syscall_t syscall_table[] = {
673                 [SYS_null] = (syscall_t)sys_null,
674                 [SYS_cache_buster] = (syscall_t)sys_cache_buster,
675                 [SYS_cache_invalidate] = (syscall_t)sys_cache_invalidate,
676                 [SYS_reboot] = (syscall_t)reboot,
677                 [SYS_cputs] = (syscall_t)sys_cputs,
678                 [SYS_cgetc] = (syscall_t)sys_cgetc,
679                 [SYS_getcpuid] = (syscall_t)sys_getcpuid,
680                 [SYS_getvcoreid] = (syscall_t)sys_getvcoreid,
681                 [SYS_getpid] = (syscall_t)sys_getpid,
682                 [SYS_proc_create] = (syscall_t)sys_proc_create,
683                 [SYS_proc_run] = (syscall_t)sys_proc_run,
684                 [SYS_proc_destroy] = (syscall_t)sys_proc_destroy,
685                 [SYS_yield] = (syscall_t)sys_proc_yield,
686                 [SYS_run_binary] = (syscall_t)sys_run_binary,
687                 [SYS_fork] = (syscall_t)sys_fork,
688                 [SYS_exec] = (syscall_t)sys_exec,
689                 [SYS_trywait] = (syscall_t)sys_trywait,
690                 [SYS_mmap] = (syscall_t)sys_mmap,
691                 [SYS_munmap] = (syscall_t)sys_munmap,
692                 [SYS_mprotect] = (syscall_t)sys_mprotect,
693                 [SYS_brk] = (syscall_t)sys_brk,
694                 [SYS_shared_page_alloc] = (syscall_t)sys_shared_page_alloc,
695                 [SYS_shared_page_free] = (syscall_t)sys_shared_page_free,
696                 [SYS_resource_req] = (syscall_t)resource_req,
697         #ifdef __i386__
698                 [SYS_serial_read] = (syscall_t)sys_serial_read,
699                 [SYS_serial_write] = (syscall_t)sys_serial_write,
700         #endif
701         #ifdef __NETWORK__
702                 [SYS_eth_read] = (syscall_t)sys_eth_read,
703                 [SYS_eth_write] = (syscall_t)sys_eth_write,
704                 [SYS_eth_get_mac_addr] = (syscall_t)sys_eth_get_mac_addr,
705         #endif
706         #ifdef __sparc_v8__
707                 [SYS_frontend] = (syscall_t)frontend_syscall_from_user,
708                 [SYS_read] = (syscall_t)sys_read,
709                 [SYS_write] = (syscall_t)sys_write,
710                 [SYS_open] = (syscall_t)sys_open,
711                 [SYS_close] = (syscall_t)sys_close,
712                 [SYS_fstat] = (syscall_t)sys_fstat,
713                 [SYS_stat] = (syscall_t)sys_stat,
714                 [SYS_lstat] = (syscall_t)sys_lstat,
715                 [SYS_fcntl] = (syscall_t)sys_fcntl,
716                 [SYS_access] = (syscall_t)sys_access,
717                 [SYS_umask] = (syscall_t)sys_umask,
718                 [SYS_chmod] = (syscall_t)sys_chmod,
719                 [SYS_lseek] = (syscall_t)sys_lseek,
720                 [SYS_link] = (syscall_t)sys_link,
721                 [SYS_unlink] = (syscall_t)sys_unlink,
722                 [SYS_chdir] = (syscall_t)sys_chdir,
723                 [SYS_getcwd] = (syscall_t)sys_getcwd,
724                 [SYS_gettimeofday] = (syscall_t)sys_gettimeofday,
725                 [SYS_tcgetattr] = (syscall_t)sys_tcgetattr,
726                 [SYS_tcsetattr] = (syscall_t)sys_tcsetattr
727         #endif
728         };
729
730         const int max_syscall = sizeof(syscall_table)/sizeof(syscall_table[0]);
731
732         //printk("Incoming syscall on core: %d number: %d\n    a1: %x\n   "
733         //       " a2: %x\n    a3: %x\n    a4: %x\n    a5: %x\n", core_id(),
734         //       syscallno, a1, a2, a3, a4, a5);
735
736         if(syscallno > max_syscall || syscall_table[syscallno] == NULL)
737                 panic("Invalid syscall number %d for proc %x!", syscallno, *p);
738
739         return syscall_table[syscallno](p,a1,a2,a3,a4,a5);
740 }
741
742 intreg_t syscall_async(struct proc *p, syscall_req_t *call)
743 {
744         return syscall(p, call->num, call->args[0], call->args[1],
745                        call->args[2], call->args[3], call->args[4]);
746 }
747
748 /* You should already have a refcnt'd ref to p before calling this */
749 intreg_t process_generic_syscalls(struct proc *p, size_t max)
750 {
751         size_t count = 0;
752         syscall_back_ring_t* sysbr = &p->syscallbackring;
753
754         /* make sure the proc is still alive, and keep it from dying from under us
755          * incref will return ESUCCESS on success.  This might need some thought
756          * regarding when the incref should have happened (like by whoever passed us
757          * the *p). */
758         // TODO: ought to be unnecessary, if you called this right, kept here for
759         // now in case anyone actually uses the ARSCs.
760         proc_incref(p, 1);
761
762         // max is the most we'll process.  max = 0 means do as many as possible
763         while (RING_HAS_UNCONSUMED_REQUESTS(sysbr) && ((!max)||(count < max)) ) {
764                 if (!count) {
765                         // ASSUME: one queue per process
766                         // only switch cr3 for the very first request for this queue
767                         // need to switch to the right context, so we can handle the user pointer
768                         // that points to a data payload of the syscall
769                         lcr3(p->env_cr3);
770                 }
771                 count++;
772                 //printk("DEBUG PRE: sring->req_prod: %d, sring->rsp_prod: %d\n",
773                 //         sysbr->sring->req_prod, sysbr->sring->rsp_prod);
774                 // might want to think about 0-ing this out, if we aren't
775                 // going to explicitly fill in all fields
776                 syscall_rsp_t rsp;
777                 // this assumes we get our answer immediately for the syscall.
778                 syscall_req_t* req = RING_GET_REQUEST(sysbr, ++(sysbr->req_cons));
779                 rsp.retval = syscall_async(p, req);
780                 // write response into the slot it came from
781                 memcpy(req, &rsp, sizeof(syscall_rsp_t));
782                 // update our counter for what we've produced (assumes we went in order!)
783                 (sysbr->rsp_prod_pvt)++;
784                 RING_PUSH_RESPONSES(sysbr);
785                 //printk("DEBUG POST: sring->req_prod: %d, sring->rsp_prod: %d\n",
786                 //         sysbr->sring->req_prod, sysbr->sring->rsp_prod);
787         }
788         // load sane page tables (and don't rely on decref to do it for you).
789         lcr3(boot_cr3);
790         proc_decref(p, 1);
791         return (intreg_t)count;
792 }