More careful with cur_tf in syscalls
[akaros.git] / kern / src / resource.c
1 /*
2  * Copyright (c) 2009 The Regents of the University of California
3  * Barret Rhoden <brho@cs.berkeley.edu>
4  * See LICENSE for details.
5  *
6  * Kernel resource management.
7  */
8
9 #ifdef __IVY__
10 #pragma nosharc
11 #endif
12
13 #include <resource.h>
14 #include <process.h>
15 #include <smp.h>
16 #include <stdio.h>
17 #include <assert.h>
18 #include <schedule.h>
19 #include <hashtable.h>
20
21 /* This deals with a request for more cores.  The request is already stored in
22  * the proc's amt_wanted (it is compared to amt_granted). 
23  *
24  * It doesn't take the amount requested directly to avoid a race (or holding the
25  * proc_lock across the call), and allowing it to be called in other situations,
26  * such as if there was not a new request, but it's time to look at the
27  * difference between amt_wanted and amt_granted (maybe on a timer interrupt).
28  *
29  * Will return either the number actually granted or an error code.  This will
30  * not decrease the actual amount of cores (e.g. from 5 to 2), but it will
31  * transition a process from _M to _S (amt_wanted == 0).
32  *
33  * This needs a consumable/edible reference of p, in case it doesn't return.
34  *
35  * TODO: this is a giant function.  need to split it up a bit, probably move the
36  * guts to process.c and have functions to call for the brains.
37  */
38 ssize_t core_request(struct proc *p)
39 {
40         size_t num_granted;
41         ssize_t amt_new;
42         uint32_t corelist[MAX_NUM_CPUS];
43         bool need_to_idle = FALSE;
44         bool self_ipi_pending = FALSE;
45
46         /* There are a few things broken for now if you don't have a current_tf */
47         assert(current_tf);
48         spin_lock(&p->proc_lock);
49         /* check to see if this is a full deallocation.  for cores, it's a
50          * transition from _M to _S.  Will be issues with handling this async. */
51         if (!p->resources[RES_CORES].amt_wanted) {
52                 assert(p->state == PROC_RUNNING_M); // TODO: (ACR) async core req
53                 /* save the context, to be restarted in _S mode */
54                 p->env_tf = *current_tf;
55                 current_tf = 0;                 /* Make sure it isn't used in the future */
56                 env_push_ancillary_state(p); // TODO: (HSS)
57                 /* sending death, since it's not our job to save contexts or anything in
58                  * this case.  also, if this returns true, we will not return down
59                  * below, and need to eat the reference to p */
60                 self_ipi_pending = __proc_take_allcores(p, __death, 0, 0, 0);
61                 __proc_set_state(p, PROC_RUNNABLE_S);
62                 schedule_proc(p);
63                 spin_unlock(&p->proc_lock);
64                 __proc_kmsg_pending(p, self_ipi_pending);
65                 return 0;
66         }
67         /* Fail if we can never handle this amount (based on how many we told the
68          * process it can get). */
69         if (p->resources[RES_CORES].amt_wanted > p->procinfo->max_vcores) {
70                 spin_unlock(&p->proc_lock);
71                 return -EFAIL;
72         }
73         /* otherwise, see how many new cores are wanted */
74         amt_new = p->resources[RES_CORES].amt_wanted -
75                   p->resources[RES_CORES].amt_granted;
76         if (amt_new < 0) {
77                 p->resources[RES_CORES].amt_wanted = p->resources[RES_CORES].amt_granted;
78                 spin_unlock(&p->proc_lock);
79                 return -EINVAL;
80         } else if (amt_new == 0) {
81                 spin_unlock(&p->proc_lock);
82                 return 0;
83         }
84         // else, we try to handle the request
85
86         /* TODO: someone needs to decide if the process gets the resources.
87          * we just check to see if they are available and give them out.  This
88          * should call out to the scheduler or some other *smart* function.  You
89          * could also imagine just putting it on the scheduler's queue and letting
90          * that do the core request */
91         spin_lock(&idle_lock);
92         if (num_idlecores >= amt_new) {
93                 for (int i = 0; i < amt_new; i++) {
94                         // grab the last one on the list
95                         corelist[i] = idlecoremap[num_idlecores-1];
96                         num_idlecores--;
97                 }
98                 num_granted = amt_new;
99         } else {
100                 /* In this case, you might want to preempt or do other fun things... */
101                 num_granted = 0;
102         }
103         spin_unlock(&idle_lock);
104
105         // Now, actually give them out
106         if (num_granted) {
107                 switch (p->state) {
108                         case (PROC_RUNNING_S):
109                                 // issue with if we're async or not (need to preempt it)
110                                 // either of these should trip it. TODO: (ACR) async core req
111                                 // TODO: relies on vcore0 being the caller (VC#)
112                                 // TODO: do this in process.c and use this line:
113                                 //if ((current != p) || (get_pcoreid(p, 0) != core_id()))
114                                 if ((current != p) || (p->procinfo->vcoremap[0].pcoreid != core_id()))
115                                         panic("We don't handle async RUNNING_S core requests yet.");
116                                 /* save the tf so userspace can restart it.  Like in __notify,
117                                  * this assumes a user tf is the same as a kernel tf.  We save
118                                  * it in the preempt slot so that we can also save the silly
119                                  * state. */
120                                 struct preempt_data *vcpd = &p->procdata->vcore_preempt_data[0];
121                                 vcpd->preempt_tf = *current_tf;
122                                 save_fp_state(&vcpd->preempt_anc);
123                                 __seq_start_write(&vcpd->preempt_tf_valid);
124                                 /* If we remove this, vcore0 will start where the _S left off */
125                                 vcpd->notif_pending = TRUE;
126                                 assert(vcpd->notif_enabled);
127                                 /* in the async case, we'll need to remotely stop and bundle
128                                  * vcore0's TF.  this is already done for the sync case (local
129                                  * syscall). */
130                                 /* this process no longer runs on its old location (which is
131                                  * this core, for now, since we don't handle async calls) */
132                                 __seq_start_write(&p->procinfo->coremap_seqctr);
133                                 // TODO: (VC#) might need to adjust num_vcores
134                                 // TODO: (ACR) will need to unmap remotely (receive-side)
135                                 __unmap_vcore(p, 0);
136                                 __seq_end_write(&p->procinfo->coremap_seqctr);
137                                 // will need to give up this core / idle later (sync)
138                                 need_to_idle = TRUE;
139                                 // change to runnable_m (it's TF is already saved)
140                                 __proc_set_state(p, PROC_RUNNABLE_M);
141                                 break;
142                         case (PROC_RUNNABLE_S):
143                                 /* Issues: being on the runnable_list, proc_set_state not liking
144                                  * it, and not clearly thinking through how this would happen.
145                                  * Perhaps an async call that gets serviced after you're
146                                  * descheduled? */
147                                 panic("Not supporting RUNNABLE_S -> RUNNABLE_M yet.\n");
148                                 break;
149                         default:
150                                 break;
151                 }
152                 /* give them the cores.  this will start up the extras if RUNNING_M. */
153                 self_ipi_pending = __proc_give_cores(p, corelist, num_granted);
154                 spin_unlock(&p->proc_lock);
155                 // TODO: (RMS) think about this, esp when its called from a scheduler
156                 __proc_kmsg_pending(p, self_ipi_pending);
157                 /* if there's a race on state (like DEATH), it'll get handled by
158                  * proc_run or proc_destroy */
159                 if (p->state == PROC_RUNNABLE_M)
160                         proc_run(p);
161                 /* if we are moving to a partitionable core from a RUNNING_S on a
162                  * management core, the kernel needs to do something else on this core
163                  * (just like in proc_destroy).  it also needs to decref, to consume the
164                  * reference that came into this function (since we don't return).  */
165                 if (need_to_idle) {
166                         kref_put(&p->kref);
167                         abandon_core();
168                         smp_idle();
169                 }
170         } else { // nothing granted, just return
171                 spin_unlock(&p->proc_lock);
172         }
173         return num_granted;
174 }
175
176 error_t resource_req(struct proc *p, int type, size_t amt_wanted,
177                      size_t amt_wanted_min, uint32_t flags)
178 {
179         error_t retval;
180         printd("Received request for type: %d, amt_wanted: %d, amt_wanted_min: %d, "
181                "flag: %d\n", type, amt_wanted, amt_wanted_min, flags);
182         if (flags & REQ_ASYNC)
183                 // We have no sense of time yet, or of half-filling requests
184                 printk("[kernel] Async requests treated synchronously for now.\n");
185
186         /* set the desired resource amount in the process's resource list. */
187         spin_lock(&p->proc_lock);
188         size_t old_amount = p->resources[type].amt_wanted;
189         p->resources[type].amt_wanted = amt_wanted;
190         p->resources[type].amt_wanted_min = MIN(amt_wanted_min, amt_wanted);
191         p->resources[type].flags = flags;
192         spin_unlock(&p->proc_lock);
193
194         switch (type) {
195                 case RES_CORES:
196                         retval = core_request(p);
197                         // i don't like this retval hackery
198                         if (retval < 0) {
199                                 set_errno(-retval);
200                                 return -1;
201                         }
202                         else
203                                 return 0;
204                         break;
205                 case RES_MEMORY:
206                         // not clear if we should be in RUNNABLE_M or not
207                         printk("[kernel] Memory requests are not implemented.\n");
208                         return -EFAIL;
209                         break;
210                 case RES_APPLE_PIES:
211                         printk("You can have all the apple pies you want.\n");
212                         break;
213                 default:
214                         printk("[kernel] Unknown resource!  No oranges for you!\n");
215                         return -EINVAL;
216         }
217         return 0;
218 }
219
220 void print_resources(struct proc *p)
221 {
222         printk("--------------------\n");
223         printk("PID: %d\n", p->pid);
224         printk("--------------------\n");
225         for (int i = 0; i < MAX_NUM_RESOURCES; i++)
226                 printk("Res type: %02d, amt wanted: %08d, amt granted: %08d\n", i,
227                        p->resources[i].amt_wanted, p->resources[i].amt_granted);
228 }
229
230 void print_all_resources(void)
231 {
232         spin_lock(&pid_hash_lock);
233         if (hashtable_count(pid_hash)) {
234                 hashtable_itr_t *phtable_i = hashtable_iterator(pid_hash);
235                 do {
236                         print_resources(hashtable_iterator_value(phtable_i));
237                 } while (hashtable_iterator_advance(phtable_i));
238         }
239         spin_unlock(&pid_hash_lock);
240 }