Rename KMALLOC_* -> MEM_* [2/2]
[akaros.git] / kern / src / smp.c
index 0ae15b8..12bbd6e 100644 (file)
@@ -4,10 +4,6 @@
  * See LICENSE for details.
  */
 
-#ifdef __SHARC__
-#pragma nosharc
-#endif
-
 #include <arch/arch.h>
 #include <atomic.h>
 #include <smp.h>
 #include <trace.h>
 #include <kdebug.h>
 #include <kmalloc.h>
+#include <core_set.h>
+#include <completion.h>
+
+struct all_cpu_work {
+       struct completion comp;
+       void (*func)(void *);
+       void *opaque;
+};
 
-struct per_cpu_info per_cpu_info[MAX_NUM_CPUS];
+struct per_cpu_info per_cpu_info[MAX_NUM_CORES];
 
 // tracks number of global waits on smp_calls, must be <= NUM_HANDLER_WRAPPERS
 atomic_t outstanding_calls = 0;
@@ -35,7 +39,7 @@ static void try_run_proc(void)
        struct per_cpu_info *pcpui = &per_cpu_info[core_id()];
        /* There was a process running here, and we should return to it. */
        if (pcpui->owning_proc) {
-               assert(!pcpui->cur_sysc);
+               assert(!pcpui->cur_kthread->sysc);
                assert(pcpui->cur_ctx);
                __proc_startcore(pcpui->owning_proc, pcpui->cur_ctx);
                assert(0);
@@ -57,7 +61,9 @@ static void try_run_proc(void)
 static void __attribute__((noinline, noreturn)) __smp_idle(void)
 {
        struct per_cpu_info *pcpui = &per_cpu_info[core_id()];
+
        clear_rkmsg(pcpui);
+       pcpui->cur_kthread->flags = KTH_DEFAULT_FLAGS;
        enable_irq();   /* one-shot change to get any IRQs before we halt later */
        while (1) {
                disable_irq();
@@ -68,6 +74,7 @@ static void __attribute__((noinline, noreturn)) __smp_idle(void)
                 * Important to do this, since we could have a RKM come in via an
                 * interrupt right while PRKM is returning, and we wouldn't catch
                 * it. */
+               __set_cpu_state(pcpui, CPU_STATE_IDLE);
                cpu_halt();
                /* interrupts are back on now (given our current semantics) */
        }
@@ -78,6 +85,7 @@ void smp_idle(void)
 {
        #ifdef CONFIG_RESET_STACKS
        set_stack_pointer(get_stack_top());
+       set_frame_pointer(0);
        #endif /* CONFIG_RESET_STACKS */
        __smp_idle();
        assert(0);
@@ -99,6 +107,10 @@ void smp_percpu_init(void)
        kthread = __kthread_zalloc();
        kthread->stacktop = get_stack_top();    /* assumes we're on the 1st page */
        pcpui->cur_kthread = kthread;
+       /* Treat the startup threads as ktasks.  This will last until smp_idle when
+        * they clear it, either in anticipation of being a user-backing kthread or
+        * to handle an RKM. */
+       kthread->flags = KTH_KTASK_FLAGS;
        per_cpu_info[coreid].spare = 0;
        /* Init relevant lists */
        spinlock_init_irqsave(&per_cpu_info[coreid].immed_amsg_lock);
@@ -115,10 +127,51 @@ void smp_percpu_init(void)
        assert(trace_buf);
        trace_ring_init(&pcpui->traces, trace_buf, PGSIZE,
                        sizeof(struct pcpu_trace_event));
+       for (int i = 0; i < NR_CPU_STATES; i++)
+               pcpui->state_ticks[i] = 0;
+       pcpui->last_tick_cnt = read_tsc();
+       /* Core 0 is in the KERNEL state, called from smp_boot.  The other cores are
+        * too, at least on x86, where we were called from asm (woken by POKE). */
+       pcpui->cpu_state = CPU_STATE_KERNEL;
        /* Enable full lock debugging, after all pcpui work is done */
        pcpui->__lock_checking_enabled = 1;
 }
 
+/* it's actually okay to set the state to the existing state.  originally, it
+ * was a bug in the state tracking, but it is possible, at least on x86, to have
+ * a halted core (state IDLE) get woken up by an IRQ that does not trigger the
+ * IRQ handling state.  for example, there is the I_POKE_CORE ipi.  smp_idle
+ * will just sleep again, and reset the state from IDLE to IDLE. */
+void __set_cpu_state(struct per_cpu_info *pcpui, int state)
+{
+       uint64_t now_ticks;
+       assert(!irq_is_enabled());
+       /* TODO: could put in an option to enable/disable state tracking. */
+       now_ticks = read_tsc();
+       pcpui->state_ticks[pcpui->cpu_state] += now_ticks - pcpui->last_tick_cnt;
+       /* TODO: if the state was user, we could account for the vcore's time,
+        * similar to the total_ticks in struct vcore.  the difference is that the
+        * total_ticks tracks the vcore's virtual time, while this tracks user time.
+        * something like vcore->user_ticks. */
+       pcpui->cpu_state = state;
+       pcpui->last_tick_cnt = now_ticks;
+}
+
+void reset_cpu_state_ticks(int coreid)
+{
+       struct per_cpu_info *pcpui = &per_cpu_info[coreid];
+       uint64_t now_ticks;
+       if (coreid >= num_cores)
+               return;
+       /* need to update last_tick_cnt, so the current value doesn't get added in
+        * next time we update */
+       now_ticks = read_tsc();
+       for (int i = 0; i < NR_CPU_STATES; i++) {
+               pcpui->state_ticks[i] = 0;
+               pcpui->last_tick_cnt = now_ticks;
+       }
+}
+
 /* PCPUI Trace Rings: */
 
 static void pcpui_trace_kmsg_handler(void *event, void *data)
@@ -180,18 +233,49 @@ void pcpui_tr_foreach(int coreid, int type)
 
 void pcpui_tr_foreach_all(int type)
 {
-       for (int i = 0; i < num_cpus; i++)
+       for (int i = 0; i < num_cores; i++)
                pcpui_tr_foreach(i, type);
 }
 
 void pcpui_tr_reset_all(void)
 {
-       for (int i = 0; i < num_cpus; i++)
+       for (int i = 0; i < num_cores; i++)
                trace_ring_reset(&per_cpu_info[i].traces);
 }
 
 void pcpui_tr_reset_and_clear_all(void)
 {
-       for (int i = 0; i < num_cpus; i++)
+       for (int i = 0; i < num_cores; i++)
                trace_ring_reset_and_clear(&per_cpu_info[i].traces);
 }
+
+static void smp_do_core_work(uint32_t srcid, long a0, long a1, long a2)
+{
+       struct all_cpu_work *acw = (struct all_cpu_work *) a0;
+
+       acw->func(acw->opaque);
+       completion_complete(&acw->comp, 1);
+}
+
+void smp_do_in_cores(const struct core_set *cset, void (*func)(void *),
+                                        void *opaque)
+{
+       int cpu = core_id();
+       struct all_cpu_work acw;
+
+       memset(&acw, 0, sizeof(acw));
+       completion_init(&acw.comp, core_set_remote_count(cset));
+       acw.func = func;
+       acw.opaque = opaque;
+
+       for (int i = 0; i < num_cores; i++) {
+               if (core_set_getcpu(cset, i)) {
+                       if (i == cpu)
+                               func(opaque);
+                       else
+                               send_kernel_message(i, smp_do_core_work, (long) &acw, 0, 0,
+                                                                       KMSG_ROUTINE);
+               }
+       }
+       completion_wait(&acw.comp);
+}