BNX2X: spatch signed typedefs
[akaros.git] / kern / src / atomic.c
index 84cf62f..cc73a71 100644 (file)
@@ -1,9 +1,216 @@
-#include <arch/apic.h>
+#ifdef __SHARC__
+#pragma nosharc
+#endif
 
+#include <arch/arch.h>
+#include <arch/kdebug.h>
+
+#include <bitmask.h>
 #include <atomic.h>
-#include <ros/error.h>
+#include <error.h>
 #include <string.h>
 #include <assert.h>
+#include <hashtable.h>
+#include <smp.h>
+#include <kmalloc.h>
+#include <kdebug.h>
+
+static void increase_lock_depth(uint32_t coreid)
+{
+       per_cpu_info[coreid].lock_depth++;
+}
+
+static void decrease_lock_depth(uint32_t coreid)
+{
+       per_cpu_info[coreid].lock_depth--;
+}
+
+#ifdef CONFIG_SPINLOCK_DEBUG
+
+/* Put locks you want to ignore here. */
+static uintptr_t blacklist_locks[] = {
+       //0xffffffffc03bd000,
+};
+
+/* Could do this on the output side, though noisly locks will crowd us out */
+static bool can_trace(spinlock_t *lock)
+{
+       for (int i = 0; i < ARRAY_SIZE(blacklist_locks); i++) {
+               if (blacklist_locks[i] == (uintptr_t)lock)
+                       return FALSE;
+       }
+       return TRUE;
+}
+
+/* spinlock and trylock call this after locking */
+static void post_lock(spinlock_t *lock, uint32_t coreid)
+{
+       struct per_cpu_info *pcpui = &per_cpu_info[coreid];
+       if ((pcpui->__lock_checking_enabled == 1) && can_trace(lock))
+               pcpui_trace_locks(pcpui, lock);
+       lock->call_site = get_caller_pc();
+       lock->calling_core = coreid;
+       /* TODO consider merging this with __ctx_depth (unused field) */
+       increase_lock_depth(lock->calling_core);
+}
+
+void spin_lock(spinlock_t *lock)
+{
+       uint32_t coreid = core_id_early();
+       struct per_cpu_info *pcpui = &per_cpu_info[coreid];
+       /* Short circuit our lock checking, so we can print or do other things to
+        * announce the failure that require locks.  Also avoids anything else
+        * requiring pcpui initialization. */
+       if (pcpui->__lock_checking_enabled != 1)
+               goto lock;
+       if (lock->irq_okay) {
+               if (!can_spinwait_irq(pcpui)) {
+                       pcpui->__lock_checking_enabled--;
+                       print_kctx_depths("IRQOK");
+                       panic("Lock %p tried to spin when it shouldn't\n", lock);
+                       pcpui->__lock_checking_enabled++;
+               }
+       } else {
+               if (!can_spinwait_noirq(pcpui)) {
+                       pcpui->__lock_checking_enabled--;
+                       print_kctx_depths("NOIRQ");
+                       panic("Lock %p tried to spin when it shouldn't\n", lock);
+                       pcpui->__lock_checking_enabled++;
+               }
+       }
+lock:
+       __spin_lock(lock);
+       /* Memory barriers are handled by the particular arches */
+       post_lock(lock, coreid);
+}
+
+/* Trylock doesn't check for irq/noirq, in case we want to try and lock a
+ * non-irqsave lock from irq context. */
+bool spin_trylock(spinlock_t *lock)
+{
+       uint32_t coreid = core_id_early();
+       bool ret = __spin_trylock(lock);
+       if (ret)
+               post_lock(lock, coreid);
+       return ret;
+}
+
+void spin_unlock(spinlock_t *lock)
+{
+       decrease_lock_depth(lock->calling_core);
+       /* Memory barriers are handled by the particular arches */
+       assert(spin_locked(lock));
+       __spin_unlock(lock);
+}
+
+void spinlock_debug(spinlock_t *lock)
+{
+       uintptr_t pc = lock->call_site;
+       char *func_name;
+
+       if (!pc) {
+               printk("Lock %p: never locked\n", lock);
+               return;
+       }
+       func_name = get_fn_name(pc);
+       printk("Lock %p: currently %slocked.  Last locked at [<%p>] in %s on "
+              "core %d\n", lock, spin_locked(lock) ? "" : "un", pc, func_name,
+              lock->calling_core);
+       kfree(func_name);
+}
+
+#endif /* CONFIG_SPINLOCK_DEBUG */
+
+/* Inits a hashlock. */
+void hashlock_init(struct hashlock *hl, unsigned int nr_entries)
+{
+       hl->nr_entries = nr_entries;
+       /* this is the right way to do it, though memset is faster.  If we ever
+        * find that this is taking a lot of time, we can change it. */
+       for (int i = 0; i < hl->nr_entries; i++) {
+               spinlock_init(&hl->locks[i]);
+       }
+}
+
+void hashlock_init_irqsave(struct hashlock *hl, unsigned int nr_entries)
+{
+       hl->nr_entries = nr_entries;
+       /* this is the right way to do it, though memset is faster.  If we ever
+        * find that this is taking a lot of time, we can change it. */
+       for (int i = 0; i < hl->nr_entries; i++) {
+               spinlock_init_irqsave(&hl->locks[i]);
+       }
+}
+
+/* Helper, gets the specific spinlock for a hl/key combo. */
+static spinlock_t *get_spinlock(struct hashlock *hl, long key)
+{
+       /* using the hashtable's generic hash function */
+       return &hl->locks[__generic_hash((void*)key) % hl->nr_entries];
+}
+
+void hash_lock(struct hashlock *hl, long key)
+{
+       spin_lock(get_spinlock(hl, key));
+}
+
+void hash_unlock(struct hashlock *hl, long key)
+{
+       spin_unlock(get_spinlock(hl, key));
+}
+
+void hash_lock_irqsave(struct hashlock *hl, long key)
+{
+       spin_lock_irqsave(get_spinlock(hl, key));
+}
+
+void hash_unlock_irqsave(struct hashlock *hl, long key)
+{
+       spin_unlock_irqsave(get_spinlock(hl, key));
+}
+
+/* This is the 'post (work) and poke' style of sync.  We make sure the poke
+ * tracker's function runs.  Once this returns, the func either has run or is
+ * currently running (in case someone else is running now).  We won't wait or
+ * spin or anything, and it is safe to call this recursively (deeper in the
+ * call-graph).
+ *
+ * It's up to the caller to somehow post its work.  We'll also pass arg to the
+ * func, ONLY IF the caller is the one to execute it - so there's no guarantee
+ * the func(specific_arg) combo will actually run.  It's more for info
+ * purposes/optimizations/etc.  If no one uses it, I'll get rid of it. */
+void poke(struct poke_tracker *tracker, void *arg)
+{
+       atomic_set(&tracker->need_to_run, TRUE);
+       /* will need to repeatedly do it if someone keeps posting work */
+       do {
+               /* want an wrmb() btw posting work/need_to_run and in_progress.  the
+                * swap provides the HW mb. just need a cmb, which we do in the loop to
+                * cover the iterations (even though i can't imagine the compiler
+                * reordering the check it needed to do for the branch).. */
+               cmb();
+               /* poke / make sure someone does it.  if we get a TRUE (1) back, someone
+                * is already running and will deal with the posted work.  (probably on
+                * their next loop).  if we got a 0 back, we won the race and have the
+                * 'lock'. */
+               if (atomic_swap(&tracker->run_in_progress, TRUE))
+                       return;
+               /* if we're here, then we're the one who needs to run the func. */
+               /* clear the 'need to run', since we're running it now.  new users will
+                * set it again.  this write needs to be wmb()'d after in_progress.  the
+                * swap provided the HW mb(). */
+               cmb();
+               atomic_set(&tracker->need_to_run, FALSE);       /* no internal HW mb */
+               /* run the actual function.  the poke sync makes sure only one caller is
+                * in that func at a time. */
+               assert(tracker->func);
+               tracker->func(arg);
+               wmb();  /* ensure the in_prog write comes after the run_again. */
+               atomic_set(&tracker->run_in_progress, FALSE);   /* no internal HW mb */
+               /* in_prog write must come before run_again read */
+               wrmb();
+       } while (atomic_read(&tracker->need_to_run));   /* while there's more work*/
+}
 
 // Must be called in a pair with waiton_checklist
 int commit_checklist_wait(checklist_t* list, checklist_mask_t* mask)
@@ -33,7 +240,7 @@ int commit_checklist_wait(checklist_t* list, checklist_mask_t* mask)
 int commit_checklist_nowait(checklist_t* list, checklist_mask_t* mask)
 {
        int e = 0;
-       if (e = commit_checklist_wait(list, mask))
+       if ((e = commit_checklist_wait(list, mask)))
                return e;
        // give up the lock, since we won't wait for completion
        spin_unlock_irqsave(&list->lock);
@@ -65,7 +272,7 @@ int commit_checklist_nowait(checklist_t* list, checklist_mask_t* mask)
 // Assumed we held the lock if we ever call this
 int waiton_checklist(checklist_t* list)
 {
-       extern uint32_t outstanding_calls;
+       extern atomic_t outstanding_calls;
        // can consider breakout out early, like above, and erroring out
        while (!checklist_is_clear(list))
                cpu_relax();
@@ -85,8 +292,7 @@ int release_checklist(checklist_t* list)
 // peaks in and sees if the list is locked with it's spinlock
 int checklist_is_locked(checklist_t* list)
 {
-       // remember the lock status is the lowest byte of the lock
-       return list->lock & 0xff;
+       return spin_locked(&list->lock);
 }
 
 // no synch guarantees - just looks at the list
@@ -95,6 +301,12 @@ int checklist_is_clear(checklist_t* list)
        return BITMASK_IS_CLEAR(list->mask.bits, list->mask.size);
 }
 
+// no synch guarantees - just looks at the list
+int checklist_is_full(checklist_t* list)
+{
+       return BITMASK_IS_FULL(list->mask.bits, list->mask.size);
+}
+
 // no synch guarantees - just resets the list to empty
 void reset_checklist(checklist_t* list)
 {
@@ -104,13 +316,13 @@ void reset_checklist(checklist_t* list)
 // CPU mask specific - this is how cores report in
 void down_checklist(checklist_t* list)
 {
-       CLR_BITMASK_BIT_ATOMIC(list->mask.bits, coreid());
+       CLR_BITMASK_BIT_ATOMIC(list->mask.bits, core_id());
 }
 
 /* Barriers */
 void init_barrier(barrier_t* barrier, uint32_t count)
 {
-       barrier->lock = 0;
+       spinlock_init_irqsave(&barrier->lock);
        barrier->init_count = count;
        barrier->current_count = count;
        barrier->ready = 0;
@@ -135,7 +347,7 @@ void waiton_barrier(barrier_t* barrier)
        } else {
                spin_unlock_irqsave(&barrier->lock);
                reset_barrier(barrier);
-               // if we need to wmb(), it'll be here
+               wmb();
                barrier->ready++;
        }
 }