9 years agoCleans up fork/exec's procinfo/data handling
Barret Rhoden [Tue, 13 Sep 2011 18:35:06 +0000 (11:35 -0700)]
Cleans up fork/exec's procinfo/data handling

This makes the process fork creates new/fresh by default, and things
needed from procinfo are copied over one at a time.  The old way was
that the procinfo/procdata were identical.

In general, I tend to really dislike fork/exec: lots of hacks and pains
in the ass.  At least it isn't as bad as it used to be (when the proc
creation paths were totally separate).

9 years agoVcore list initialization. (XCC)
Barret Rhoden [Mon, 12 Sep 2011 22:57:50 +0000 (15:57 -0700)]
Vcore list initialization. (XCC)

There are three lists: active, bulk_preempted, and inactive/yielded.  We
don't use them in this commit; we just get them in place.  They have a
few purposes.  In the long run, it'll help the kernel with bulk
preemption.  For now, it will help with quickly finding a new vcore (no
more scanning from vcore0).  In the middle run, event FALLBACK will be
able to find a destination quickly.

9 years agoMCS locks properly disable thread migration
Barret Rhoden [Mon, 12 Sep 2011 21:52:17 +0000 (14:52 -0700)]
MCS locks properly disable thread migration

Any time you disable notifs, you need to disable uthread migration too.
The reason for this is that we can't atomically disable interrupts on a
vcore, so we need to make sure we're not moved around in the instant
after we read vcoreid and before we actually disable notifs.  x86's
'cli' doesn't have this issue.  =)

I put an assert in disable_notifs() to catch any future callers that
don't do this.

Also note that disabling/enabling notifs isn't the only reason to
disable migration; we want to disable migration for code that requires
staying on a vcore.  We don't necessarily want to turn it off an on at
exactly the same call sites as enable/disable notifs.  Check
uthread_yield() for an example (note it doesn't even enable_notifs()

9 years agoUses vcore_yield() for the preempt_pending path
Barret Rhoden [Mon, 12 Sep 2011 21:21:03 +0000 (14:21 -0700)]
Uses vcore_yield() for the preempt_pending path

I'm considering getting rid of the preemption pending business
completely, and just dealing with it afterwards.  But so long as we have
it, we need to make it work so that we don't lose INDIR messages by
yielding without checking events, etc.

9 years agoAdded gawk check to the Makefile
Kevin Klues [Thu, 8 Sep 2011 22:40:35 +0000 (15:40 -0700)]
Added gawk check to the Makefile

9 years agoSparc's cpu_halt() enables interrupts
Barret Rhoden [Wed, 31 Aug 2011 21:16:11 +0000 (14:16 -0700)]
Sparc's cpu_halt() enables interrupts

This isn't atomic, so may suffer from the race mentioned above.  This
compiles and runs, barely.  I say barely since there seem to be some
other sparc issues atm (running mhello, for instance).

9 years agoFixes race where we'd ignore a kmsg when halting
Barret Rhoden [Wed, 31 Aug 2011 02:24:04 +0000 (19:24 -0700)]
Fixes race where we'd ignore a kmsg when halting

If an interrupt came in at the wrong time, right after PRKM returns
(more specifically, right after it turns on interrupts but after it
thought the list was empty), then we'd halt and miss the message til the
next interrupt.

To fix this, we want cpu_halt() to mean "turn on interrupts and then
halt the core, atomically".  x86 does this via some irq_handler()
hacking, though from what I've seen, "sti;hlt" won't get interrupts
before the hlt (not sure if this is intentional or not).

Other archs (sparc/riscv) will need to support similar semantics in
their cpu_halt(), as the code is now.  Alternatively (and slightly
preferred), we can shut down the core completely and have it come back
up and come in through the top of smp_idle().

9 years agoEvent queue throttling (XCC)
Barret Rhoden [Mon, 29 Aug 2011 22:06:19 +0000 (15:06 -0700)]
Event queue throttling (XCC)

If an INDIR alert is pending for an ev_q, we won't send more til the
first one was acknowledged.  Some extras will make it through (due to
the nature of the race, but extras are always okay.

On a simple block test, this reduced the INDIRs by 10% - not a big deal.
If you want to turn it off for debugging reasons, comment out the
check/return block at the top of alert_vcore().  I want to leave it on
all the time, since it might help me catch a bug.

Reinstall your kernel headers / rebuild the parlib stuff.

9 years agoMakes looper.sh more useful
Barret Rhoden [Wed, 24 Aug 2011 23:55:51 +0000 (16:55 -0700)]
Makes looper.sh more useful

It now outputs the iteration, so you can detect a lockup more easily.

9 years agoAllows uthread_init() to be called repeatedly
Barret Rhoden [Mon, 22 Aug 2011 23:53:50 +0000 (16:53 -0700)]
Allows uthread_init() to be called repeatedly

So a 2LS can repurpose a thread, getting a fresh TLS, etc.  There's an
assertion that could trip (the flags and sysc check), though no one
should have a uthread with an old sysc.  'flags' could go either way,
but for now we want to catch "DONT_MIGRATE" being turned on.

9 years agouthread creation is now init, slims 2ls sched_ops
Barret Rhoden [Mon, 22 Aug 2011 23:28:30 +0000 (16:28 -0700)]
uthread creation is now init, slims 2ls sched_ops

2LSs now create their threads however they want, and then call
uthread_init() on them.  Later, they must call uthread_cleanup().

Thread creation/destruction is more 'top-down' this way, and the 2LS
must be sure to call uthread_lib_init() in its initialization routines,
and call uthread_cleanup() when it is done with a uthread.

With great power comes great responsibility.

9 years agoreadline() sends a \n when it got a \r
Barret Rhoden [Tue, 16 Aug 2011 00:12:26 +0000 (17:12 -0700)]
readline() sends a \n when it got a \r

We tend to treat \n as \r, like in a printk().  Similarly, we treat lone
\rs as \ns.  The serial port actually sends just \rs, not \r\n.
Basically, we treat \r and \n similarly.  When writing to the serial
port, they are the same.  When writing to the monitor, \n does a \r too,
but you can do a \r alone.

It's all rather ugly.  One way (a long-term better way) to deal with
this would be to make \n and \r do what they are supposed to do at the
device level, and change printk() to add \rs to its \ns.

Things would be a little nicer if minicom would send a \n.

9 years agoChecks for non-VCPD mboxs and INDIRs
Barret Rhoden [Mon, 15 Aug 2011 22:24:44 +0000 (15:24 -0700)]
Checks for non-VCPD mboxs and INDIRs

Seems the easiest place to check for INDIRs to VCPD mboxes.  It won't
catch all of them btw, but it's userspace's responsibility to not screw
this up too bad.

9 years agoev_qs can request fallback to active vcores (XCC)
Barret Rhoden [Mon, 15 Aug 2011 22:02:27 +0000 (15:02 -0700)]
ev_qs can request fallback to active vcores (XCC)

Fallback allows vcores to yield and not worry about missed INDIR events.
Read the documentation.

2LS writers can use vcore_yield() in a loop to try and yield properly.
Note that this will return.  Check the pthread code for an example of
how to handle this.

Reinstall your kernel headers.

9 years agoHelper to determine if a vcore is online / mapped
Barret Rhoden [Mon, 15 Aug 2011 21:58:53 +0000 (14:58 -0700)]
Helper to determine if a vcore is online / mapped

Mapped to a pcore, which means it is either online or will be soon (kmsg
in flight).  For the most part, 'mapped' means 'online'.  Might change
this later, to differentiate between existing, not existing, and
actually running (similar to how VM works: mapped != paged in).

9 years agoSeparates EVENT_INDIR from EVENT_IPI (XCC)
Barret Rhoden [Thu, 11 Aug 2011 22:21:15 +0000 (15:21 -0700)]

Previously, and IPI implied and INDIR.  Now you can do them
independently, such as if you want INDIR messages that you'll poll out
of the VCPD.  Read the new Documentation.

Recompile / reinstall your kernel headers.

9 years agoFixes pthread thread0 initialization
Barret Rhoden [Wed, 10 Aug 2011 22:34:26 +0000 (15:34 -0700)]
Fixes pthread thread0 initialization

Need to have thread0 be a full pthread.  Previously, we'd have issues if
we had that thread exit while the program was still running (it'd try to
free its stack and get messed up, among other things).

9 years agouthread_exit() replaced with uthread_destroy()
Barret Rhoden [Thu, 4 Aug 2011 22:58:02 +0000 (15:58 -0700)]
uthread_exit() replaced with uthread_destroy()

For 2LSs that want to be able to destroy inactive threads from another
context, so that they can cache the.  This also simplifies uthread code
a bit.

9 years agoHelpers for converting time to and from tsc ticks
Barret Rhoden [Thu, 4 Aug 2011 06:53:14 +0000 (23:53 -0700)]
Helpers for converting time to and from tsc ticks

Don't refer to system_timing.tsc_freq directly.  The helpers handle
things such as wraparound/overflow, which was definitely a problem when
dealing with nsec.

Incidentally, wraparound/overflow is possibly why Dave had those
"impossible" numbers back in the day.

9 years agoCleaned up the 'timer interfaces'
Barret Rhoden [Mon, 1 Aug 2011 21:58:13 +0000 (14:58 -0700)]
Cleaned up the 'timer interfaces'

Things were a bit ghetto.  Now there is just time.h, one for ros/, one
for kern, and one for the arches.  x86 still uses apic.h for all its
crap, but no one else in kern/ needs to know about that.

9 years agoUCQ debug function
Barret Rhoden [Mon, 1 Aug 2011 21:11:26 +0000 (14:11 -0700)]
UCQ debug function

Call it via kfunc for now.  You'll need userspace to print out its ucq
address if you're going to call this from the monitor or something.
 Please enter the commit message for your changes. Lines starting

9 years agoFixes crappy address space management in arsc code
Barret Rhoden [Mon, 1 Aug 2011 21:05:45 +0000 (14:05 -0700)]
Fixes crappy address space management in arsc code

Old version was pretty clunky about when and how it switched contexts,
and might have been leaking proc refcnts if you had current loaded while
handling remote calls.

Note: I don't have code that actually uses this stuff, but it probably
works.  Dave can take a look with stuff from his branch if there is a
concern this doesn't work.

9 years agoHelpers for temporarily changing address spaces
Barret Rhoden [Mon, 1 Aug 2011 20:56:07 +0000 (13:56 -0700)]
Helpers for temporarily changing address spaces

Often the kernel wants to work in a process's context, but isn't
naturally in it, such as sending events from remote cores in interrupt
context, or from a management core.  Use the switch_to() and
switch_back() helpers for this.  Pair them up, etc.

9 years agoAlternate ev_mbox setting for pthreads
Barret Rhoden [Mon, 1 Aug 2011 18:47:06 +0000 (11:47 -0700)]
Alternate ev_mbox setting for pthreads

I have an example of how to use a single ev_mbox for all syscalls, while
having separate ev_qs per vcore.  Manually turn it on (and the default
version off) in pthread.c if you want.  I'm probably the only one that
will use it, since it is a nice way to hammer on UCQs (which is how I
found the recent bug).

9 years agoFixes race in UCQ consumer
Barret Rhoden [Mon, 1 Aug 2011 18:42:14 +0000 (11:42 -0700)]
Fixes race in UCQ consumer

During a page transition and under contention, we could get a slot that
is ahead of the producer.

9 years agoPthread syscall ev_qs no longer use VCPD mboxes
Barret Rhoden [Fri, 29 Jul 2011 23:47:02 +0000 (16:47 -0700)]
Pthread syscall ev_qs no longer use VCPD mboxes

2LSs (and anyone) should not use the VCPD ev_mboxes.  Message delivery
to the VCPD should be for messages meant to go to that specific vcore,
about that vcore's business.

One such bit of business is the indirection event EV_EVENT, telling it
the reason for an IPI is to check a particular event queue (such as the
syscall queue).

You want to decouple these so that different vcores can handle
unblocking threads that slept on a separate vcore, which is necessary if
you want a vcore to yield when it has no work to do but when there are
outstanding syscalls/uthreads.  If we used the VCPD, then another core
would have to process messages of another core's VCPD, which would
include messages that were not meant for the running core - such as
"preempt pending".

Also note that a 2LS could easily have one ev_q for all blocking
syscalls, or even multiple ev_qs (so you can specify IPI targets) but
with one global ev_mbox that all the ev_qs point to (and contend on).
This assumes there are no bugs (which there are).

9 years agoFixes event_q "get" interfaces to work with UCQs
Barret Rhoden [Fri, 29 Jul 2011 23:35:19 +0000 (16:35 -0700)]
Fixes event_q "get" interfaces to work with UCQs

One of the differences betwene UCQs and BCQs is that UCQs need to be
initialized.  I put some code in the kernel to catch uninitialized UCQs
in _M mode, which shouldn't happen, to help debug this.

For the event and ucq init code, the main difference between the raw and
normal functions is whether or not you manage your own memory.  Doing
one big mmap should be faster if you're making lots of big ev_qs (and
therefore lots of ucqs).

9 years agoRemoved event overflow handling
Barret Rhoden [Thu, 28 Jul 2011 23:48:13 +0000 (16:48 -0700)]
Removed event overflow handling

You can still request a bit for a message, but we no longer deal with
true overflow, nor any related system-recovery.  The Documentation still
talks about overflow a bit, in case we need to revisit these issues.

9 years agoReplaces BCQs with UCQs (XCC)
Barret Rhoden [Thu, 28 Jul 2011 22:28:19 +0000 (15:28 -0700)]
Replaces BCQs with UCQs (XCC)

This doesn't change anything extra.  For instance, the overflow
detection and handling code is still in place.

Reinstall your kernel headers, etc, though you shouldn't need a full
cross compiler rebuild.

9 years agoRemoved extraneous event/bcq utilities
Barret Rhoden [Thu, 28 Jul 2011 22:11:32 +0000 (15:11 -0700)]
Removed extraneous event/bcq utilities

mon_bcq() was getting useless quickly.  It helped with a brutal bug, but
isn't needed in its older form any more.

event_activity() wasn't particularly useful.  The only "legit" use was
to poll in syscall.c, which I want to discourage.  We might bring it
back in the future, but only if there is real need.

9 years agoEvent queues no longer use KVAs
Barret Rhoden [Thu, 28 Jul 2011 20:13:19 +0000 (13:13 -0700)]
Event queues no longer use KVAs

For VCPDs (in procdata), we had been accepting KVAs for ev_mboxes, even
if the user supplies them.  While it was correct, it was a bit error
prone, and since we're now in the business of carefully using
user-pointers, I cleaned this out.  Also UCQs (by fiat, for the same
reasons) need to be in user-RW-space, which would be a problem with the

9 years agoAdds 'hashlocks' and uses them for UCQs
Barret Rhoden [Tue, 26 Jul 2011 21:37:47 +0000 (14:37 -0700)]
Adds 'hashlocks' and uses them for UCQs

Hashlocks are just an array of spinlocks, and you pick your particular
lock based on some key's hash.  I'm curious to see if they are any
better than spinlocks, and at what point they are worth using.  For our
UCQ code - they probably aren't, but are rather cool.  We'd need some
serious event delivery to the same process in parallel to start
contending on the proc_lock.

9 years agoUCQs (XCC)
Barret Rhoden [Mon, 25 Jul 2011 23:27:44 +0000 (16:27 -0700)]

Unbounded concurrent queues, will eventually replace the BCQs in event
queues.  Don't manually call tests/ucq; it won't work.  If you want to
use them, you'll need to rebuild your cross compiler / reinstall your
kernel headers.  Future commits will actually use these.

Check the Documentation for specifics.

9 years agoClarifies 'handler-style' usage of alarms
Barret Rhoden [Mon, 25 Jul 2011 21:55:29 +0000 (14:55 -0700)]
Clarifies 'handler-style' usage of alarms

Since you shouldn't use an a_waiter on the stack if you aren't sleeping.

9 years agomm.h directly includes ros/mman.h
Barret Rhoden [Tue, 19 Jul 2011 22:43:56 +0000 (15:43 -0700)]
mm.h directly includes ros/mman.h

Minor thing, but most all users of mm.h would need ros/mman.h for the
flags to do_mmap().  Fixing it now before adding files that do this.

9 years agoarch/mmu.h contents now in ros/arch/mmu.h (XCC)
Barret Rhoden [Tue, 19 Jul 2011 18:47:15 +0000 (11:47 -0700)]
arch/mmu.h contents now in ros/arch/mmu.h (XCC)

This exposes certain constants to processes that they'll need to do
things like read page tables, handle segmentation (which we already do
for TLS), agree with the kernel on what the page offset is, etc.  This
will be useful later, and cleans up a couple todos.  Things were crappy
ever since we moved just a couple items at a time to ros/, but leaving
the rest in arch/.

For now, I'll leave the arch/mmu.hs, in case we come up with something
that should be kernel-only.

If this breaks things in RISC-V, please fix but leave the macros
exposed.  I'll be using PGOFF and PTE_ADDR later, among other things.

Rebuild your cross compiler / reinstall your kernel headers.

9 years ago__do_mmap() also adjusts anonymous addresses
Barret Rhoden [Tue, 19 Jul 2011 18:19:33 +0000 (11:19 -0700)]
__do_mmap() also adjusts anonymous addresses

Necessary for kernel do_mmap() calls that avoid mmap().

9 years agois_user_rwaddr() now takes a length parameter
Barret Rhoden [Wed, 13 Jul 2011 19:35:13 +0000 (12:35 -0700)]
is_user_rwaddr() now takes a length parameter

9 years agoremoved gunk from manager_waterman()
Andrew Waterman [Wed, 13 Jul 2011 03:00:17 +0000 (20:00 -0700)]
removed gunk from manager_waterman()

9 years agofixed atomic_read to be assumed volatile
Andrew Waterman [Wed, 13 Jul 2011 02:55:36 +0000 (19:55 -0700)]
fixed atomic_read to be assumed volatile

9 years agoRISC-V compile fixes
Andrew Waterman [Tue, 12 Jul 2011 19:46:42 +0000 (12:46 -0700)]
RISC-V compile fixes

9 years agosome RISC-V fixes
Andrew Waterman [Tue, 12 Jul 2011 19:34:03 +0000 (12:34 -0700)]
some RISC-V fixes

9 years agoFixed compile error on SPARC port
Andrew Waterman [Fri, 8 Jul 2011 06:07:50 +0000 (23:07 -0700)]
Fixed compile error on SPARC port

9 years agoe1000 uses the new kernel dynamic VA mapping
Barret Rhoden [Tue, 14 Jun 2011 23:40:16 +0000 (16:40 -0700)]
e1000 uses the new kernel dynamic VA mapping

Also, we no longer need mmio_alloc(), which was doing both the VA
reservation as well as mapping, and only working about the APICS (which
was the old mmio_base).

9 years agoFixes showmapping to work with non-page back maps
Barret Rhoden [Tue, 14 Jun 2011 23:33:21 +0000 (16:33 -0700)]
Fixes showmapping to work with non-page back maps

Should never have been using page_lookup in the first place.  Ugh.
Also, we finally show the permission bit.  It's a bit more important now
that callers of map_vmap_segment() have to set PTE_P.

9 years agoBasic functions to dynamically adjust kernel vmaps
Barret Rhoden [Tue, 14 Jun 2011 01:14:17 +0000 (18:14 -0700)]
Basic functions to dynamically adjust kernel vmaps

For now, you can't dealloc or unmap regions.  There are two parts:
reservation/alloc/getting of a chunk of vm space (growing down from
KERN_DYN_TOP), and then mapping those vaddrs to paddrs.  This is not
like page_insert - there might not be real pages involved.  You'll have
to handle your own refcnting or otherwise handle whatever you are

9 years agoKernel static mappings grow down, APICs remapped
Barret Rhoden [Sat, 11 Jun 2011 00:51:03 +0000 (17:51 -0700)]
Kernel static mappings grow down, APICs remapped

The KERNBASE physical memory mapping still grows up from KERNBASE to the
top of virtual memory.  This top is now KERN_VMAP_TOP, instead of the
old IOAPIC_BASE.  If you arch needs the kernel to never map above a
certain VA, then set this.  RISCV needs it due to its crazy static
kernel aliasing.

RISCV side note: I moved the "max vaddr" stuff (formerly IOAPIC) to the
size dependent code in mmu.h, since I think the old version was wrong
for 32 bit versions.  Feel free to move it back.

All non-KERNBASE mappings will now grow down from KERNBASE, such as VPT,
and the APICs (L and IO).  Any static ones your arch needs should be
defined, and set the value KERN_DYN_TOP at the bottom of the last one.
From this point, all dynamic mappings will occur (in future patches,
when we have dynamic mappings), down to ULIM.

While the LAPIC and IOAPIC don't need to be a part of the kernel
interface (in ros/mmu.h or memlayout.h), the VPT symbol does for now, so until
we figure out how to use the UVPT, I'm leaving it there.

Also, the LAPIC and IOAPIC are now mapped in their new locations, which
are still called LAPIC_BASE nand IOAPIC_BASE.  Previously that name was
overloaded for both VA and PA, and now the PAs have are *_PBASE.

9 years agoExt2: helper function pointers take longs
Barret Rhoden [Wed, 8 Jun 2011 22:20:40 +0000 (15:20 -0700)]
Ext2: helper function pointers take longs

Instead of void*s.  Same deal as with the kernel messages.  Also note
that ext2 uses 32bit ints a lot (like with load_inode()), since it is
part of the disk format.

9 years agoKernel message parameters are now longs
Barret Rhoden [Wed, 8 Jun 2011 21:17:51 +0000 (14:17 -0700)]
Kernel message parameters are now longs

Instead of void*s.  This helps code be 64-bit friendly, and we avoid
casting to and from pointers when we don't care about pointers.

9 years agoUTOP -> UWLIM
Barret Rhoden [Wed, 8 Jun 2011 20:49:41 +0000 (13:49 -0700)]

Clarifies (and fixes) the confusing usage of UTOP as the upper limit to
user-writable VAs.  ULIM is the max accessible, and UWLIM is the max

This touches the kernel headers, but the values haven't changed so you
shouldn't need to rebuild glibc or anything.

9 years agoDefault/static stacks are now PGSIZE
Barret Rhoden [Wed, 8 Jun 2011 20:18:06 +0000 (13:18 -0700)]
Default/static stacks are now PGSIZE

We might up it to two pages in the future, but whatever we do needs to
be kept in sync with kthread stacks, which are one page.

9 years agoRemoved KSTACKTOP
Barret Rhoden [Wed, 8 Jun 2011 19:29:21 +0000 (12:29 -0700)]

This was the virtual mapping of core0's kernel stack (aka, bootstack)
into space below KERNBASE.  We actually haven't even used the virtual
mapping for about 8 months - since kthreadding back in d6177dffd9735.

9 years agoAtomics rewrite (XCC)
Barret Rhoden [Wed, 8 Jun 2011 01:29:10 +0000 (18:29 -0700)]
Atomics rewrite (XCC)

The atomics have been slowly drifting out of control, esp with 64-bit
unfriendliness; this patch ought to fix some things.

1) All atomic ops take an atomic_t*, and if there are values added or
subtracted, they are longs.  The atomic_t helps ensure we only use
atomic ops on atomic variables.

2) Atomic ops on other types have their own functions, denoting the
type, such as atomic_cas_u32().  Careful using these, since you may have
other references to those vars that aren't atomic.

3) BCQs use u32s for their buffer indexes.  If we have programs that are
32 bit on a 64 bit kernel, we would have trouble if we tried using 64
bit values.

4) k/i/atomic.h now is the source of the function prototypes.  They are
extern inlines, which requires -fgnu-89inline (which we've been using),
allowing arches to implement the functions however they'd like, such as
with static inlines or with a regular function (like x86's
spinlock_debug() or riscv's CAS ops).

5) Some users of atomic_swap were cleaned up to represent its status as
an atomic, mostly in userlevel locking code.  Userlevel condition
variables use swap_u32(), which may not be what people want.  That bit
of code is a bit unmaintained at this point.

6) Userspace does not unify its atomics in an inc/atomic.h, since glibc
has its own atomic.h.  There will be a reckoning for userspace at some
point, dealing with the collision of atomic naming with glibc.  It's not
really the kernel's concern.  Also note that I didn't want to force the
-fgnu89-inline on userspace.

7) Rebuild your cross compiler/glibc.  Everything compiles on sparc and
x86.  I haven't been able to try riscv yet.

9 years agoFixes sparc compilation error
Barret Rhoden [Mon, 6 Jun 2011 23:17:32 +0000 (16:17 -0700)]
Fixes sparc compilation error

Sparc doesn't like our new fields in the kernel messages.  We'll 8-byte
align them from now on.  If you change the size of a kernel message, be
sure to update k/a/s/trap.h.

9 years agoKthread stack poisoning
Barret Rhoden [Mon, 6 Jun 2011 21:10:11 +0000 (14:10 -0700)]
Kthread stack poisoning

This has a bunch of asserts to check when sleeping or restarting a
kthread to make sure that we aren't using an active kernel stack.

The option will eventually go away or change when we have kthread
structs at the top of stacks.

For now, this will probably fail on sparc and riscv, so don't turn it on
for them.  Its not a big deal, since this is meant to debug heavy

9 years agoSafer assertions related to __up_sem()
Barret Rhoden [Mon, 6 Jun 2011 20:19:41 +0000 (13:19 -0700)]
Safer assertions related to __up_sem()

When calling __up_sem(), you can ask it to assert that the list is empty
after signalling one.  This is for code that wants a semaphore of only
one item and wants to put in some 'helpful' asserts.  By having __up_sem
do it, we avoid the temptation to check after waking a kthread, but more
importantly we do the check inside the lock.  Doing otherwise might trip
the assert for the wrong reason.

9 years agoCleaned up finishing syscalls
Barret Rhoden [Mon, 6 Jun 2011 19:59:50 +0000 (12:59 -0700)]
Cleaned up finishing syscalls

The name of the old signal_current_sc() was a bit misleading, and wasn't
using the same finishing code as normal syscalls.  While the latter
isn't a big deal, this might avoid issues in the future.  Regardless,
userspace needs to be careful of and not trust events (or polling) for
weird syscalls that don't return normally.

9 years agoFixes race with SC_DONE and event overflow (XCC)
Barret Rhoden [Mon, 6 Jun 2011 19:11:39 +0000 (12:11 -0700)]
Fixes race with SC_DONE and event overflow (XCC)

In VMs, or possibly with poor interrupt timing, the kernel would be
delayed such that the 2LS would deregister and handle all events before
the kernel would send an ev_msg, causing a uthread to be restarted

Rebuild your cross-compiler/glibc.

9 years agoatomic_and()
Barret Rhoden [Mon, 6 Jun 2011 19:10:09 +0000 (12:10 -0700)]

Should work for RISCV - I don't have the compiler to check yet.

9 years agoDon't touch the waiter after waking
Barret Rhoden [Fri, 3 Jun 2011 18:57:54 +0000 (11:57 -0700)]
Don't touch the waiter after waking

If the kthread runs on another core, it'll unwind its stack and
dealloc/clobber the waiter you just woke up.  Like many other places in
the code, once you wake / unlock / unblock something, don't touch it

9 years agoDon't cache pcpui across potential kthread blocks
Barret Rhoden [Fri, 3 Jun 2011 18:55:41 +0000 (11:55 -0700)]
Don't cache pcpui across potential kthread blocks

When you come back up the stack, you could be on a different core if
your kthread migrated, and your pcpui would be wrong.

9 years agoa risc-v single-core process works!!
Andrew Waterman [Sat, 4 Jun 2011 00:38:34 +0000 (17:38 -0700)]
a risc-v single-core process works!!

9 years agouser_mem_check/assert now also check for alignment
Andrew Waterman [Thu, 2 Jun 2011 20:50:36 +0000 (13:50 -0700)]
user_mem_check/assert now also check for alignment

9 years agodecoupled ULIM from KERNBASE. rebuild your xcc.
Andrew Waterman [Wed, 1 Jun 2011 11:24:31 +0000 (04:24 -0700)]
decoupled ULIM from KERNBASE.  rebuild your xcc.

now, each ros/arch/mmu.h defines ULIM individually.

apologies for not being able to test this for x86.  it does compile, at least.

9 years agoadded NOVPT option to disable VPT/UVPT mappings
Andrew Waterman [Wed, 1 Jun 2011 11:21:47 +0000 (04:21 -0700)]
added NOVPT option to disable VPT/UVPT mappings

9 years agofixes towards risc-v user programs running
Andrew Waterman [Wed, 1 Jun 2011 11:20:50 +0000 (04:20 -0700)]
fixes towards risc-v user programs running

9 years agoelf loader now mostly supports 64b elfs
Andrew Waterman [Wed, 1 Jun 2011 11:18:08 +0000 (04:18 -0700)]
elf loader now mostly supports 64b elfs

9 years agoBroken static_assert failed to catch my bug :(
Andrew Waterman [Wed, 1 Jun 2011 08:20:18 +0000 (01:20 -0700)]
Broken static_assert failed to catch my bug :(

9 years agoSynced up RISC-V build
Andrew Waterman [Wed, 1 Jun 2011 02:21:33 +0000 (19:21 -0700)]
Synced up RISC-V build

9 years agonew 64b kernel memory map (not userspace yet)
Andrew Waterman [Wed, 1 Jun 2011 02:12:02 +0000 (19:12 -0700)]
new 64b kernel memory map (not userspace yet)

in short, KERNBASE = 0xFFF8 0000 0000 0000 (the most negative 48b addr),
and KERNSIZE = L1PGSIZE (512 GB).  kernel static symbols are referenced
through the KERN_LOAD_ADDR mapping, which is the upper 2GB, i.e.
KERN_LOAD_ADDR = 0xFFFF FFFF 8000 0000.  since all addresses in this range
are canonicalized signed 32-bit numbers, kernel symbols can be referenced
with 32b sign-extended addresses, reducing code size.

9 years agoKernel message sanity checks
Barret Rhoden [Tue, 31 May 2011 18:08:14 +0000 (11:08 -0700)]
Kernel message sanity checks

Ensures the message went to the proper endpoint.  Now that the slab
allocator was fixed, this shouldn't happen again, but I can imagine
other bugs that would cause it, with crazy results.

Also added a couple other asserts / TODOs.

9 years agoKthread stack freeing is more "accurate"
Barret Rhoden [Tue, 31 May 2011 18:02:30 +0000 (11:02 -0700)]
Kthread stack freeing is more "accurate"

The old version assumed stacktop was page aligned, and PGSIZE above its
actual page.  While this ought to be true on x86, it won't always be
(like if we put the struct kthread at the top of the page) or if we
offset the stacktops per-core (a debugging technique).

9 years agoFixes ancient slab bug
Barret Rhoden [Tue, 31 May 2011 17:38:44 +0000 (10:38 -0700)]
Fixes ancient slab bug

We shouldn't have been locking at all in kmem_cache_grow().  I made it
internal, since no outsiders should be calling it either.  Had we
properly locked, we would have deadlocked and noticed this when it was
written, 2.5 years ago.

Fun fact: I found this in a storm of bugs involving massive kthreading.
It looked like kmsgs (from a slab) were getting misrouted, and multiple
cores were clobbering each others kmsgs (including the kthread*

9 years agoBacktrace reports the last entry
Barret Rhoden [Mon, 30 May 2011 20:32:25 +0000 (13:32 -0700)]
Backtrace reports the last entry

This helps for some odd debugging situations, esp since sometimes the
ebp chain is optimized out and we miss spots (like with proc_restartcore
and sysenter_callwrapper()).

9 years agoFixes some CAS loops
Barret Rhoden [Thu, 19 May 2011 21:09:36 +0000 (14:09 -0700)]
Fixes some CAS loops

The old loops were caching sysc->flags in a register.

For the uthread code, those should have been atomic reads, which forces
a re-read.  I added the cmb()s in case the code changes in the future.
In general, comp_swap technically doesn't need "memory", and any loops
using it ought to provide their own cmb()s.  Still, I put it in CAS just
to avoid future bugs.

9 years agoNMIs and cross-core trapframe inspection
Barret Rhoden [Thu, 19 May 2011 20:50:11 +0000 (13:50 -0700)]
NMIs and cross-core trapframe inspection

x86 can send NMIs, the handler for which prints the trapframe and what
function the EIP is in.  Use it from the monitor with:

ROS(Core 0)> trace coretf OS_COREID

It will work regardless of whether or not IRQs are disabled or whether
or not the core is in the kernel or userspace.

Sparc doesn't have this yet, though the stubs are there.

9 years agoKernel debugging helpers
Barret Rhoden [Thu, 19 May 2011 01:27:21 +0000 (18:27 -0700)]
Kernel debugging helpers

Moved backtrace to arch/kdebug.c, added helpers to get your function's
caller's PC (roughly), and to get the name of a function that holds a
given PC.  Sparc compiles, though doesn't support the two new helpers.

9 years agoHelpful debugging additions
Barret Rhoden [Wed, 18 May 2011 23:14:27 +0000 (16:14 -0700)]
Helpful debugging additions

Just some minor changes to the print output of slab / alarm code.  Also
removed some useless asserts from kthread, which should have gone away
when we put cur_tf in pcpui.

9 years agoMonitor prompt correctly identifies its core
Barret Rhoden [Wed, 18 May 2011 23:08:42 +0000 (16:08 -0700)]
Monitor prompt correctly identifies its core

With multiple monitors in parallel, the monitor would tell you the
prompt, then fight for the lock, and usually lose, so the prompt would
be the *other* core.

9 years agoAvoids nehalem keyboard issues, better monitors
Barret Rhoden [Wed, 18 May 2011 23:03:28 +0000 (16:03 -0700)]
Avoids nehalem keyboard issues, better monitors

My nehalem locks up if I try to read from the keyboard on any core other
than core 0.  This detects the model processor and aborts reading the KB
(assuming you have the Makelocal flag set).  Most people won't need

If you use it and you try to readline/monitor from a non-core0, you'll
need to input via the serial port, since the kernel still expects

9 years agoFixes nasty CAS bug
Barret Rhoden [Tue, 17 May 2011 21:40:57 +0000 (14:40 -0700)]
Fixes nasty CAS bug

This one would only show up if you had enough contention to cause CAS to
fail, at which point eax was clobbered, and if the number you were
working on was > 255, such as when you have 300-500 kthreads.  Goddamn.

9 years agoAlarm fixes
Barret Rhoden [Fri, 13 May 2011 22:07:33 +0000 (15:07 -0700)]
Alarm fixes

Three things:
1) previous versions screwed up if you tried to set an alarm with the
same time as the last item (it can happen legitimately too!).
2) cleaned up set_alarm(), so it's much clearer how it works and handles
the possible cases.  No longer tries to infer the state of the TAILQ by
looking at the start/end times, which was confusing.
3) adds a bunch of assertions to catch weird or uninitialized values.

Note the TSC takes over 200 years to loop (or my basic arithmetic is

9 years agoHandles syscall-event overflow in pthreads
Barret Rhoden [Thu, 12 May 2011 01:29:36 +0000 (18:29 -0700)]
Handles syscall-event overflow in pthreads

Most 2LSs that handle blocking threads and syscalls like pthreads will
need to do something similar.  Actually, they'll need to do something
more advanced!

This code knows how to recover from event overflow, which means that the
event message containing the struct syscall * was lost.

Recovery is a bit expensive, I think, so under heavy amounts of lost
messages, we'll want to do something smarter, like switch to a polling
mechanism, or find a way to use larger BCQs.

9 years agoFixes race-bug in overflow/bit event handling
Barret Rhoden [Wed, 11 May 2011 23:23:07 +0000 (16:23 -0700)]
Fixes race-bug in overflow/bit event handling

Need to check ev_overflows after checking the bit.  The bit handlers run
after checking the bit (which is handled in the FOREACH_SET).

9 years agoMinor fix in user bitmask functions (XCC)
Barret Rhoden [Wed, 11 May 2011 22:42:54 +0000 (15:42 -0700)]
Minor fix in user bitmask functions (XCC)

You'll need to reinstall these headers into your cross compiler paths,
either manually or by recompiling your cross compiler.  It's not a big
deal, unless you try to PRINT_BITMASK, so feel free to hold off.

9 years agoqueue "SAFE" ops for userspace (XCC)
Barret Rhoden [Tue, 10 May 2011 18:22:39 +0000 (11:22 -0700)]
queue "SAFE" ops for userspace (XCC)

This is just a more up-to-date sys/queue.h that has the FOREACH_SAFE
ops, allowing you to remove the item from within the for loop.  The
kernel has been using these for a while now.

Rebuild your cross compiler, or at least put the new queue.h in your
XCC headers.

9 years agoRISC-V SMP boot works
Andrew Waterman [Sat, 28 May 2011 06:33:53 +0000 (23:33 -0700)]
RISC-V SMP boot works

this commit won't compile because i'm not committing a change to the mainline
that changes the memory layout without further consultation

9 years agofixed printd() bugs when DEBUG is defined
Andrew Waterman [Sat, 28 May 2011 06:29:17 +0000 (23:29 -0700)]
fixed printd() bugs when DEBUG is defined

9 years agoRISC-V port mostly links now
Andrew Waterman [Fri, 27 May 2011 09:57:58 +0000 (02:57 -0700)]
RISC-V port mostly links now

9 years agoInitial commit of RISC-V architecture port
Andrew Waterman [Mon, 23 May 2011 09:19:57 +0000 (02:19 -0700)]
Initial commit of RISC-V architecture port

It builds but doesn't link and is missing key functionality, like
env/process/pmap stuff.

9 years ago32b/64b compatibility fixes
Andrew Waterman [Mon, 23 May 2011 09:18:40 +0000 (02:18 -0700)]
32b/64b compatibility fixes

In a few places, types like int or uint32_t were used when the intent
was to use a type as wide as a machine register or a pointer.
I replaced these mostly with uintptr_t.

9 years agoFixes (unused) bug in get_event_type()
Barret Rhoden [Mon, 9 May 2011 20:54:10 +0000 (13:54 -0700)]
Fixes (unused) bug in get_event_type()

No one really uses this function (msr_dumb_while and eth_audio), but
neither of those really know what they are doing / do the right thing.
I don't recomment using get_event_type() anyway, but we'll keep it
around in case we need the helper in the future.

9 years agoSlab allocator locks are now irqsave
Barret Rhoden [Mon, 9 May 2011 20:43:36 +0000 (13:43 -0700)]
Slab allocator locks are now irqsave

Kernel messages call into the slab allocator, which can occur from
both inside and outside interrupt context.

9 years agouva2kva() - Does a page table walk to convert
Barret Rhoden [Mon, 9 May 2011 20:12:52 +0000 (13:12 -0700)]
uva2kva() - Does a page table walk to convert

Useful for debugging.  Also added a brief, unrelated note in blockdev
(no issue there, AFAIK).

9 years agoFixes event BCQ bug
Barret Rhoden [Mon, 9 May 2011 20:10:18 +0000 (13:10 -0700)]
Fixes event BCQ bug

BCQs must have a power-of-two number of elements.  Humorously enough,
this has been fucked up for a long time.  The critical fix is in
k/i/r/event.h.  Everything else is some extra debugging / testing code.

9 years agoFixes nasty kthread bug
Barret Rhoden [Fri, 6 May 2011 01:43:41 +0000 (18:43 -0700)]
Fixes nasty kthread bug

We were freeing the stack we were about to use, which is a bad idea.
Bug showed up as TAILQ corruption (often PFs) in alarm code, and once a
non-empty semaphore in a waiter in sys_block().  The "freed" stack was
being reused for the exact same code path (another sys_block), and
occasionally for other syscalls with a deeper stack (clobbering the LL

9 years agoAlarm debugging tools
Barret Rhoden [Fri, 6 May 2011 01:42:26 +0000 (18:42 -0700)]
Alarm debugging tools

Can see which waiters are running on all cores via the monitor.  I'll
probably add a lot more to this, but it's quite useful already!

9 years agoUser can set how long sys_block() sleeps
Barret Rhoden [Thu, 5 May 2011 18:41:05 +0000 (11:41 -0700)]
User can set how long sys_block() sleeps

9 years agoFixed corner case with alarm rel_time
Barret Rhoden [Thu, 5 May 2011 01:26:43 +0000 (18:26 -0700)]
Fixed corner case with alarm rel_time

With rounding errors when time > now, you could get rel_time == 0, which
shuts off the alarm.

For those curious, the time on hardware to set a 1 usec alarm, sleep on
it, and wake back up is around 3.1 usec, depending on cache hotness.

9 years agoArch independent per-cpu initialization
Barret Rhoden [Wed, 4 May 2011 23:16:07 +0000 (16:16 -0700)]
Arch independent per-cpu initialization

Put the common stuff in k/s/smp.c, and the arch dependent stuff in