Rename RCU CB context to 'cannot block' context
[akaros.git] / kern / src / ns / chan.c
1 /* Copyright © 1994-1999 Lucent Technologies Inc.  All rights reserved.
2  * Portions Copyright © 1997-1999 Vita Nuova Limited
3  * Portions Copyright © 2000-2007 Vita Nuova Holdings Limited
4  *                                (www.vitanuova.com)
5  * Revisions Copyright © 2000-2007 Lucent Technologies Inc. and others
6  *
7  * Modified for the Akaros operating system:
8  * Copyright (c) 2013-2014 The Regents of the University of California
9  * Copyright (c) 2013-2015 Google Inc.
10  *
11  * Permission is hereby granted, free of charge, to any person obtaining a copy
12  * of this software and associated documentation files (the "Software"), to deal
13  * in the Software without restriction, including without limitation the rights
14  * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
15  * copies of the Software, and to permit persons to whom the Software is
16  * furnished to do so, subject to the following conditions:
17  *
18  * The above copyright notice and this permission notice shall be included in
19  * all copies or substantial portions of the Software.
20  *
21  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
22  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
23  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL THE
24  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
25  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
26  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
27  * SOFTWARE. */
28
29 #include <slab.h>
30 #include <kmalloc.h>
31 #include <kref.h>
32 #include <string.h>
33 #include <stdio.h>
34 #include <assert.h>
35 #include <error.h>
36 #include <cpio.h>
37 #include <pmap.h>
38 #include <smp.h>
39 #include <syscall.h>
40
41 struct chan *kern_slash;
42
43 char *channame(struct chan *c)
44 {       /* DEBUGGING */
45         if (c == NULL)
46                 return "<NULL chan>";
47         if (c->name == NULL)
48                 return "<NULL name>";
49         if (c->name->s == NULL)
50                 return "<NULL name.s>";
51         return c->name->s;
52 }
53
54 enum {
55         CNAMESLOP = 20
56 };
57
58 struct {
59         spinlock_t lock;
60         int fid;
61         struct chan *free;
62         struct chan *list;
63 } chanalloc;
64
65 typedef struct Elemlist Elemlist;
66
67 struct Elemlist {
68         char *name;                                     /* copy of name, so '/' can be overwritten */
69         int ARRAY_SIZEs;
70         char **elems;
71         int *off;
72         int mustbedir;
73 };
74
75 struct walk_helper {
76         bool can_mount;
77         bool no_follow;
78         unsigned int nr_loops;
79 };
80 #define WALK_MAX_NR_LOOPS 8
81
82 static struct chan *walk_symlink(struct chan *symlink, struct walk_helper *wh,
83                                  unsigned int nr_names_left);
84
85 #define SEP(c) ((c) == 0 || (c) == '/')
86 void cleancname(struct cname *);
87
88 int isdotdot(char *p)
89 {
90         return p[0] == '.' && p[1] == '.' && p[2] == '\0';
91 }
92
93 int emptystr(char *s)
94 {
95         if (s == NULL)
96                 return 1;
97         if (s[0] == '\0')
98                 return 1;
99         return 0;
100 }
101
102 /*
103  * Atomically replace *p with copy of s
104  */
105 void kstrdup(char **p, char *s)
106 {
107         int n;
108         char *t, *prev;
109
110         n = strlen(s) + 1;
111         /* if it's a user, we can wait for memory; if not, something's very wrong */
112         if (current) {
113                 t = kzmalloc(n, 0);
114         } else {
115                 t = kzmalloc(n, 0);
116                 if (t == NULL)
117                         panic("kstrdup: no memory");
118         }
119         memmove(t, s, n);
120         prev = *p;
121         *p = t;
122         kfree(prev);
123 }
124
125 void chandevreset(void)
126 {
127         int i;
128
129         for (i = 0; &devtab[i] < __devtabend; i++) {
130                 if (devtab[i].reset)
131                         devtab[i].reset();
132         }
133 }
134
135 void chandevinit(void)
136 {
137         int i;
138
139         for (i = 0; &devtab[i] < __devtabend; i++) {
140                 if (devtab[i].init)
141                         devtab[i].init();
142         }
143 }
144
145 void chandevshutdown(void)
146 {
147         int i;
148
149         /* shutdown in reverse order */
150         for (i = 0; &devtab[i] < __devtabend; i++) ;
151         for (i--; i >= 0; i--) {
152                 if (devtab[i].shutdown)
153                         devtab[i].shutdown();
154         }
155 }
156
157 static void chan_release(struct kref *kref)
158 {
159         struct chan *c = container_of(kref, struct chan, ref);
160         ERRSTACK(1);
161
162         /* We can be called from RCU callbacks, but close methods can block.  In
163          * those cases, and any other context that cannot block, we need to defer
164          * our work to a kernel message. */
165         if (!can_block(this_pcpui_ptr())) {
166                 run_as_rkm(chan_release, kref);
167                 return;
168         }
169         /* this style discards the error from close().  picture it as
170          * if (waserror()) { } else { close(); } chanfree_no_matter_what();  */
171         if (!waserror()) {
172                 printd("releasing chan %p, type %d\n", c, c->type);
173                 /* -1 means there is no dev yet.  wants a noop for close() */
174                 if (c->type != -1)
175                         devtab[c->type].close(c);
176         }
177         /* need to poperror regardless of whether we error'd or not */
178         poperror();
179         /* and chan free no matter what */
180         chanfree(c);
181 }
182
183 struct chan *newchan(void)
184 {
185         struct chan *c;
186
187         spin_lock(&(&chanalloc)->lock);
188         c = chanalloc.free;
189         if (c != 0)
190                 chanalloc.free = c->next;
191         spin_unlock(&(&chanalloc)->lock);
192
193         if (c == NULL) {
194                 c = kzmalloc(sizeof(struct chan), 0);
195                 spin_lock(&(&chanalloc)->lock);
196                 c->fid = ++chanalloc.fid;
197                 c->link = chanalloc.list;
198                 chanalloc.list = c;
199                 spin_unlock(&(&chanalloc)->lock);
200                 spinlock_init(&c->lock);
201                 qlock_init(&c->umqlock);
202         }
203
204         /* if you get an error before associating with a dev, cclose skips calling
205          * the dev's close */
206         c->type = -1;
207         c->flag = 0;
208         kref_init(&c->ref, chan_release, 1);
209         c->dev = 0;
210         c->offset = 0;
211         c->iounit = 0;
212         c->umh = 0;
213         c->uri = 0;
214         c->dri = 0;
215         c->aux = 0;
216         c->mchan = 0;
217         c->mcp = 0;
218         c->mux = 0;
219         c->mqid.path = 0;
220         c->mqid.vers = 0;
221         c->mqid.type = 0;
222         c->name = 0;
223         c->buf = NULL;
224         c->mountpoint = NULL;
225         return c;
226 }
227
228 static void __cname_release(struct kref *kref)
229 {
230         struct cname *n = container_of(kref, struct cname, ref);
231         kfree(n->s);
232         kfree(n);
233 }
234
235 struct cname *newcname(char *s)
236 {
237         struct cname *n;
238         int i;
239
240         n = kzmalloc(sizeof(*n), 0);
241         i = strlen(s);
242         n->len = i;
243         n->alen = i + CNAMESLOP;
244         n->s = kzmalloc(n->alen, 0);
245         memmove(n->s, s, i + 1);
246         kref_init(&n->ref, __cname_release, 1);
247         return n;
248 }
249
250 void cnameclose(struct cname *n)
251 {
252         if (n == NULL)
253                 return;
254         kref_put(&n->ref);
255 }
256
257 struct cname *addelem(struct cname *n, char *s)
258 {
259         int i, a;
260         char *t;
261         struct cname *new;
262
263         if (s[0] == '.' && s[1] == '\0')
264                 return n;
265
266         if (kref_refcnt(&n->ref) > 1) {
267                 /* copy on write */
268                 new = newcname(n->s);
269                 cnameclose(n);
270                 n = new;
271         }
272
273         i = strlen(s);
274         if (n->len + 1 + i + 1 > n->alen) {
275                 a = n->len + 1 + i + 1 + CNAMESLOP;
276                 t = kzmalloc(a, 0);
277                 memmove(t, n->s, n->len + 1);
278                 kfree(n->s);
279                 n->s = t;
280                 n->alen = a;
281         }
282         if (n->len > 0 && n->s[n->len - 1] != '/' && s[0] != '/')       /* don't insert extra slash if one is present */
283                 n->s[n->len++] = '/';
284         memmove(n->s + n->len, s, i + 1);
285         n->len += i;
286         if (isdotdot(s))
287                 cleancname(n);
288         return n;
289 }
290
291 void chanfree(struct chan *c)
292 {
293         c->flag = CFREE;
294
295         if (c->umh != NULL) {
296                 putmhead(c->umh);
297                 c->umh = NULL;
298         }
299         if (c->umc != NULL) {
300                 cclose(c->umc);
301                 c->umc = NULL;
302         }
303         if (c->mux != NULL) {
304                 //
305                 muxclose(c->mux);
306                 c->mux = NULL;
307         }
308         if (c->mchan != NULL) {
309                 cclose(c->mchan);
310                 c->mchan = NULL;
311         }
312
313         cnameclose(c->name);
314         if (c->buf)
315                 kfree(c->buf);
316         c->buf = NULL;
317         c->bufused = 0;
318         c->ateof = 0;
319
320         spin_lock(&(&chanalloc)->lock);
321         c->next = chanalloc.free;
322         chanalloc.free = c;
323         spin_unlock(&(&chanalloc)->lock);
324 }
325
326 void cclose(struct chan *c)
327 {
328         if (c == 0)
329                 return;
330
331         if (c->flag & CFREE)
332                 panic("cclose %p", getcallerpc(&c));
333
334         kref_put(&c->ref);
335 }
336
337 /* convenience wrapper for interposition.  if you do use this, don't forget
338  * about the kref_get_not_zero in plan9setup() */
339 void chan_incref(struct chan *c)
340 {
341         kref_get(&c->ref, 1);
342 }
343
344 /*
345  * Make sure we have the only copy of c.  (Copy on write.)
346  */
347 struct chan *cunique(struct chan *c)
348 {
349         struct chan *nc;
350
351         if (kref_refcnt(&c->ref) != 1) {
352                 nc = cclone(c);
353                 cclose(c);
354                 c = nc;
355         }
356
357         return c;
358 }
359
360 int eqqid(struct qid a, struct qid b)
361 {
362         return a.path == b.path && a.vers == b.vers;
363 }
364
365 int eqchan(struct chan *a, struct chan *b, int pathonly)
366 {
367         if (a->qid.path != b->qid.path)
368                 return 0;
369         if (!pathonly && a->qid.vers != b->qid.vers)
370                 return 0;
371         if (a->type != b->type)
372                 return 0;
373         if (a->dev != b->dev)
374                 return 0;
375         return 1;
376 }
377
378 int eqchantdqid(struct chan *a, int type, int dev, struct qid qid, int pathonly)
379 {
380         if (a->qid.path != qid.path)
381                 return 0;
382         if (!pathonly && a->qid.vers != qid.vers)
383                 return 0;
384         if (a->type != type)
385                 return 0;
386         if (a->dev != dev)
387                 return 0;
388         return 1;
389 }
390
391 static void mh_release(struct kref *kref)
392 {
393         struct mhead *mh = container_of(kref, struct mhead, ref);
394         mh->mount = (struct mount *)0xCafeBeef;
395         kfree(mh);
396 }
397
398 struct mhead *newmhead(struct chan *from)
399 {
400         struct mhead *mh;
401
402         mh = kzmalloc(sizeof(struct mhead), 0);
403         kref_init(&mh->ref, mh_release, 1);
404         rwinit(&mh->lock);
405         mh->from = from;
406         chan_incref(from);
407
408 /*
409         n = from->name->len;
410         if(n >= sizeof(mh->fromname))
411                 n = sizeof(mh->fromname)-1;
412         memmove(mh->fromname, from->name->s, n);
413         mh->fromname[n] = 0;
414 */
415         return mh;
416 }
417
418 int cmount(struct chan *new, struct chan *old, int flag, char *spec)
419 {
420         ERRSTACK(1);
421         struct pgrp *pg;
422         int order, flg;
423         struct mhead *m, **l, *mh;
424         struct mount *nm, *f, *um, **h;
425
426         /* Can bind anything onto a symlink's name.  Otherwise, both the old and the
427          * new must agree on whether or not it is a directory. */
428         if (!(old->qid.type & QTSYMLINK) &&
429             (QTDIR & (old->qid.type ^ new->qid.type)))
430                 error(EINVAL, ERROR_FIXME);
431
432         if (old->umh)
433                 printd("cmount old extra umh\n");
434
435         order = flag & MORDER;
436
437         if ((old->qid.type & QTDIR) == 0 && order != MREPL)
438                 error(EINVAL, ERROR_FIXME);
439
440         mh = new->umh;
441
442         /*
443          * Not allowed to bind when the old directory
444          * is itself a union.  (Maybe it should be allowed, but I don't see
445          * what the semantics would be.)
446          *
447          * We need to check mh->mount->next to tell unions apart from
448          * simple mount points, so that things like
449          *  mount -c fd /root
450          *  bind -c /root /
451          * work.  The check of mount->mflag catches things like
452          *  mount fd /root
453          *  bind -c /root /
454          *
455          * This is far more complicated than it should be, but I don't
456          * see an easier way at the moment.     -rsc
457          */
458         if ((flag & MCREATE) && mh && mh->mount
459                 && (mh->mount->next || !(mh->mount->mflag & MCREATE)))
460                 error(EEXIST, ERROR_FIXME);
461
462         pg = current->pgrp;
463         wlock(&pg->ns);
464
465         l = &MOUNTH(pg, old->qid);
466         for (m = *l; m; m = m->hash) {
467                 if (eqchan(m->from, old, 1))
468                         break;
469                 l = &m->hash;
470         }
471
472         if (m == NULL) {
473                 /*
474                  *  nothing mounted here yet.  create a mount
475                  *  head and add to the hash table.
476                  */
477                 m = newmhead(old);
478                 *l = m;
479
480                 /*
481                  *  if this is a union mount, add the old
482                  *  node to the mount chain.
483                  */
484                 if (order != MREPL)
485                         m->mount = newmount(m, old, 0, 0);
486         }
487         wlock(&m->lock);
488         if (waserror()) {
489                 wunlock(&m->lock);
490                 nexterror();
491         }
492         wunlock(&pg->ns);
493
494         nm = newmount(m, new, flag, spec);
495         if (mh != NULL && mh->mount != NULL) {
496                 /*
497                  *  copy a union when binding it onto a directory
498                  */
499                 flg = order;
500                 if (order == MREPL)
501                         flg = MAFTER;
502                 h = &nm->next;
503                 um = mh->mount;
504                 for (um = um->next; um; um = um->next) {
505                         f = newmount(m, um->to, flg, um->spec);
506                         *h = f;
507                         h = &f->next;
508                 }
509         }
510
511         if (m->mount && order == MREPL) {
512                 mountfree(m->mount);
513                 m->mount = 0;
514         }
515
516         if (flag & MCREATE)
517                 nm->mflag |= MCREATE;
518
519         if (m->mount && order == MAFTER) {
520                 for (f = m->mount; f->next; f = f->next) ;
521                 f->next = nm;
522         } else {
523                 for (f = nm; f->next; f = f->next) ;
524                 f->next = m->mount;
525                 m->mount = nm;
526         }
527
528         wunlock(&m->lock);
529         poperror();
530         return nm->mountid;
531 }
532
533 void cunmount(struct chan *mnt, struct chan *mounted)
534 {
535         struct pgrp *pg;
536         struct mhead *m, **l;
537         struct mount *f, **p;
538
539         if (mnt->umh)   /* should not happen */
540                 printd("cunmount newp extra umh %p has %p\n", mnt, mnt->umh);
541
542         /*
543          * It _can_ happen that mounted->umh is non-NULL,
544          * because mounted is the result of namec(Aopen)
545          * (see sysfile.c:/^sysunmount).
546          * If we open a union directory, it will have a umh.
547          * Although surprising, this is okay, since the
548          * cclose will take care of freeing the umh.
549          */
550
551         pg = current->pgrp;
552         wlock(&pg->ns);
553
554         l = &MOUNTH(pg, mnt->qid);
555         for (m = *l; m; m = m->hash) {
556                 if (eqchan(m->from, mnt, 1))
557                         break;
558                 l = &m->hash;
559         }
560
561         if (m == 0) {
562                 wunlock(&pg->ns);
563                 error(ENOENT, ERROR_FIXME);
564         }
565
566         wlock(&m->lock);
567         if (mounted == 0) {
568                 *l = m->hash;
569                 wunlock(&pg->ns);
570                 mountfree(m->mount);
571                 m->mount = NULL;
572                 cclose(m->from);
573                 wunlock(&m->lock);
574                 putmhead(m);
575                 return;
576         }
577
578         p = &m->mount;
579         for (f = *p; f; f = f->next) {
580                 /* BUG: Needs to be 2 pass */
581                 if (eqchan(f->to, mounted, 1) ||
582                         (f->to->mchan && eqchan(f->to->mchan, mounted, 1))) {
583                         *p = f->next;
584                         f->next = 0;
585                         mountfree(f);
586                         if (m->mount == NULL) {
587                                 *l = m->hash;
588                                 cclose(m->from);
589                                 wunlock(&m->lock);
590                                 wunlock(&pg->ns);
591                                 putmhead(m);
592                                 return;
593                         }
594                         wunlock(&m->lock);
595                         wunlock(&pg->ns);
596                         return;
597                 }
598                 p = &f->next;
599         }
600         wunlock(&m->lock);
601         wunlock(&pg->ns);
602         error(ENOENT, ERROR_FIXME);
603 }
604
605 struct chan *cclone(struct chan *c)
606 {
607         struct chan *nc;
608         struct walkqid *wq;
609
610         wq = devtab[c->type].walk(c, NULL, NULL, 0);
611         if (wq == NULL)
612                 error(EFAIL, "clone failed");
613         nc = wq->clone;
614         kfree(wq);
615         nc->name = c->name;
616         if (c->name)
617                 kref_get(&c->name->ref, 1);
618         return nc;
619 }
620
621 /* Helper: is something mounted on the chan? */
622 static bool is_mount_point(struct chan *c)
623 {
624         struct pgrp *pg;
625         struct mhead *m;
626         int type = c->type;
627         int dev = c->dev;
628         struct qid qid = c->qid;
629
630         if (!current)
631                 return false;
632         pg = current->pgrp;
633         rlock(&pg->ns);
634         for (m = MOUNTH(pg, qid); m; m = m->hash) {
635                 rlock(&m->lock);
636                 if (!m->from) {
637                         runlock(&m->lock);
638                         continue;
639                 }
640                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
641                         runlock(&m->lock);
642                         runlock(&pg->ns);
643                         return true;
644                 }
645                 runlock(&m->lock);
646         }
647         runlock(&pg->ns);
648         return false;
649 }
650
651 int
652 findmount(struct chan **cp,
653                   struct mhead **mp, int type, int dev, struct qid qid)
654 {
655         struct pgrp *pg;
656         struct mhead *m;
657
658         if (!current)
659                 return 0;
660         pg = current->pgrp;
661         rlock(&pg->ns);
662         for (m = MOUNTH(pg, qid); m; m = m->hash) {
663                 rlock(&m->lock);
664                 if (m->from == NULL) {
665                         printd("m %p m->from 0\n", m);
666                         runlock(&m->lock);
667                         continue;
668                 }
669                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
670                         runlock(&pg->ns);
671                         if (mp != NULL) {
672                                 kref_get(&m->ref, 1);
673                                 if (*mp != NULL)
674                                         putmhead(*mp);
675                                 *mp = m;
676                         }
677                         if (*cp != NULL)
678                                 cclose(*cp);
679                         chan_incref(m->mount->to);
680                         *cp = m->mount->to;
681                         runlock(&m->lock);
682                         return 1;
683                 }
684                 runlock(&m->lock);
685         }
686
687         runlock(&pg->ns);
688         return 0;
689 }
690
691 int domount(struct chan **cp, struct mhead **mp)
692 {
693         return findmount(cp, mp, (*cp)->type, (*cp)->dev, (*cp)->qid);
694 }
695
696 struct chan *undomount(struct chan *c, struct cname *name)
697 {
698         ERRSTACK(1);
699         struct chan *nc;
700         struct pgrp *pg;
701         struct mount *t;
702         struct mhead **h, **he, *f;
703
704         if (!current)
705                 return c;
706         pg = current->pgrp;
707         rlock(&pg->ns);
708         if (waserror()) {
709                 runlock(&pg->ns);
710                 nexterror();
711         }
712
713         he = &pg->mnthash[MNTHASH];
714         for (h = pg->mnthash; h < he; h++) {
715                 for (f = *h; f; f = f->hash) {
716                         if (strcmp(f->from->name->s, name->s) != 0)
717                                 continue;
718                         for (t = f->mount; t; t = t->next) {
719                                 if (eqchan(c, t->to, 1)) {
720                                         /*
721                                          * We want to come out on the left hand side of the mount
722                                          * point using the element of the union that we entered on.
723                                          * To do this, find the element that has a from name of
724                                          * c->name->s.
725                                          */
726                                         if (strcmp(t->head->from->name->s, name->s) != 0)
727                                                 continue;
728                                         nc = t->head->from;
729                                         chan_incref(nc);
730                                         cclose(c);
731                                         c = nc;
732                                         break;
733                                 }
734                         }
735                 }
736         }
737         poperror();
738         runlock(&pg->ns);
739         return c;
740 }
741
742 /*
743  * Either walks all the way or not at all.  No partial results in *cp.
744  * *nerror is the number of names to display in an error message.
745  */
746 int walk(struct chan **cp, char **names, int nnames, struct walk_helper *wh,
747          int *nerror)
748 {
749         int dev, dotdot, i, n, nhave, ntry, type;
750         struct chan *c, *nc, *lastmountpoint = NULL;
751         struct cname *cname;
752         struct mount *f;
753         struct mhead *mh, *nmh;
754         struct walkqid *wq;
755
756         c = *cp;
757         chan_incref(c);
758         cname = c->name;
759         kref_get(&cname->ref, 1);
760         mh = NULL;
761
762         /*
763          * While we haven't gotten all the way down the path:
764          *    1. step through a mount point, if any
765          *    2. send a walk request for initial dotdot or initial prefix without dotdot
766          *    3. move to the first mountpoint along the way.
767          *    4. repeat.
768          *
769          * An invariant is that each time through the loop, c is on the undomount
770          * side of the mount point, and c's name is cname.
771          */
772         for (nhave = 0; nhave < nnames; nhave += n) {
773                 /* We only allow symlink when they are first and it's .. (see below) */
774                 if ((c->qid.type & (QTDIR | QTSYMLINK)) == 0) {
775                         if (nerror)
776                                 *nerror = nhave;
777                         cnameclose(cname);
778                         cclose(c);
779                         set_error(ENOTDIR, ERROR_FIXME);
780                         if (mh != NULL)
781                                 putmhead(mh);
782                         return -1;
783                 }
784                 ntry = nnames - nhave;
785                 if (ntry > MAXWELEM)
786                         ntry = MAXWELEM;
787                 dotdot = 0;
788                 for (i = 0; i < ntry; i++) {
789                         if (isdotdot(names[nhave + i])) {
790                                 if (i == 0) {
791                                         dotdot = 1;
792                                         ntry = 1;
793                                 } else
794                                         ntry = i;
795                                 break;
796                         }
797                 }
798
799                 if (!dotdot && wh->can_mount)
800                         domount(&c, &mh);
801                 /* Bug - the only time we walk from a symlink should be during
802                  * walk_symlink, which should have given us a dotdot. */
803                 if ((c->qid.type & QTSYMLINK) && !dotdot)
804                         panic("Got a walk from a symlink that wasn't ..!");
805
806                 type = c->type;
807                 dev = c->dev;
808
809                 if ((wq = devtab[type].walk(c, NULL, names + nhave, ntry)) == NULL) {
810                         /* try a union mount, if any */
811                         if (mh && wh->can_mount) {
812                                 /*
813                                  * mh->mount == c, so start at mh->mount->next
814                                  */
815                                 rlock(&mh->lock);
816                                 for (f = mh->mount->next; f; f = f->next)
817                                         if ((wq =
818                                                  devtab[f->to->type].walk(f->to, NULL, names + nhave,
819                                                                                                   ntry)) != NULL)
820                                                 break;
821                                 runlock(&mh->lock);
822                                 if (f != NULL) {
823                                         type = f->to->type;
824                                         dev = f->to->dev;
825                                 }
826                         }
827                         if (wq == NULL) {
828                                 cclose(c);
829                                 cnameclose(cname);
830                                 if (nerror)
831                                         *nerror = nhave + 1;
832                                 if (mh != NULL)
833                                         putmhead(mh);
834                                 return -1;
835                         }
836                 }
837
838                 nmh = NULL;
839                 if (dotdot) {
840                         assert(wq->nqid == 1);
841                         assert(wq->clone != NULL);
842
843                         cname = addelem(cname, "..");
844                         nc = undomount(wq->clone, cname);
845                         n = 1;
846                 } else {
847                         nc = NULL;
848                         if (wh->can_mount)
849                                 for (i = 0; i < wq->nqid && i < ntry - 1; i++)
850                                         if (findmount(&nc, &nmh, type, dev, wq->qid[i]))
851                                                 break;
852                         if (nc == NULL) {       /* no mount points along path */
853                                 if (wq->clone == NULL) {
854                                         cclose(c);
855                                         cnameclose(cname);
856                                         if (wq->nqid == 0 || (wq->qid[wq->nqid - 1].type & QTDIR)) {
857                                                 if (nerror)
858                                                         *nerror = nhave + wq->nqid + 1;
859                                                 set_error(ENOENT, "walk failed");
860                                         } else {
861                                                 if (nerror)
862                                                         *nerror = nhave + wq->nqid;
863                                                 set_error(ENOTDIR, "walk failed");
864                                         }
865                                         kfree(wq);
866                                         if (mh != NULL)
867                                                 putmhead(mh);
868                                         return -1;
869                                 }
870                                 n = wq->nqid;
871                                 if (wq->clone->qid.type & QTSYMLINK) {
872                                         nc = walk_symlink(wq->clone, wh, nnames - nhave - n);
873                                         if (!nc) {
874                                                 /* walk_symlink() set error.  This seems to be the
875                                                  * standard walk() error-cleanup. */
876                                                 if (nerror)
877                                                         *nerror = nhave + wq->nqid;
878                                                 cclose(c);
879                                                 cclose(wq->clone);
880                                                 cnameclose(cname);
881                                                 kfree(wq);
882                                                 if (mh != NULL)
883                                                         putmhead(mh);
884                                                 return -1;
885                                         }
886                                 } else {
887                                         nc = wq->clone;
888                                 }
889                         } else {        /* stopped early, at a mount point */
890                                 if (wq->clone != NULL) {
891                                         cclose(wq->clone);
892                                         wq->clone = NULL;
893                                 }
894                                 lastmountpoint = nc;
895                                 n = i + 1;
896                         }
897                         for (i = 0; i < n; i++)
898                                 cname = addelem(cname, names[nhave + i]);
899                 }
900                 cclose(c);
901                 c = nc;
902                 putmhead(mh);
903                 mh = nmh;
904                 kfree(wq);
905         }
906
907         putmhead(mh);
908
909         c = cunique(c);
910
911         if (c->umh != NULL) {   //BUG
912                 printd("walk umh\n");
913                 putmhead(c->umh);
914                 c->umh = NULL;
915         }
916
917         cnameclose(c->name);
918         c->name = cname;
919         c->mountpoint = lastmountpoint;
920
921         cclose(*cp);
922         *cp = c;
923         if (nerror)
924                 *nerror = 0;
925         return 0;
926 }
927
928 /*
929  * c is a mounted non-creatable directory.  find a creatable one.
930  */
931 struct chan *createdir(struct chan *c, struct mhead *m)
932 {
933         ERRSTACK(1);
934         struct chan *nc;
935         struct mount *f;
936
937         rlock(&m->lock);
938         if (waserror()) {
939                 runlock(&m->lock);
940                 nexterror();
941         }
942         for (f = m->mount; f; f = f->next) {
943                 if (f->mflag & MCREATE) {
944                         nc = cclone(f->to);
945                         runlock(&m->lock);
946                         poperror();
947                         cclose(c);
948                         return nc;
949                 }
950         }
951         error(EPERM, ERROR_FIXME);
952         poperror();
953         return 0;
954 }
955
956 /*
957  * In place, rewrite name to compress multiple /, eliminate ., and process ..
958  */
959 void cleancname(struct cname *n)
960 {
961         char *p;
962
963         if (n->s[0] == '#') {
964                 p = strchr(n->s, '/');
965                 if (p == NULL)
966                         return;
967                 cleanname(p);
968
969                 /*
970                  * The correct name is #i rather than #i/,
971                  * but the correct name of #/ is #/.
972                  */
973                 if (strcmp(p, "/") == 0 && n->s[1] != '/')
974                         *p = '\0';
975         } else
976                 cleanname(n->s);
977         n->len = strlen(n->s);
978 }
979
980 static void growparse(Elemlist * e)
981 {
982         char **new;
983         int *inew;
984         enum { Delta = 8 };
985
986         if (e->ARRAY_SIZEs % Delta == 0) {
987                 new = kzmalloc((e->ARRAY_SIZEs + Delta) * sizeof(char *), 0);
988                 memmove(new, e->elems, e->ARRAY_SIZEs * sizeof(char *));
989                 kfree(e->elems);
990                 e->elems = new;
991                 inew = kzmalloc((e->ARRAY_SIZEs + Delta + 1) * sizeof(int), 0);
992                 memmove(inew, e->off, e->ARRAY_SIZEs * sizeof(int));
993                 kfree(e->off);
994                 e->off = inew;
995         }
996 }
997
998 /*
999  * The name is known to be valid.
1000  * Copy the name so slashes can be overwritten.
1001  * An empty string will set ARRAY_SIZE=0.
1002  * A path ending in / or /. or /.//./ etc. will have
1003  * e.mustbedir = 1, so that we correctly
1004  * reject, e.g., "/adm/users/." when /adm/users is a file
1005  * rather than a directory.
1006  */
1007 static void parsename(char *name, Elemlist * e)
1008 {
1009         char *slash;
1010
1011         kstrdup(&e->name, name);
1012         name = e->name;
1013         e->ARRAY_SIZEs = 0;
1014         e->elems = NULL;
1015         e->off = kzmalloc(sizeof(int), 0);
1016         e->off[0] = skipslash(name) - name;
1017         for (;;) {
1018                 name = skipslash(name);
1019                 if (*name == '\0') {
1020                         e->mustbedir = 1;
1021                         break;
1022                 }
1023                 growparse(e);
1024
1025                 e->elems[e->ARRAY_SIZEs++] = name;
1026                 /* we may want to do this again some day
1027                    slash = utfrune(name, '/');
1028                  */
1029                 slash = strchr(name, '/');
1030                 if (slash == NULL) {
1031                         e->off[e->ARRAY_SIZEs] = name + strlen(name) - e->name;
1032                         e->mustbedir = 0;
1033                         break;
1034                 }
1035                 e->off[e->ARRAY_SIZEs] = slash - e->name;
1036                 *slash++ = '\0';
1037                 name = slash;
1038         }
1039 }
1040
1041 void *memrchr(void *va, int c, long n)
1042 {
1043         uint8_t *a, *e;
1044
1045         a = va;
1046         for (e = a + n - 1; e > a; e--)
1047                 if (*e == c)
1048                         return e;
1049         return NULL;
1050 }
1051
1052 /*
1053  * Turn a name into a channel.
1054  * &name[0] is known to be a valid address.  It may be a kernel address.
1055  *
1056  * Opening with amode Aopen, Acreate, or Aremove guarantees
1057  * that the result will be the only reference to that particular fid.
1058  * This is necessary since we might pass the result to
1059  * devtab[].remove().
1060  *
1061  * Opening Atodir, Amount, or Aaccess does not guarantee this.
1062  *
1063  * Opening Aaccess can, under certain conditions, return a
1064  * correct Chan* but with an incorrect struct cname attached.
1065  * Since the functions that open Aaccess (sysstat, syswstat, sys_stat)
1066  * do not use the struct cname*, this avoids an unnecessary clone.
1067  *
1068  * The classic namec() is broken into a front end to get the starting point and
1069  * a __namec_from, which does the guts of the lookup.  */
1070 static struct chan *__namec_from(struct chan *c, char *aname, int amode,
1071                                  int omode, uint32_t perm,
1072                                  struct walk_helper *wh, void *ext)
1073 {
1074         ERRSTACK(2);
1075         int len, npath;
1076         struct chan *cnew, *renamee;
1077         struct cname *cname;
1078         Elemlist e;
1079         struct mhead *m;
1080         char tmperrbuf[ERRMAX];
1081         int saved_errno;
1082         // Rune r;
1083
1084         static_assert(!(CINTERNAL_FLAGS & CEXTERNAL_FLAGS));
1085
1086         e.name = NULL;
1087         e.elems = NULL;
1088         e.off = NULL;
1089         e.ARRAY_SIZEs = 0;
1090         if (waserror()) {
1091                 cclose(c);
1092                 kfree(e.name);
1093                 kfree(e.elems);
1094                 kfree(e.off);
1095                 //dumpmount();
1096                 nexterror();
1097         }
1098
1099         /*
1100          * Build a list of elements in the path.
1101          */
1102         parsename(aname, &e);
1103
1104         if (e.mustbedir)
1105                 omode &= ~O_NOFOLLOW;
1106
1107         switch (amode) {
1108         case Acreate:
1109                 /* perm must have DMDIR if last element is / or /. */
1110                 if (e.mustbedir && !(perm & DMDIR)) {
1111                         npath = e.ARRAY_SIZEs;
1112                         error(EINVAL, "create without DMDIR");
1113                 }
1114                 /* don't try to walk the last path element just yet. */
1115                 if (e.ARRAY_SIZEs == 0)
1116                         error(EEXIST, ERROR_FIXME);
1117                 e.ARRAY_SIZEs--;
1118                 /* We're dropping the last element, which O_NOFOLLOW applied to.  Not
1119                  * sure if there are any legit reasons to have O_NOFOLLOW with create.*/
1120                 omode &= ~O_NOFOLLOW;
1121                 break;
1122         case Arename:
1123                 if (e.ARRAY_SIZEs == 0)
1124                         error(EINVAL, "rename needs at least one name");
1125                 e.ARRAY_SIZEs--;
1126                 omode &= ~O_NOFOLLOW;
1127                 break;
1128         /* the difference for stat and lstat (Aaccess) are handled in sysfile.c */
1129         case Abind:
1130         case Amount:
1131         case Aremove:
1132                 omode |= O_NOFOLLOW;
1133                 break;
1134         }
1135
1136         if (omode & O_NOFOLLOW)
1137                 wh->no_follow = true;
1138
1139         if (walk(&c, e.elems, e.ARRAY_SIZEs, wh, &npath) < 0) {
1140                 if (npath < 0 || npath > e.ARRAY_SIZEs) {
1141                         printd("namec %s walk error npath=%d\n", aname, npath);
1142                         error(EFAIL, "walk failed");
1143                 }
1144                 /* Old plan 9 errors would jump here for the magic error parsing. */
1145 NameError:
1146                 if (current_errstr()[0]) {
1147                         /* errstr is set, we'll just stick with it and error out */
1148                         error_jmp();
1149                 } else {
1150                         error(EFAIL, "Name to chan lookup failed");
1151                 }
1152                 /* brho: skipping the namec custom error string business, since it hides
1153                  * the underlying failure.  implement this if you want the old stuff. */
1154 #if 0
1155                 strlcpy(tmperrbuf, current->errstr, sizeof(tmperrbuf));
1156                 len = prefix + e.off[npath]; // prefix was name - aname, the start pt
1157                 if (len < ERRMAX / 3 || (name = memrchr(aname, '/', len)) == NULL
1158                         || name == aname)
1159                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "%.*s", len,
1160                                          aname);
1161                 else
1162                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "...%.*s",
1163                                          (int)(len - (name - aname)), name);
1164                 snprintf(current->errstr, ERRMAX, "%#q %s", get_cur_genbuf(),
1165                                  tmperrbuf);
1166 #endif
1167         }
1168
1169         if (e.mustbedir && !(c->qid.type & QTDIR)) {
1170                 npath = e.ARRAY_SIZEs;
1171                 error(ENOTDIR, "not a dir, but mustbedir.  trailing slash?");
1172         }
1173
1174         if ((amode == Aopen) && (omode & O_EXEC) && (c->qid.type & QTDIR)) {
1175                 npath = e.ARRAY_SIZEs;
1176                 error(EFAIL, "cannot exec directory");
1177         }
1178
1179         switch (amode) {
1180                 case Aaccess:
1181                         if (wh->can_mount)
1182                                 domount(&c, NULL);
1183                         break;
1184
1185                 case Abind:
1186                         m = NULL;
1187                         if (wh->can_mount)
1188                                 domount(&c, &m);
1189                         if (c->umh != NULL)
1190                                 putmhead(c->umh);
1191                         c->umh = m;
1192                         break;
1193
1194                 case Aremove:
1195                 case Aopen:
1196 Open:
1197                         /* save the name; domount might change c */
1198                         cname = c->name;
1199                         kref_get(&cname->ref, 1);
1200                         m = NULL;
1201                         if (wh->can_mount)
1202                                 domount(&c, &m);
1203
1204                         /* our own copy to open or remove */
1205                         c = cunique(c);
1206
1207                         /* now it's our copy anyway, we can put the name back */
1208                         cnameclose(c->name);
1209                         c->name = cname;
1210
1211                         switch (amode) {
1212                                 case Aremove:
1213                                         putmhead(m);
1214                                         break;
1215
1216                                 case Aopen:
1217                                 case Acreate:
1218                                         if (c->umh != NULL) {
1219                                                 printd("cunique umh\n");
1220                                                 putmhead(c->umh);
1221                                                 c->umh = NULL;
1222                                         }
1223
1224                                         /* only save the mount head if it's a multiple element union */
1225                                         if (m && m->mount && m->mount->next)
1226                                                 c->umh = m;
1227                                         else
1228                                                 putmhead(m);
1229                                         /* here is where convert omode/vfs flags to c->flags.
1230                                          * careful, O_CLOEXEC and O_REMCLO are in there.  might need
1231                                          * to change that. */
1232                                         c->flag |= omode & CEXTERNAL_FLAGS;
1233                                         c = devtab[c->type].open(c,
1234                                                                  omode & ~O_CLOEXEC);
1235                                         /* if you get this from a dev, in the dev's open, you are
1236                                          * probably saving mode directly, without passing it through
1237                                          * openmode. */
1238                                         if (c->mode & O_TRUNC)
1239                                                 error(EFAIL, "Device %s open failed to clear O_TRUNC",
1240                                                       devtab[c->type].name);
1241                                         break;
1242                         }
1243                         break;
1244
1245                 case Atodir:
1246                         /*
1247                          * Directories (e.g. for cd) are left before the mount point,
1248                          * so one may mount on / or . and see the effect.
1249                          */
1250                         if (!(c->qid.type & QTDIR))
1251                                 error(ENOTDIR, ERROR_FIXME);
1252                         break;
1253
1254                 case Amount:
1255                         /*
1256                          * When mounting on an already mounted upon directory,
1257                          * one wants subsequent mounts to be attached to the
1258                          * original directory, not the replacement.  Don't domount.
1259                          */
1260                         break;
1261
1262                 case Arename:
1263                         /* We already walked to the parent of new_path, which is in c.
1264                          * We're a lot like create here - need to find mounts, etc.  On the
1265                          * way out, we putmhead if we have an m, and clean up our chans.  On
1266                          * success, c becomes cnew (thus close the old c).  On failure, we
1267                          * just close cnew. */
1268                         e.ARRAY_SIZEs++;
1269                         m = NULL;
1270                         cnew = NULL;
1271                         if (waserror()) {
1272                                 /* rename or createdir failed */
1273                                 cclose(cnew);
1274                                 if (m)
1275                                         putmhead(m);
1276                                 nexterror();    /* safe since we're in a waserror() */
1277                         }
1278                         if (wh->can_mount && findmount(&cnew, &m, c->type, c->dev,
1279                                                        c->qid)) {
1280                                 cnew = createdir(cnew, m);
1281                         } else {
1282                                 cnew = c;
1283                                 chan_incref(cnew);
1284                         }
1285                         cnew = cunique(cnew);
1286                         cnameclose(cnew->name);
1287                         cnew->name = c->name;
1288                         kref_get(&cnew->name->ref, 1);
1289                         /* At this point, we have our new_path parent chan (cnew) and the
1290                          * renamee chan */
1291                         renamee = ext;
1292                         if (cnew->type != renamee->type)
1293                                 error(EXDEV, "can't rename across device types");
1294
1295                         devtab[cnew->type].rename(renamee, cnew,
1296                                                   e.elems[e.ARRAY_SIZEs - 1], 0);
1297                         poperror();
1298
1299                         if (m)
1300                                 putmhead(m);
1301                         cclose(c);
1302                         c = cnew;
1303                         c->name = addelem(c->name, e.elems[e.ARRAY_SIZEs - 1]);
1304                         break;
1305
1306                 case Acreate:
1307                         /*
1308                          * We've already walked all but the last element.
1309                          * If the last exists, try to open it OTRUNC.
1310                          * If omode&OEXCL is set, just give up.
1311                          */
1312                         e.ARRAY_SIZEs++;
1313                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, wh, NULL) == 0) {
1314                                 if (omode & O_EXCL)
1315                                         error(EEXIST, ERROR_FIXME);
1316                                 omode |= O_TRUNC;
1317                                 goto Open;
1318                         }
1319
1320                         /*
1321                          * The semantics of the create(2) system call are that if the
1322                          * file exists and can be written, it is to be opened with truncation.
1323                          * On the other hand, the create(5) message fails if the file exists.
1324                          * If we get two create(2) calls happening simultaneously,
1325                          * they might both get here and send create(5) messages, but only
1326                          * one of the messages will succeed.  To provide the expected create(2)
1327                          * semantics, the call with the failed message needs to try the above
1328                          * walk again, opening for truncation.  This correctly solves the
1329                          * create/create race, in the sense that any observable outcome can
1330                          * be explained as one happening before the other.
1331                          * The create/create race is quite common.  For example, it happens
1332                          * when two rc subshells simultaneously update the same
1333                          * environment variable.
1334                          *
1335                          * The implementation still admits a create/create/remove race:
1336                          * (A) walk to file, fails
1337                          * (B) walk to file, fails
1338                          * (A) create file, succeeds, returns
1339                          * (B) create file, fails
1340                          * (A) remove file, succeeds, returns
1341                          * (B) walk to file, return failure.
1342                          *
1343                          * This is hardly as common as the create/create race, and is really
1344                          * not too much worse than what might happen if (B) got a hold of a
1345                          * file descriptor and then the file was removed -- either way (B) can't do
1346                          * anything with the result of the create call.  So we don't care about this race.
1347                          *
1348                          * Applications that care about more fine-grained decision of the races
1349                          * can use the OEXCL flag to get at the underlying create(5) semantics;
1350                          * by default we provide the common case.
1351                          *
1352                          * We need to stay behind the mount point in case we
1353                          * need to do the first walk again (should the create fail).
1354                          *
1355                          * We also need to cross the mount point and find the directory
1356                          * in the union in which we should be creating.
1357                          *
1358                          * The channel staying behind is c, the one moving forward is cnew.
1359                          */
1360                         m = NULL;
1361                         cnew = NULL;    /* is this assignment necessary? */
1362                         /* discard error */
1363                         if (!waserror()) {      /* try create */
1364                                 if (wh->can_mount && findmount(&cnew, &m, c->type, c->dev,
1365                                                                c->qid))
1366                                         cnew = createdir(cnew, m);
1367                                 else {
1368                                         cnew = c;
1369                                         chan_incref(cnew);
1370                                 }
1371
1372                                 /*
1373                                  * We need our own copy of the Chan because we're
1374                                  * about to send a create, which will move it.  Once we have
1375                                  * our own copy, we can fix the name, which might be wrong
1376                                  * if findmount gave us a new Chan.
1377                                  */
1378                                 cnew = cunique(cnew);
1379                                 cnameclose(cnew->name);
1380                                 cnew->name = c->name;
1381                                 kref_get(&cnew->name->ref, 1);
1382
1383                                 cnew->flag |= omode & CEXTERNAL_FLAGS;
1384                                 devtab[cnew->type].create(cnew, e.elems[e.ARRAY_SIZEs - 1],
1385                                                                                   omode & ~(O_EXCL | O_CLOEXEC),
1386                                                                                   perm, ext);
1387                                 poperror();
1388
1389                                 if (m)
1390                                         putmhead(m);
1391                                 cclose(c);
1392                                 c = cnew;
1393                                 c->name = addelem(c->name, e.elems[e.ARRAY_SIZEs - 1]);
1394                                 break;
1395                         }
1396
1397                         /* create failed */
1398                         cclose(cnew);
1399                         if (m)
1400                                 putmhead(m);
1401                         if (omode & O_EXCL)
1402                                 nexterror();    /* safe since we're in a waserror() */
1403                         poperror();     /* matching the if(!waserror) */
1404
1405                         /* save error, so walk doesn't clobber our existing errstr */
1406                         strlcpy(tmperrbuf, current_errstr(), sizeof(tmperrbuf));
1407                         saved_errno = get_errno();
1408                         /* note: we depend that walk does not error */
1409                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, wh, NULL) < 0) {
1410                                 set_errno(saved_errno);
1411                                 /* Report the error we had originally */
1412                                 error(EFAIL, tmperrbuf);
1413                         }
1414                         strlcpy(current_errstr(), tmperrbuf, MAX_ERRSTR_LEN);
1415                         omode |= O_TRUNC;
1416                         goto Open;
1417
1418                 default:
1419                         panic("unknown namec access %d\n", amode);
1420         }
1421
1422         poperror();
1423
1424         if (e.ARRAY_SIZEs > 0)
1425                 strlcpy(get_cur_genbuf(), e.elems[e.ARRAY_SIZEs - 1], GENBUF_SZ);
1426         else
1427                 strlcpy(get_cur_genbuf(), ".", GENBUF_SZ);
1428
1429         kfree(e.name);
1430         kfree(e.elems);
1431         kfree(e.off);
1432
1433         return c;
1434 }
1435
1436 struct chan *namec(char *name, int amode, int omode, uint32_t perm, void *ext)
1437 {
1438         struct walk_helper wh = {.can_mount = true};
1439         struct chan *c;
1440         char *devname, *devspec;
1441         int n, devtype;
1442
1443         if (name[0] == '\0')
1444                 error(EFAIL, "empty file name");
1445         validname(name, 1);
1446         /*
1447          * Find the starting off point (the current slash, the root of
1448          * a device tree, or the current dot) as well as the name to
1449          * evaluate starting there.
1450          */
1451         switch (name[0]) {
1452                 case '/':
1453                         if (current)
1454                                 c = current->slash;
1455                         else
1456                                 c = kern_slash;
1457                         chan_incref(c);
1458                         break;
1459
1460                 case '#':
1461                         wh.can_mount = false;
1462                         devname = get_cur_genbuf();
1463                         devname[0] = '\0';
1464                         n = 0;
1465                         name++; /* drop the # */
1466                         while ((*name != '\0') && (*name != '/')) {
1467                                 if (n >= GENBUF_SZ - 1)
1468                                         error(ENAMETOOLONG, ERROR_FIXME);
1469                                 devname[n++] = *name++;
1470                         }
1471                         devname[n] = '\0';
1472                         /* for a name #foo.spec, devname = foo\0, devspec = spec\0.
1473                          * genbuf contains foo\0spec\0.  for no spec, devspec = \0 */
1474                         devspec = strchr(devname, '.');
1475                         if (devspec) {
1476                                 *devspec = '\0';
1477                                 devspec++;
1478                         } else {
1479                                 devspec = &devname[n];
1480                         }
1481                         /* These devices have special attach functions that treat the char *
1482                          * as a blob pointer */
1483                         if (!strcmp(devname, "mnt"))
1484                                 error(EINVAL, "can't namec-attach #mnt");
1485                         if (!strcmp(devname, "gtfs"))
1486                                 error(EINVAL, "can't namec-attach #gtfs");
1487                         /* TODO: deal with this "nodevs" business. */
1488                         #if 0
1489                         /*
1490                          *  the nodevs exceptions are
1491                          *  |  it only gives access to pipes you create
1492                          *  e  this process's environment
1493                          *  s  private file2chan creation space
1494                          *  D private secure sockets name space
1495                          *  a private TLS name space
1496                          */
1497                         if (current->pgrp->nodevs &&
1498                                 //          (utfrune("|esDa", r) == NULL
1499                                 ((strchr("|esDa", get_cur_genbuf()[1]) == NULL)
1500                                  || (get_cur_genbuf()[1] == 's' // || r == 's'
1501                                          && get_cur_genbuf()[n] != '\0')))
1502                                 error(EINVAL, ERROR_FIXME);
1503                         #endif
1504                         devtype = devno(devname, 1);
1505                         if (devtype == -1)
1506                                 error(EFAIL, "Unknown #device %s (spec %s)", devname, devspec);
1507                         c = devtab[devtype].attach(devspec);
1508                         break;
1509                 default:
1510                         /* this case also covers \0 */
1511                         c = current->dot;
1512                         if (!c)
1513                                 panic("no dot!");
1514                         chan_incref(c);
1515                         break;
1516         }
1517         return __namec_from(c, name, amode, omode, perm, &wh, ext);
1518 }
1519
1520 struct chan *namec_from(struct chan *c, char *name, int amode, int omode,
1521                         uint32_t perm, void *ext)
1522 {
1523         struct walk_helper wh = {.can_mount = true};
1524
1525         if (name[0] == '\0') {
1526                 /* Our responsibility to cclose 'c' on our error */
1527                 cclose(c);
1528                 error(EFAIL, "empty file name");
1529         }
1530         validname(name, 1);
1531         return __namec_from(c, name, amode, omode, perm, &wh, ext);
1532 }
1533
1534 /*
1535  * name is valid. skip leading / and ./ as much as possible
1536  */
1537 char *skipslash(char *name)
1538 {
1539         while (name[0] == '/'
1540                    || (name[0] == '.' && (name[1] == 0 || name[1] == '/')))
1541                 name++;
1542         return name;
1543 }
1544
1545 char isfrog[256] = {
1546          /*NUL*/ 1, 1, 1, 1, 1, 1, 1, 1,
1547          /*BKS*/ 1, 1, 1, 1, 1, 1, 1, 1,
1548          /*DLE*/ 1, 1, 1, 1, 1, 1, 1, 1,
1549          /*CAN*/ 1, 1, 1, 1, 1, 1, 1, 1,
1550         ['/'] 1,
1551         [0x7f] 1,
1552 };
1553
1554 /*
1555  * Check that the name
1556  *  a) is in valid memory.
1557  *  b) is shorter than 2^16 bytes, so it can fit in a 9P string field.
1558  *  c) contains no frogs.
1559  * The first byte is known to be addressible by the requester, so the
1560  * routine works for kernel and user memory both.
1561  * The parameter slashok flags whether a slash character is an error
1562  * or a valid character.
1563  */
1564 void validname(char *aname, int slashok)
1565 {
1566         char *ename, *name;
1567         int c;
1568
1569         name = aname;
1570         ename = memchr(name, 0, (1 << 16));
1571
1572         if (ename == NULL || ename - name >= (1 << 16))
1573                 error(EINVAL, "Name too long");
1574
1575         while (*name) {
1576                 /* all characters above '~' are ok */
1577                 c = *(uint8_t *) name;
1578 #if 0
1579                 if (c >= Runeself)
1580                         name += chartorune(&r, name);
1581 #endif
1582                 if (c >= 0x7f) {
1583                         error(EFAIL, "Akaros doesn't do UTF-8");
1584                 } else {
1585                         if (isfrog[c])
1586                                 if (!slashok || c != '/') {
1587                                         error(EINVAL, "%s (%p), at char %c", aname, aname, c);
1588                                 }
1589                         name++;
1590                 }
1591         }
1592 }
1593
1594 void isdir(struct chan *c)
1595 {
1596         if (c->qid.type & QTDIR)
1597                 return;
1598         error(ENOTDIR, ERROR_FIXME);
1599 }
1600
1601 /*
1602  * This is necessary because there are many
1603  * pointers to the top of a given mount list:
1604  *
1605  *      - the mhead in the namespace hash table
1606  *      - the mhead in chans returned from findmount:
1607  *        used in namec and then by unionread.
1608  *      - the mhead in chans returned from createdir:
1609  *        used in the open/create race protect, which is gone.
1610  *
1611  * The RWlock in the Mhead protects the mount list it contains.
1612  * The mount list is deleted when we cunmount.
1613  * The RWlock ensures that nothing is using the mount list at that time.
1614  *
1615  * It is okay to replace c->mh with whatever you want as
1616  * long as you are sure you have a unique reference to it.
1617  *
1618  * This comment might belong somewhere else.
1619  */
1620 void putmhead(struct mhead *m)
1621 {
1622         if (m)
1623                 kref_put(&m->ref);
1624 }
1625
1626 /* Given s, make a copy of a string with padding bytes in front.  Returns a
1627  * pointer to the start of the string and the memory to free in str_store.
1628  *
1629  * Free str_store with kfree. */
1630 static char *pad_and_strdup(char *s, int padding, char **str_store)
1631 {
1632         char *store = kzmalloc(strlen(s) + 1 + padding, MEM_WAIT);
1633
1634         strlcpy(store + padding, s, strlen(s) + 1);
1635         *str_store = store;
1636         return store + padding;
1637 }
1638
1639 /* Walks a symlink c.  Returns the target chan, which could be the symlink
1640  * itself, if we're NO_FOLLOW.  On success, we'll decref the symlink and give
1641  * you a ref counted result.
1642  *
1643  * Returns NULL on error, and does not close the symlink.  Like regular walk, it
1644  * is all or nothing. */
1645 static struct chan *walk_symlink(struct chan *symlink, struct walk_helper *wh,
1646                                  unsigned int nr_names_left)
1647 {
1648         struct dir *dir;
1649         char *link_name, *link_store;
1650         struct chan *from;
1651         Elemlist e = {0};
1652
1653         /* mildly expensive: need to rlock the namespace */
1654         if (is_mount_point(symlink))
1655                 return symlink;
1656         if (!nr_names_left && wh->no_follow)
1657                 return symlink;
1658         if (wh->nr_loops >= WALK_MAX_NR_LOOPS) {
1659                 set_error(ELOOP, "too many nested symlinks in walk");
1660                 return NULL;
1661         }
1662         dir = chandirstat(symlink);
1663         if (!dir) {
1664                 /* Should propagate the error from dev.stat() */
1665                 return NULL;
1666         }
1667         if (!(dir->mode & DMSYMLINK)) {
1668                 set_error(ELOOP, "symlink isn't a symlink!");
1669                 kfree(dir);
1670                 return NULL;
1671         }
1672         link_name = pad_and_strdup(dir->ext, 3, &link_store);
1673         kfree(dir);
1674
1675         if (link_name[0] == '/') {
1676                 if (current)
1677                         from = current->slash;
1678                 else
1679                         from = kern_slash;
1680         } else {
1681                 from = symlink;
1682                 link_name -= 3;
1683                 strncpy(link_name, "../", 3);
1684                 if (!from->name)
1685                         from->name = newcname("");
1686         }
1687         /* we close this ref on failure or it gets walked to the result. */
1688         chan_incref(from);
1689
1690         parsename(link_name, &e);
1691         kfree(link_store);
1692
1693         wh->nr_loops++;
1694         if (walk(&from, e.elems, e.ARRAY_SIZEs, wh, NULL) < 0) {
1695                 cclose(from);
1696                 from = NULL;
1697         } else {
1698                 cclose(symlink);
1699                 if (from->qid.type & QTSYMLINK) {
1700                         symlink = from;
1701                         from = walk_symlink(symlink, wh, nr_names_left);
1702                         if (!from)
1703                                 cclose(symlink);
1704                 }
1705         }
1706         wh->nr_loops--;
1707
1708         kfree(e.name);
1709         kfree(e.elems);
1710         kfree(e.off);
1711         return from;
1712 }