vfs: Remove KFS, blockdev and devfs
[akaros.git] / kern / src / ns / chan.c
1 /* Copyright © 1994-1999 Lucent Technologies Inc.  All rights reserved.
2  * Portions Copyright © 1997-1999 Vita Nuova Limited
3  * Portions Copyright © 2000-2007 Vita Nuova Holdings Limited
4  *                                (www.vitanuova.com)
5  * Revisions Copyright © 2000-2007 Lucent Technologies Inc. and others
6  *
7  * Modified for the Akaros operating system:
8  * Copyright (c) 2013-2014 The Regents of the University of California
9  * Copyright (c) 2013-2015 Google Inc.
10  *
11  * Permission is hereby granted, free of charge, to any person obtaining a copy
12  * of this software and associated documentation files (the "Software"), to deal
13  * in the Software without restriction, including without limitation the rights
14  * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
15  * copies of the Software, and to permit persons to whom the Software is
16  * furnished to do so, subject to the following conditions:
17  *
18  * The above copyright notice and this permission notice shall be included in
19  * all copies or substantial portions of the Software.
20  *
21  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
22  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
23  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL THE
24  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
25  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
26  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
27  * SOFTWARE. */
28
29 #include <vfs.h>
30 #include <slab.h>
31 #include <kmalloc.h>
32 #include <kref.h>
33 #include <string.h>
34 #include <stdio.h>
35 #include <assert.h>
36 #include <error.h>
37 #include <cpio.h>
38 #include <pmap.h>
39 #include <smp.h>
40 #include <syscall.h>
41
42 struct chan *kern_slash;
43
44 char *channame(struct chan *c)
45 {       /* DEBUGGING */
46         if (c == NULL)
47                 return "<NULL chan>";
48         if (c->name == NULL)
49                 return "<NULL name>";
50         if (c->name->s == NULL)
51                 return "<NULL name.s>";
52         return c->name->s;
53 }
54
55 enum {
56         CNAMESLOP = 20
57 };
58
59 struct {
60         spinlock_t lock;
61         int fid;
62         struct chan *free;
63         struct chan *list;
64 } chanalloc;
65
66 typedef struct Elemlist Elemlist;
67
68 struct Elemlist {
69         char *name;                                     /* copy of name, so '/' can be overwritten */
70         int ARRAY_SIZEs;
71         char **elems;
72         int *off;
73         int mustbedir;
74 };
75
76 struct walk_helper {
77         bool can_mount;
78         bool no_follow;
79         unsigned int nr_loops;
80 };
81 #define WALK_MAX_NR_LOOPS 8
82
83 static struct chan *walk_symlink(struct chan *symlink, struct walk_helper *wh,
84                                  unsigned int nr_names_left);
85
86 #define SEP(c) ((c) == 0 || (c) == '/')
87 void cleancname(struct cname *);
88
89 int isdotdot(char *p)
90 {
91         return p[0] == '.' && p[1] == '.' && p[2] == '\0';
92 }
93
94 int emptystr(char *s)
95 {
96         if (s == NULL)
97                 return 1;
98         if (s[0] == '\0')
99                 return 1;
100         return 0;
101 }
102
103 /*
104  * Atomically replace *p with copy of s
105  */
106 void kstrdup(char **p, char *s)
107 {
108         int n;
109         char *t, *prev;
110
111         n = strlen(s) + 1;
112         /* if it's a user, we can wait for memory; if not, something's very wrong */
113         if (current) {
114                 t = kzmalloc(n, 0);
115         } else {
116                 t = kzmalloc(n, 0);
117                 if (t == NULL)
118                         panic("kstrdup: no memory");
119         }
120         memmove(t, s, n);
121         prev = *p;
122         *p = t;
123         kfree(prev);
124 }
125
126 void chandevreset(void)
127 {
128         int i;
129
130         for (i = 0; &devtab[i] < __devtabend; i++) {
131                 if (devtab[i].reset)
132                         devtab[i].reset();
133         }
134 }
135
136 void chandevinit(void)
137 {
138         int i;
139
140         for (i = 0; &devtab[i] < __devtabend; i++) {
141                 if (devtab[i].init)
142                         devtab[i].init();
143         }
144 }
145
146 void chandevshutdown(void)
147 {
148         int i;
149
150         /* shutdown in reverse order */
151         for (i = 0; &devtab[i] < __devtabend; i++) ;
152         for (i--; i >= 0; i--) {
153                 if (devtab[i].shutdown)
154                         devtab[i].shutdown();
155         }
156 }
157
158 static void chan_release(struct kref *kref)
159 {
160         struct chan *c = container_of(kref, struct chan, ref);
161         ERRSTACK(1);
162         /* this style discards the error from close().  picture it as
163          * if (waserror()) { } else { close(); } chanfree_no_matter_what();  */
164         if (!waserror()) {
165                 printd("releasing chan %p, type %d\n", c, c->type);
166                 /* -1 means there is no dev yet.  wants a noop for close() */
167                 if (c->type != -1)
168                         devtab[c->type].close(c);
169         }
170         /* need to poperror regardless of whether we error'd or not */
171         poperror();
172         /* and chan free no matter what */
173         chanfree(c);
174 }
175
176 struct chan *newchan(void)
177 {
178         struct chan *c;
179
180         spin_lock(&(&chanalloc)->lock);
181         c = chanalloc.free;
182         if (c != 0)
183                 chanalloc.free = c->next;
184         spin_unlock(&(&chanalloc)->lock);
185
186         if (c == NULL) {
187                 c = kzmalloc(sizeof(struct chan), 0);
188                 spin_lock(&(&chanalloc)->lock);
189                 c->fid = ++chanalloc.fid;
190                 c->link = chanalloc.list;
191                 chanalloc.list = c;
192                 spin_unlock(&(&chanalloc)->lock);
193                 spinlock_init(&c->lock);
194                 qlock_init(&c->umqlock);
195         }
196
197         /* if you get an error before associating with a dev, cclose skips calling
198          * the dev's close */
199         c->type = -1;
200         c->flag = 0;
201         kref_init(&c->ref, chan_release, 1);
202         c->dev = 0;
203         c->offset = 0;
204         c->iounit = 0;
205         c->umh = 0;
206         c->uri = 0;
207         c->dri = 0;
208         c->aux = 0;
209         c->mchan = 0;
210         c->mcp = 0;
211         c->mux = 0;
212         c->mqid.path = 0;
213         c->mqid.vers = 0;
214         c->mqid.type = 0;
215         c->name = 0;
216         c->buf = NULL;
217         c->mountpoint = NULL;
218         return c;
219 }
220
221 static void __cname_release(struct kref *kref)
222 {
223         struct cname *n = container_of(kref, struct cname, ref);
224         kfree(n->s);
225         kfree(n);
226 }
227
228 struct cname *newcname(char *s)
229 {
230         struct cname *n;
231         int i;
232
233         n = kzmalloc(sizeof(*n), 0);
234         i = strlen(s);
235         n->len = i;
236         n->alen = i + CNAMESLOP;
237         n->s = kzmalloc(n->alen, 0);
238         memmove(n->s, s, i + 1);
239         kref_init(&n->ref, __cname_release, 1);
240         return n;
241 }
242
243 void cnameclose(struct cname *n)
244 {
245         if (n == NULL)
246                 return;
247         kref_put(&n->ref);
248 }
249
250 struct cname *addelem(struct cname *n, char *s)
251 {
252         int i, a;
253         char *t;
254         struct cname *new;
255
256         if (s[0] == '.' && s[1] == '\0')
257                 return n;
258
259         if (kref_refcnt(&n->ref) > 1) {
260                 /* copy on write */
261                 new = newcname(n->s);
262                 cnameclose(n);
263                 n = new;
264         }
265
266         i = strlen(s);
267         if (n->len + 1 + i + 1 > n->alen) {
268                 a = n->len + 1 + i + 1 + CNAMESLOP;
269                 t = kzmalloc(a, 0);
270                 memmove(t, n->s, n->len + 1);
271                 kfree(n->s);
272                 n->s = t;
273                 n->alen = a;
274         }
275         if (n->len > 0 && n->s[n->len - 1] != '/' && s[0] != '/')       /* don't insert extra slash if one is present */
276                 n->s[n->len++] = '/';
277         memmove(n->s + n->len, s, i + 1);
278         n->len += i;
279         if (isdotdot(s))
280                 cleancname(n);
281         return n;
282 }
283
284 void chanfree(struct chan *c)
285 {
286         c->flag = CFREE;
287
288         if (c->umh != NULL) {
289                 putmhead(c->umh);
290                 c->umh = NULL;
291         }
292         if (c->umc != NULL) {
293                 cclose(c->umc);
294                 c->umc = NULL;
295         }
296         if (c->mux != NULL) {
297                 //
298                 muxclose(c->mux);
299                 c->mux = NULL;
300         }
301         if (c->mchan != NULL) {
302                 cclose(c->mchan);
303                 c->mchan = NULL;
304         }
305
306         cnameclose(c->name);
307         if (c->buf)
308                 kfree(c->buf);
309         c->buf = NULL;
310         c->bufused = 0;
311         c->ateof = 0;
312
313         spin_lock(&(&chanalloc)->lock);
314         c->next = chanalloc.free;
315         chanalloc.free = c;
316         spin_unlock(&(&chanalloc)->lock);
317 }
318
319 void cclose(struct chan *c)
320 {
321         if (c == 0)
322                 return;
323
324         if (c->flag & CFREE)
325                 panic("cclose %p", getcallerpc(&c));
326
327         kref_put(&c->ref);
328 }
329
330 /* convenience wrapper for interposition.  if you do use this, don't forget
331  * about the kref_get_not_zero in plan9setup() */
332 void chan_incref(struct chan *c)
333 {
334         kref_get(&c->ref, 1);
335 }
336
337 /*
338  * Make sure we have the only copy of c.  (Copy on write.)
339  */
340 struct chan *cunique(struct chan *c)
341 {
342         struct chan *nc;
343
344         if (kref_refcnt(&c->ref) != 1) {
345                 nc = cclone(c);
346                 cclose(c);
347                 c = nc;
348         }
349
350         return c;
351 }
352
353 int eqqid(struct qid a, struct qid b)
354 {
355         return a.path == b.path && a.vers == b.vers;
356 }
357
358 int eqchan(struct chan *a, struct chan *b, int pathonly)
359 {
360         if (a->qid.path != b->qid.path)
361                 return 0;
362         if (!pathonly && a->qid.vers != b->qid.vers)
363                 return 0;
364         if (a->type != b->type)
365                 return 0;
366         if (a->dev != b->dev)
367                 return 0;
368         return 1;
369 }
370
371 int eqchantdqid(struct chan *a, int type, int dev, struct qid qid, int pathonly)
372 {
373         if (a->qid.path != qid.path)
374                 return 0;
375         if (!pathonly && a->qid.vers != qid.vers)
376                 return 0;
377         if (a->type != type)
378                 return 0;
379         if (a->dev != dev)
380                 return 0;
381         return 1;
382 }
383
384 static void mh_release(struct kref *kref)
385 {
386         struct mhead *mh = container_of(kref, struct mhead, ref);
387         mh->mount = (struct mount *)0xCafeBeef;
388         kfree(mh);
389 }
390
391 struct mhead *newmhead(struct chan *from)
392 {
393         struct mhead *mh;
394
395         mh = kzmalloc(sizeof(struct mhead), 0);
396         kref_init(&mh->ref, mh_release, 1);
397         rwinit(&mh->lock);
398         mh->from = from;
399         chan_incref(from);
400
401 /*
402         n = from->name->len;
403         if(n >= sizeof(mh->fromname))
404                 n = sizeof(mh->fromname)-1;
405         memmove(mh->fromname, from->name->s, n);
406         mh->fromname[n] = 0;
407 */
408         return mh;
409 }
410
411 int cmount(struct chan *new, struct chan *old, int flag, char *spec)
412 {
413         ERRSTACK(1);
414         struct pgrp *pg;
415         int order, flg;
416         struct mhead *m, **l, *mh;
417         struct mount *nm, *f, *um, **h;
418
419         /* Can bind anything onto a symlink's name.  Otherwise, both the old and the
420          * new must agree on whether or not it is a directory. */
421         if (!(old->qid.type & QTSYMLINK) &&
422             (QTDIR & (old->qid.type ^ new->qid.type)))
423                 error(EINVAL, ERROR_FIXME);
424
425         if (old->umh)
426                 printd("cmount old extra umh\n");
427
428         order = flag & MORDER;
429
430         if ((old->qid.type & QTDIR) == 0 && order != MREPL)
431                 error(EINVAL, ERROR_FIXME);
432
433         mh = new->umh;
434
435         /*
436          * Not allowed to bind when the old directory
437          * is itself a union.  (Maybe it should be allowed, but I don't see
438          * what the semantics would be.)
439          *
440          * We need to check mh->mount->next to tell unions apart from
441          * simple mount points, so that things like
442          *  mount -c fd /root
443          *  bind -c /root /
444          * work.  The check of mount->mflag catches things like
445          *  mount fd /root
446          *  bind -c /root /
447          *
448          * This is far more complicated than it should be, but I don't
449          * see an easier way at the moment.     -rsc
450          */
451         if ((flag & MCREATE) && mh && mh->mount
452                 && (mh->mount->next || !(mh->mount->mflag & MCREATE)))
453                 error(EEXIST, ERROR_FIXME);
454
455         pg = current->pgrp;
456         wlock(&pg->ns);
457
458         l = &MOUNTH(pg, old->qid);
459         for (m = *l; m; m = m->hash) {
460                 if (eqchan(m->from, old, 1))
461                         break;
462                 l = &m->hash;
463         }
464
465         if (m == NULL) {
466                 /*
467                  *  nothing mounted here yet.  create a mount
468                  *  head and add to the hash table.
469                  */
470                 m = newmhead(old);
471                 *l = m;
472
473                 /*
474                  *  if this is a union mount, add the old
475                  *  node to the mount chain.
476                  */
477                 if (order != MREPL)
478                         m->mount = newmount(m, old, 0, 0);
479         }
480         wlock(&m->lock);
481         if (waserror()) {
482                 wunlock(&m->lock);
483                 nexterror();
484         }
485         wunlock(&pg->ns);
486
487         nm = newmount(m, new, flag, spec);
488         if (mh != NULL && mh->mount != NULL) {
489                 /*
490                  *  copy a union when binding it onto a directory
491                  */
492                 flg = order;
493                 if (order == MREPL)
494                         flg = MAFTER;
495                 h = &nm->next;
496                 um = mh->mount;
497                 for (um = um->next; um; um = um->next) {
498                         f = newmount(m, um->to, flg, um->spec);
499                         *h = f;
500                         h = &f->next;
501                 }
502         }
503
504         if (m->mount && order == MREPL) {
505                 mountfree(m->mount);
506                 m->mount = 0;
507         }
508
509         if (flag & MCREATE)
510                 nm->mflag |= MCREATE;
511
512         if (m->mount && order == MAFTER) {
513                 for (f = m->mount; f->next; f = f->next) ;
514                 f->next = nm;
515         } else {
516                 for (f = nm; f->next; f = f->next) ;
517                 f->next = m->mount;
518                 m->mount = nm;
519         }
520
521         wunlock(&m->lock);
522         poperror();
523         return nm->mountid;
524 }
525
526 void cunmount(struct chan *mnt, struct chan *mounted)
527 {
528         struct pgrp *pg;
529         struct mhead *m, **l;
530         struct mount *f, **p;
531
532         if (mnt->umh)   /* should not happen */
533                 printd("cunmount newp extra umh %p has %p\n", mnt, mnt->umh);
534
535         /*
536          * It _can_ happen that mounted->umh is non-NULL,
537          * because mounted is the result of namec(Aopen)
538          * (see sysfile.c:/^sysunmount).
539          * If we open a union directory, it will have a umh.
540          * Although surprising, this is okay, since the
541          * cclose will take care of freeing the umh.
542          */
543
544         pg = current->pgrp;
545         wlock(&pg->ns);
546
547         l = &MOUNTH(pg, mnt->qid);
548         for (m = *l; m; m = m->hash) {
549                 if (eqchan(m->from, mnt, 1))
550                         break;
551                 l = &m->hash;
552         }
553
554         if (m == 0) {
555                 wunlock(&pg->ns);
556                 error(ENOENT, ERROR_FIXME);
557         }
558
559         wlock(&m->lock);
560         if (mounted == 0) {
561                 *l = m->hash;
562                 wunlock(&pg->ns);
563                 mountfree(m->mount);
564                 m->mount = NULL;
565                 cclose(m->from);
566                 wunlock(&m->lock);
567                 putmhead(m);
568                 return;
569         }
570
571         p = &m->mount;
572         for (f = *p; f; f = f->next) {
573                 /* BUG: Needs to be 2 pass */
574                 if (eqchan(f->to, mounted, 1) ||
575                         (f->to->mchan && eqchan(f->to->mchan, mounted, 1))) {
576                         *p = f->next;
577                         f->next = 0;
578                         mountfree(f);
579                         if (m->mount == NULL) {
580                                 *l = m->hash;
581                                 cclose(m->from);
582                                 wunlock(&m->lock);
583                                 wunlock(&pg->ns);
584                                 putmhead(m);
585                                 return;
586                         }
587                         wunlock(&m->lock);
588                         wunlock(&pg->ns);
589                         return;
590                 }
591                 p = &f->next;
592         }
593         wunlock(&m->lock);
594         wunlock(&pg->ns);
595         error(ENOENT, ERROR_FIXME);
596 }
597
598 struct chan *cclone(struct chan *c)
599 {
600         struct chan *nc;
601         struct walkqid *wq;
602
603         wq = devtab[c->type].walk(c, NULL, NULL, 0);
604         if (wq == NULL)
605                 error(EFAIL, "clone failed");
606         nc = wq->clone;
607         kfree(wq);
608         nc->name = c->name;
609         if (c->name)
610                 kref_get(&c->name->ref, 1);
611         return nc;
612 }
613
614 /* Helper: is something mounted on the chan? */
615 static bool is_mount_point(struct chan *c)
616 {
617         struct pgrp *pg;
618         struct mhead *m;
619         int type = c->type;
620         int dev = c->dev;
621         struct qid qid = c->qid;
622
623         if (!current)
624                 return false;
625         pg = current->pgrp;
626         rlock(&pg->ns);
627         for (m = MOUNTH(pg, qid); m; m = m->hash) {
628                 rlock(&m->lock);
629                 if (!m->from) {
630                         runlock(&m->lock);
631                         continue;
632                 }
633                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
634                         runlock(&m->lock);
635                         runlock(&pg->ns);
636                         return true;
637                 }
638                 runlock(&m->lock);
639         }
640         runlock(&pg->ns);
641         return false;
642 }
643
644 int
645 findmount(struct chan **cp,
646                   struct mhead **mp, int type, int dev, struct qid qid)
647 {
648         struct pgrp *pg;
649         struct mhead *m;
650
651         if (!current)
652                 return 0;
653         pg = current->pgrp;
654         rlock(&pg->ns);
655         for (m = MOUNTH(pg, qid); m; m = m->hash) {
656                 rlock(&m->lock);
657                 if (m->from == NULL) {
658                         printd("m %p m->from 0\n", m);
659                         runlock(&m->lock);
660                         continue;
661                 }
662                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
663                         runlock(&pg->ns);
664                         if (mp != NULL) {
665                                 kref_get(&m->ref, 1);
666                                 if (*mp != NULL)
667                                         putmhead(*mp);
668                                 *mp = m;
669                         }
670                         if (*cp != NULL)
671                                 cclose(*cp);
672                         chan_incref(m->mount->to);
673                         *cp = m->mount->to;
674                         runlock(&m->lock);
675                         return 1;
676                 }
677                 runlock(&m->lock);
678         }
679
680         runlock(&pg->ns);
681         return 0;
682 }
683
684 int domount(struct chan **cp, struct mhead **mp)
685 {
686         return findmount(cp, mp, (*cp)->type, (*cp)->dev, (*cp)->qid);
687 }
688
689 struct chan *undomount(struct chan *c, struct cname *name)
690 {
691         ERRSTACK(1);
692         struct chan *nc;
693         struct pgrp *pg;
694         struct mount *t;
695         struct mhead **h, **he, *f;
696
697         if (!current)
698                 return c;
699         pg = current->pgrp;
700         rlock(&pg->ns);
701         if (waserror()) {
702                 runlock(&pg->ns);
703                 nexterror();
704         }
705
706         he = &pg->mnthash[MNTHASH];
707         for (h = pg->mnthash; h < he; h++) {
708                 for (f = *h; f; f = f->hash) {
709                         if (strcmp(f->from->name->s, name->s) != 0)
710                                 continue;
711                         for (t = f->mount; t; t = t->next) {
712                                 if (eqchan(c, t->to, 1)) {
713                                         /*
714                                          * We want to come out on the left hand side of the mount
715                                          * point using the element of the union that we entered on.
716                                          * To do this, find the element that has a from name of
717                                          * c->name->s.
718                                          */
719                                         if (strcmp(t->head->from->name->s, name->s) != 0)
720                                                 continue;
721                                         nc = t->head->from;
722                                         chan_incref(nc);
723                                         cclose(c);
724                                         c = nc;
725                                         break;
726                                 }
727                         }
728                 }
729         }
730         poperror();
731         runlock(&pg->ns);
732         return c;
733 }
734
735 /*
736  * Either walks all the way or not at all.  No partial results in *cp.
737  * *nerror is the number of names to display in an error message.
738  */
739 int walk(struct chan **cp, char **names, int nnames, struct walk_helper *wh,
740          int *nerror)
741 {
742         int dev, dotdot, i, n, nhave, ntry, type;
743         struct chan *c, *nc, *lastmountpoint = NULL;
744         struct cname *cname;
745         struct mount *f;
746         struct mhead *mh, *nmh;
747         struct walkqid *wq;
748
749         c = *cp;
750         chan_incref(c);
751         cname = c->name;
752         kref_get(&cname->ref, 1);
753         mh = NULL;
754
755         /*
756          * While we haven't gotten all the way down the path:
757          *    1. step through a mount point, if any
758          *    2. send a walk request for initial dotdot or initial prefix without dotdot
759          *    3. move to the first mountpoint along the way.
760          *    4. repeat.
761          *
762          * An invariant is that each time through the loop, c is on the undomount
763          * side of the mount point, and c's name is cname.
764          */
765         for (nhave = 0; nhave < nnames; nhave += n) {
766                 /* We only allow symlink when they are first and it's .. (see below) */
767                 if ((c->qid.type & (QTDIR | QTSYMLINK)) == 0) {
768                         if (nerror)
769                                 *nerror = nhave;
770                         cnameclose(cname);
771                         cclose(c);
772                         set_error(ENOTDIR, ERROR_FIXME);
773                         if (mh != NULL)
774                                 putmhead(mh);
775                         return -1;
776                 }
777                 ntry = nnames - nhave;
778                 if (ntry > MAXWELEM)
779                         ntry = MAXWELEM;
780                 dotdot = 0;
781                 for (i = 0; i < ntry; i++) {
782                         if (isdotdot(names[nhave + i])) {
783                                 if (i == 0) {
784                                         dotdot = 1;
785                                         ntry = 1;
786                                 } else
787                                         ntry = i;
788                                 break;
789                         }
790                 }
791
792                 if (!dotdot && wh->can_mount)
793                         domount(&c, &mh);
794                 /* Bug - the only time we walk from a symlink should be during
795                  * walk_symlink, which should have given us a dotdot. */
796                 if ((c->qid.type & QTSYMLINK) && !dotdot)
797                         panic("Got a walk from a symlink that wasn't ..!");
798
799                 type = c->type;
800                 dev = c->dev;
801
802                 if ((wq = devtab[type].walk(c, NULL, names + nhave, ntry)) == NULL) {
803                         /* try a union mount, if any */
804                         if (mh && wh->can_mount) {
805                                 /*
806                                  * mh->mount == c, so start at mh->mount->next
807                                  */
808                                 rlock(&mh->lock);
809                                 for (f = mh->mount->next; f; f = f->next)
810                                         if ((wq =
811                                                  devtab[f->to->type].walk(f->to, NULL, names + nhave,
812                                                                                                   ntry)) != NULL)
813                                                 break;
814                                 runlock(&mh->lock);
815                                 if (f != NULL) {
816                                         type = f->to->type;
817                                         dev = f->to->dev;
818                                 }
819                         }
820                         if (wq == NULL) {
821                                 cclose(c);
822                                 cnameclose(cname);
823                                 if (nerror)
824                                         *nerror = nhave + 1;
825                                 if (mh != NULL)
826                                         putmhead(mh);
827                                 return -1;
828                         }
829                 }
830
831                 nmh = NULL;
832                 if (dotdot) {
833                         assert(wq->nqid == 1);
834                         assert(wq->clone != NULL);
835
836                         cname = addelem(cname, "..");
837                         nc = undomount(wq->clone, cname);
838                         n = 1;
839                 } else {
840                         nc = NULL;
841                         if (wh->can_mount)
842                                 for (i = 0; i < wq->nqid && i < ntry - 1; i++)
843                                         if (findmount(&nc, &nmh, type, dev, wq->qid[i]))
844                                                 break;
845                         if (nc == NULL) {       /* no mount points along path */
846                                 if (wq->clone == NULL) {
847                                         cclose(c);
848                                         cnameclose(cname);
849                                         if (wq->nqid == 0 || (wq->qid[wq->nqid - 1].type & QTDIR)) {
850                                                 if (nerror)
851                                                         *nerror = nhave + wq->nqid + 1;
852                                                 set_error(ENOENT, "walk failed");
853                                         } else {
854                                                 if (nerror)
855                                                         *nerror = nhave + wq->nqid;
856                                                 set_error(ENOTDIR, "walk failed");
857                                         }
858                                         kfree(wq);
859                                         if (mh != NULL)
860                                                 putmhead(mh);
861                                         return -1;
862                                 }
863                                 n = wq->nqid;
864                                 if (wq->clone->qid.type & QTSYMLINK) {
865                                         nc = walk_symlink(wq->clone, wh, nnames - nhave - n);
866                                         if (!nc) {
867                                                 /* walk_symlink() set error.  This seems to be the
868                                                  * standard walk() error-cleanup. */
869                                                 if (nerror)
870                                                         *nerror = nhave + wq->nqid;
871                                                 cclose(c);
872                                                 cclose(wq->clone);
873                                                 cnameclose(cname);
874                                                 kfree(wq);
875                                                 if (mh != NULL)
876                                                         putmhead(mh);
877                                                 return -1;
878                                         }
879                                 } else {
880                                         nc = wq->clone;
881                                 }
882                         } else {        /* stopped early, at a mount point */
883                                 if (wq->clone != NULL) {
884                                         cclose(wq->clone);
885                                         wq->clone = NULL;
886                                 }
887                                 lastmountpoint = nc;
888                                 n = i + 1;
889                         }
890                         for (i = 0; i < n; i++)
891                                 cname = addelem(cname, names[nhave + i]);
892                 }
893                 cclose(c);
894                 c = nc;
895                 putmhead(mh);
896                 mh = nmh;
897                 kfree(wq);
898         }
899
900         putmhead(mh);
901
902         c = cunique(c);
903
904         if (c->umh != NULL) {   //BUG
905                 printd("walk umh\n");
906                 putmhead(c->umh);
907                 c->umh = NULL;
908         }
909
910         cnameclose(c->name);
911         c->name = cname;
912         c->mountpoint = lastmountpoint;
913
914         cclose(*cp);
915         *cp = c;
916         if (nerror)
917                 *nerror = 0;
918         return 0;
919 }
920
921 /*
922  * c is a mounted non-creatable directory.  find a creatable one.
923  */
924 struct chan *createdir(struct chan *c, struct mhead *m)
925 {
926         ERRSTACK(1);
927         struct chan *nc;
928         struct mount *f;
929
930         rlock(&m->lock);
931         if (waserror()) {
932                 runlock(&m->lock);
933                 nexterror();
934         }
935         for (f = m->mount; f; f = f->next) {
936                 if (f->mflag & MCREATE) {
937                         nc = cclone(f->to);
938                         runlock(&m->lock);
939                         poperror();
940                         cclose(c);
941                         return nc;
942                 }
943         }
944         error(EPERM, ERROR_FIXME);
945         poperror();
946         return 0;
947 }
948
949 /*
950  * In place, rewrite name to compress multiple /, eliminate ., and process ..
951  */
952 void cleancname(struct cname *n)
953 {
954         char *p;
955
956         if (n->s[0] == '#') {
957                 p = strchr(n->s, '/');
958                 if (p == NULL)
959                         return;
960                 cleanname(p);
961
962                 /*
963                  * The correct name is #i rather than #i/,
964                  * but the correct name of #/ is #/.
965                  */
966                 if (strcmp(p, "/") == 0 && n->s[1] != '/')
967                         *p = '\0';
968         } else
969                 cleanname(n->s);
970         n->len = strlen(n->s);
971 }
972
973 static void growparse(Elemlist * e)
974 {
975         char **new;
976         int *inew;
977         enum { Delta = 8 };
978
979         if (e->ARRAY_SIZEs % Delta == 0) {
980                 new = kzmalloc((e->ARRAY_SIZEs + Delta) * sizeof(char *), 0);
981                 memmove(new, e->elems, e->ARRAY_SIZEs * sizeof(char *));
982                 kfree(e->elems);
983                 e->elems = new;
984                 inew = kzmalloc((e->ARRAY_SIZEs + Delta + 1) * sizeof(int), 0);
985                 memmove(inew, e->off, e->ARRAY_SIZEs * sizeof(int));
986                 kfree(e->off);
987                 e->off = inew;
988         }
989 }
990
991 /*
992  * The name is known to be valid.
993  * Copy the name so slashes can be overwritten.
994  * An empty string will set ARRAY_SIZE=0.
995  * A path ending in / or /. or /.//./ etc. will have
996  * e.mustbedir = 1, so that we correctly
997  * reject, e.g., "/adm/users/." when /adm/users is a file
998  * rather than a directory.
999  */
1000 static void parsename(char *name, Elemlist * e)
1001 {
1002         char *slash;
1003
1004         kstrdup(&e->name, name);
1005         name = e->name;
1006         e->ARRAY_SIZEs = 0;
1007         e->elems = NULL;
1008         e->off = kzmalloc(sizeof(int), 0);
1009         e->off[0] = skipslash(name) - name;
1010         for (;;) {
1011                 name = skipslash(name);
1012                 if (*name == '\0') {
1013                         e->mustbedir = 1;
1014                         break;
1015                 }
1016                 growparse(e);
1017
1018                 e->elems[e->ARRAY_SIZEs++] = name;
1019                 /* we may want to do this again some day
1020                    slash = utfrune(name, '/');
1021                  */
1022                 slash = strchr(name, '/');
1023                 if (slash == NULL) {
1024                         e->off[e->ARRAY_SIZEs] = name + strlen(name) - e->name;
1025                         e->mustbedir = 0;
1026                         break;
1027                 }
1028                 e->off[e->ARRAY_SIZEs] = slash - e->name;
1029                 *slash++ = '\0';
1030                 name = slash;
1031         }
1032 }
1033
1034 void *memrchr(void *va, int c, long n)
1035 {
1036         uint8_t *a, *e;
1037
1038         a = va;
1039         for (e = a + n - 1; e > a; e--)
1040                 if (*e == c)
1041                         return e;
1042         return NULL;
1043 }
1044
1045 /*
1046  * Turn a name into a channel.
1047  * &name[0] is known to be a valid address.  It may be a kernel address.
1048  *
1049  * Opening with amode Aopen, Acreate, or Aremove guarantees
1050  * that the result will be the only reference to that particular fid.
1051  * This is necessary since we might pass the result to
1052  * devtab[].remove().
1053  *
1054  * Opening Atodir, Amount, or Aaccess does not guarantee this.
1055  *
1056  * Opening Aaccess can, under certain conditions, return a
1057  * correct Chan* but with an incorrect struct cname attached.
1058  * Since the functions that open Aaccess (sysstat, syswstat, sys_stat)
1059  * do not use the struct cname*, this avoids an unnecessary clone.
1060  *
1061  * The classic namec() is broken into a front end to get the starting point and
1062  * a __namec_from, which does the guts of the lookup.  */
1063 static struct chan *__namec_from(struct chan *c, char *aname, int amode,
1064                                  int omode, uint32_t perm,
1065                                  struct walk_helper *wh, void *ext)
1066 {
1067         ERRSTACK(2);
1068         int len, npath;
1069         struct chan *cnew;
1070         struct cname *cname;
1071         Elemlist e;
1072         struct mhead *m;
1073         char tmperrbuf[ERRMAX];
1074         int saved_errno;
1075         // Rune r;
1076
1077         static_assert(!(CINTERNAL_FLAGS & CEXTERNAL_FLAGS));
1078
1079         e.name = NULL;
1080         e.elems = NULL;
1081         e.off = NULL;
1082         e.ARRAY_SIZEs = 0;
1083         if (waserror()) {
1084                 cclose(c);
1085                 kfree(e.name);
1086                 kfree(e.elems);
1087                 kfree(e.off);
1088                 //dumpmount();
1089                 nexterror();
1090         }
1091
1092         /*
1093          * Build a list of elements in the path.
1094          */
1095         parsename(aname, &e);
1096
1097         if (e.mustbedir)
1098                 omode &= ~O_NOFOLLOW;
1099         /*
1100          * On create, ....
1101          */
1102         if (amode == Acreate) {
1103                 /* perm must have DMDIR if last element is / or /. */
1104                 if (e.mustbedir && !(perm & DMDIR)) {
1105                         npath = e.ARRAY_SIZEs;
1106                         error(EINVAL, "create without DMDIR");
1107                 }
1108
1109                 /* don't try to walk the last path element just yet. */
1110                 if (e.ARRAY_SIZEs == 0)
1111                         error(EEXIST, ERROR_FIXME);
1112                 e.ARRAY_SIZEs--;
1113                 /* We're dropping the last element, which O_NOFOLLOW applied to.  Not
1114                  * sure if there are any legit reasons to have O_NOFOLLOW with create.*/
1115                 omode &= ~O_NOFOLLOW;
1116         }
1117         switch (amode) {
1118         /* the difference for stat and lstat (Aaccess) are handled in sysfile.c */
1119         case Abind:
1120         case Amount:
1121         case Aremove:
1122                 omode |= O_NOFOLLOW;
1123                 break;
1124         }
1125         if (omode & O_NOFOLLOW)
1126                 wh->no_follow = true;
1127
1128         if (walk(&c, e.elems, e.ARRAY_SIZEs, wh, &npath) < 0) {
1129                 if (npath < 0 || npath > e.ARRAY_SIZEs) {
1130                         printd("namec %s walk error npath=%d\n", aname, npath);
1131                         error(EFAIL, "walk failed");
1132                 }
1133                 /* Old plan 9 errors would jump here for the magic error parsing. */
1134 NameError:
1135                 if (current_errstr()[0]) {
1136                         /* errstr is set, we'll just stick with it and error out */
1137                         error_jmp();
1138                 } else {
1139                         error(EFAIL, "Name to chan lookup failed");
1140                 }
1141                 /* brho: skipping the namec custom error string business, since it hides
1142                  * the underlying failure.  implement this if you want the old stuff. */
1143 #if 0
1144                 strlcpy(tmperrbuf, current->errstr, sizeof(tmperrbuf));
1145                 len = prefix + e.off[npath]; // prefix was name - aname, the start pt
1146                 if (len < ERRMAX / 3 || (name = memrchr(aname, '/', len)) == NULL
1147                         || name == aname)
1148                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "%.*s", len,
1149                                          aname);
1150                 else
1151                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "...%.*s",
1152                                          (int)(len - (name - aname)), name);
1153                 snprintf(current->errstr, ERRMAX, "%#q %s", get_cur_genbuf(),
1154                                  tmperrbuf);
1155 #endif
1156         }
1157
1158         if (e.mustbedir && !(c->qid.type & QTDIR)) {
1159                 npath = e.ARRAY_SIZEs;
1160                 error(ENOTDIR, "not a dir, but mustbedir.  trailing slash?");
1161         }
1162
1163         if ((amode == Aopen) && (omode & O_EXEC) && (c->qid.type & QTDIR)) {
1164                 npath = e.ARRAY_SIZEs;
1165                 error(EFAIL, "cannot exec directory");
1166         }
1167
1168         switch (amode) {
1169                 case Aaccess:
1170                         if (wh->can_mount)
1171                                 domount(&c, NULL);
1172                         break;
1173
1174                 case Abind:
1175                         m = NULL;
1176                         if (wh->can_mount)
1177                                 domount(&c, &m);
1178                         if (c->umh != NULL)
1179                                 putmhead(c->umh);
1180                         c->umh = m;
1181                         break;
1182
1183                 case Aremove:
1184                 case Aopen:
1185 Open:
1186                         /* save the name; domount might change c */
1187                         cname = c->name;
1188                         kref_get(&cname->ref, 1);
1189                         m = NULL;
1190                         if (wh->can_mount)
1191                                 domount(&c, &m);
1192
1193                         /* our own copy to open or remove */
1194                         c = cunique(c);
1195
1196                         /* now it's our copy anyway, we can put the name back */
1197                         cnameclose(c->name);
1198                         c->name = cname;
1199
1200                         switch (amode) {
1201                                 case Aremove:
1202                                         putmhead(m);
1203                                         break;
1204
1205                                 case Aopen:
1206                                 case Acreate:
1207                                         if (c->umh != NULL) {
1208                                                 printd("cunique umh\n");
1209                                                 putmhead(c->umh);
1210                                                 c->umh = NULL;
1211                                         }
1212
1213                                         /* only save the mount head if it's a multiple element union */
1214                                         if (m && m->mount && m->mount->next)
1215                                                 c->umh = m;
1216                                         else
1217                                                 putmhead(m);
1218                                         if (omode == O_EXEC)
1219                                                 c->flag &= ~CCACHE;
1220                                         /* here is where convert omode/vfs flags to c->flags.
1221                                          * careful, O_CLOEXEC and O_REMCLO are in there.  might need
1222                                          * to change that. */
1223                                         c->flag |= omode & CEXTERNAL_FLAGS;
1224                                         c = devtab[c->type].open(c,
1225                                                                  omode & ~O_CLOEXEC);
1226                                         /* if you get this from a dev, in the dev's open, you are
1227                                          * probably saving mode directly, without passing it through
1228                                          * openmode. */
1229                                         if (c->mode & O_TRUNC)
1230                                                 error(EFAIL, "Device %s open failed to clear O_TRUNC",
1231                                                       devtab[c->type].name);
1232                                         break;
1233                         }
1234                         break;
1235
1236                 case Atodir:
1237                         /*
1238                          * Directories (e.g. for cd) are left before the mount point,
1239                          * so one may mount on / or . and see the effect.
1240                          */
1241                         if (!(c->qid.type & QTDIR))
1242                                 error(ENOTDIR, ERROR_FIXME);
1243                         break;
1244
1245                 case Amount:
1246                         /*
1247                          * When mounting on an already mounted upon directory,
1248                          * one wants subsequent mounts to be attached to the
1249                          * original directory, not the replacement.  Don't domount.
1250                          */
1251                         break;
1252
1253                 case Acreate:
1254                         /*
1255                          * We've already walked all but the last element.
1256                          * If the last exists, try to open it OTRUNC.
1257                          * If omode&OEXCL is set, just give up.
1258                          */
1259                         e.ARRAY_SIZEs++;
1260                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, wh, NULL) == 0) {
1261                                 if (omode & O_EXCL)
1262                                         error(EEXIST, ERROR_FIXME);
1263                                 omode |= O_TRUNC;
1264                                 goto Open;
1265                         }
1266
1267                         /*
1268                          * The semantics of the create(2) system call are that if the
1269                          * file exists and can be written, it is to be opened with truncation.
1270                          * On the other hand, the create(5) message fails if the file exists.
1271                          * If we get two create(2) calls happening simultaneously,
1272                          * they might both get here and send create(5) messages, but only
1273                          * one of the messages will succeed.  To provide the expected create(2)
1274                          * semantics, the call with the failed message needs to try the above
1275                          * walk again, opening for truncation.  This correctly solves the
1276                          * create/create race, in the sense that any observable outcome can
1277                          * be explained as one happening before the other.
1278                          * The create/create race is quite common.  For example, it happens
1279                          * when two rc subshells simultaneously update the same
1280                          * environment variable.
1281                          *
1282                          * The implementation still admits a create/create/remove race:
1283                          * (A) walk to file, fails
1284                          * (B) walk to file, fails
1285                          * (A) create file, succeeds, returns
1286                          * (B) create file, fails
1287                          * (A) remove file, succeeds, returns
1288                          * (B) walk to file, return failure.
1289                          *
1290                          * This is hardly as common as the create/create race, and is really
1291                          * not too much worse than what might happen if (B) got a hold of a
1292                          * file descriptor and then the file was removed -- either way (B) can't do
1293                          * anything with the result of the create call.  So we don't care about this race.
1294                          *
1295                          * Applications that care about more fine-grained decision of the races
1296                          * can use the OEXCL flag to get at the underlying create(5) semantics;
1297                          * by default we provide the common case.
1298                          *
1299                          * We need to stay behind the mount point in case we
1300                          * need to do the first walk again (should the create fail).
1301                          *
1302                          * We also need to cross the mount point and find the directory
1303                          * in the union in which we should be creating.
1304                          *
1305                          * The channel staying behind is c, the one moving forward is cnew.
1306                          */
1307                         m = NULL;
1308                         cnew = NULL;    /* is this assignment necessary? */
1309                         /* discard error */
1310                         if (!waserror()) {      /* try create */
1311                                 if (wh->can_mount && findmount(&cnew, &m, c->type, c->dev,
1312                                                                c->qid))
1313                                         cnew = createdir(cnew, m);
1314                                 else {
1315                                         cnew = c;
1316                                         chan_incref(cnew);
1317                                 }
1318
1319                                 /*
1320                                  * We need our own copy of the Chan because we're
1321                                  * about to send a create, which will move it.  Once we have
1322                                  * our own copy, we can fix the name, which might be wrong
1323                                  * if findmount gave us a new Chan.
1324                                  */
1325                                 cnew = cunique(cnew);
1326                                 cnameclose(cnew->name);
1327                                 cnew->name = c->name;
1328                                 kref_get(&cnew->name->ref, 1);
1329
1330                                 cnew->flag |= omode & CEXTERNAL_FLAGS;
1331                                 devtab[cnew->type].create(cnew, e.elems[e.ARRAY_SIZEs - 1],
1332                                                                                   omode & ~(O_EXCL | O_CLOEXEC),
1333                                                                                   perm, ext);
1334                                 poperror();
1335
1336                                 if (m)
1337                                         putmhead(m);
1338                                 cclose(c);
1339                                 c = cnew;
1340                                 c->name = addelem(c->name, e.elems[e.ARRAY_SIZEs - 1]);
1341                                 break;
1342                         }
1343
1344                         /* create failed */
1345                         cclose(cnew);
1346                         if (m)
1347                                 putmhead(m);
1348                         if (omode & O_EXCL)
1349                                 nexterror();    /* safe since we're in a waserror() */
1350                         poperror();     /* matching the if(!waserror) */
1351
1352                         /* save error, so walk doesn't clobber our existing errstr */
1353                         strlcpy(tmperrbuf, current_errstr(), sizeof(tmperrbuf));
1354                         saved_errno = get_errno();
1355                         /* note: we depend that walk does not error */
1356                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, wh, NULL) < 0) {
1357                                 set_errno(saved_errno);
1358                                 /* Report the error we had originally */
1359                                 error(EFAIL, tmperrbuf);
1360                         }
1361                         strlcpy(current_errstr(), tmperrbuf, MAX_ERRSTR_LEN);
1362                         omode |= O_TRUNC;
1363                         goto Open;
1364
1365                 default:
1366                         panic("unknown namec access %d\n", amode);
1367         }
1368
1369         poperror();
1370
1371         if (e.ARRAY_SIZEs > 0)
1372                 strlcpy(get_cur_genbuf(), e.elems[e.ARRAY_SIZEs - 1], GENBUF_SZ);
1373         else
1374                 strlcpy(get_cur_genbuf(), ".", GENBUF_SZ);
1375
1376         kfree(e.name);
1377         kfree(e.elems);
1378         kfree(e.off);
1379
1380         return c;
1381 }
1382
1383 struct chan *namec(char *name, int amode, int omode, uint32_t perm, void *ext)
1384 {
1385         struct walk_helper wh = {.can_mount = true};
1386         struct chan *c;
1387         char *devname, *devspec;
1388         int n, devtype;
1389
1390         if (name[0] == '\0')
1391                 error(EFAIL, "empty file name");
1392         validname(name, 1);
1393         /*
1394          * Find the starting off point (the current slash, the root of
1395          * a device tree, or the current dot) as well as the name to
1396          * evaluate starting there.
1397          */
1398         switch (name[0]) {
1399                 case '/':
1400                         if (current)
1401                                 c = current->slash;
1402                         else
1403                                 c = kern_slash;
1404                         chan_incref(c);
1405                         break;
1406
1407                 case '#':
1408                         wh.can_mount = false;
1409                         devname = get_cur_genbuf();
1410                         devname[0] = '\0';
1411                         n = 0;
1412                         name++; /* drop the # */
1413                         while ((*name != '\0') && (*name != '/')) {
1414                                 if (n >= GENBUF_SZ - 1)
1415                                         error(ENAMETOOLONG, ERROR_FIXME);
1416                                 devname[n++] = *name++;
1417                         }
1418                         devname[n] = '\0';
1419                         /* for a name #foo.spec, devname = foo\0, devspec = spec\0.
1420                          * genbuf contains foo\0spec\0.  for no spec, devspec = \0 */
1421                         devspec = strchr(devname, '.');
1422                         if (devspec) {
1423                                 *devspec = '\0';
1424                                 devspec++;
1425                         } else {
1426                                 devspec = &devname[n];
1427                         }
1428                         if (!strcmp(devname, "mnt"))
1429                                 error(EINVAL, ERROR_FIXME);
1430                         /* TODO: deal with this "nodevs" business. */
1431                         #if 0
1432                         /*
1433                          *  the nodevs exceptions are
1434                          *  |  it only gives access to pipes you create
1435                          *  e  this process's environment
1436                          *  s  private file2chan creation space
1437                          *  D private secure sockets name space
1438                          *  a private TLS name space
1439                          */
1440                         if (current->pgrp->nodevs &&
1441                                 //          (utfrune("|esDa", r) == NULL
1442                                 ((strchr("|esDa", get_cur_genbuf()[1]) == NULL)
1443                                  || (get_cur_genbuf()[1] == 's' // || r == 's'
1444                                          && get_cur_genbuf()[n] != '\0')))
1445                                 error(EINVAL, ERROR_FIXME);
1446                         #endif
1447                         devtype = devno(devname, 1);
1448                         if (devtype == -1)
1449                                 error(EFAIL, "Unknown #device %s (spec %s)", devname, devspec);
1450                         c = devtab[devtype].attach(devspec);
1451                         break;
1452                 default:
1453                         /* this case also covers \0 */
1454                         c = current->dot;
1455                         if (!c)
1456                                 panic("no dot!");
1457                         chan_incref(c);
1458                         break;
1459         }
1460         return __namec_from(c, name, amode, omode, perm, &wh, ext);
1461 }
1462
1463 struct chan *namec_from(struct chan *c, char *name, int amode, int omode,
1464                         uint32_t perm, void *ext)
1465 {
1466         struct walk_helper wh = {.can_mount = true};
1467
1468         if (name[0] == '\0') {
1469                 /* Our responsibility to cclose 'c' on our error */
1470                 cclose(c);
1471                 error(EFAIL, "empty file name");
1472         }
1473         validname(name, 1);
1474         return __namec_from(c, name, amode, omode, perm, &wh, ext);
1475 }
1476
1477 /*
1478  * name is valid. skip leading / and ./ as much as possible
1479  */
1480 char *skipslash(char *name)
1481 {
1482         while (name[0] == '/'
1483                    || (name[0] == '.' && (name[1] == 0 || name[1] == '/')))
1484                 name++;
1485         return name;
1486 }
1487
1488 char isfrog[256] = {
1489          /*NUL*/ 1, 1, 1, 1, 1, 1, 1, 1,
1490          /*BKS*/ 1, 1, 1, 1, 1, 1, 1, 1,
1491          /*DLE*/ 1, 1, 1, 1, 1, 1, 1, 1,
1492          /*CAN*/ 1, 1, 1, 1, 1, 1, 1, 1,
1493         ['/'] 1,
1494         [0x7f] 1,
1495 };
1496
1497 /*
1498  * Check that the name
1499  *  a) is in valid memory.
1500  *  b) is shorter than 2^16 bytes, so it can fit in a 9P string field.
1501  *  c) contains no frogs.
1502  * The first byte is known to be addressible by the requester, so the
1503  * routine works for kernel and user memory both.
1504  * The parameter slashok flags whether a slash character is an error
1505  * or a valid character.
1506  */
1507 void validname(char *aname, int slashok)
1508 {
1509         char *ename, *name;
1510         int c;
1511
1512         name = aname;
1513         ename = memchr(name, 0, (1 << 16));
1514
1515         if (ename == NULL || ename - name >= (1 << 16))
1516                 error(EINVAL, "Name too long");
1517
1518         while (*name) {
1519                 /* all characters above '~' are ok */
1520                 c = *(uint8_t *) name;
1521 #if 0
1522                 if (c >= Runeself)
1523                         name += chartorune(&r, name);
1524 #endif
1525                 if (c >= 0x7f) {
1526                         error(EFAIL, "Akaros doesn't do UTF-8");
1527                 } else {
1528                         if (isfrog[c])
1529                                 if (!slashok || c != '/') {
1530                                         error(EINVAL, "%s (%p), at char %c", aname, aname, c);
1531                                 }
1532                         name++;
1533                 }
1534         }
1535 }
1536
1537 void isdir(struct chan *c)
1538 {
1539         if (c->qid.type & QTDIR)
1540                 return;
1541         error(ENOTDIR, ERROR_FIXME);
1542 }
1543
1544 /*
1545  * This is necessary because there are many
1546  * pointers to the top of a given mount list:
1547  *
1548  *      - the mhead in the namespace hash table
1549  *      - the mhead in chans returned from findmount:
1550  *        used in namec and then by unionread.
1551  *      - the mhead in chans returned from createdir:
1552  *        used in the open/create race protect, which is gone.
1553  *
1554  * The RWlock in the Mhead protects the mount list it contains.
1555  * The mount list is deleted when we cunmount.
1556  * The RWlock ensures that nothing is using the mount list at that time.
1557  *
1558  * It is okay to replace c->mh with whatever you want as
1559  * long as you are sure you have a unique reference to it.
1560  *
1561  * This comment might belong somewhere else.
1562  */
1563 void putmhead(struct mhead *m)
1564 {
1565         if (m)
1566                 kref_put(&m->ref);
1567 }
1568
1569 /* Given s, make a copy of a string with padding bytes in front.  Returns a
1570  * pointer to the start of the string and the memory to free in str_store.
1571  *
1572  * Free str_store with kfree. */
1573 static char *pad_and_strdup(char *s, int padding, char **str_store)
1574 {
1575         char *store = kzmalloc(strlen(s) + 1 + padding, MEM_WAIT);
1576
1577         strlcpy(store + padding, s, strlen(s) + 1);
1578         *str_store = store;
1579         return store + padding;
1580 }
1581
1582 /* Walks a symlink c.  Returns the target chan, which could be the symlink
1583  * itself, if we're NO_FOLLOW.  On success, we'll decref the symlink and give
1584  * you a ref counted result.
1585  *
1586  * Returns NULL on error, and does not close the symlink.  Like regular walk, it
1587  * is all or nothing. */
1588 static struct chan *walk_symlink(struct chan *symlink, struct walk_helper *wh,
1589                                  unsigned int nr_names_left)
1590 {
1591         struct dir *dir;
1592         char *link_name, *link_store;
1593         struct chan *from;
1594         Elemlist e = {0};
1595
1596         /* mildly expensive: need to rlock the namespace */
1597         if (is_mount_point(symlink))
1598                 return symlink;
1599         if (!nr_names_left && wh->no_follow)
1600                 return symlink;
1601         if (wh->nr_loops >= WALK_MAX_NR_LOOPS) {
1602                 set_error(ELOOP, "too many nested symlinks in walk");
1603                 return NULL;
1604         }
1605         dir = chandirstat(symlink);
1606         if (!dir) {
1607                 /* Should propagate the error from dev.stat() */
1608                 return NULL;
1609         }
1610         if (!(dir->mode & DMSYMLINK)) {
1611                 set_error(ELOOP, "symlink isn't a symlink!");
1612                 kfree(dir);
1613                 return NULL;
1614         }
1615         link_name = pad_and_strdup(dir->ext, 3, &link_store);
1616         kfree(dir);
1617
1618         if (link_name[0] == '/') {
1619                 if (current)
1620                         from = current->slash;
1621                 else
1622                         from = kern_slash;
1623         } else {
1624                 from = symlink;
1625                 link_name -= 3;
1626                 strncpy(link_name, "../", 3);
1627                 if (!from->name)
1628                         from->name = newcname("");
1629         }
1630         /* we close this ref on failure or it gets walked to the result. */
1631         chan_incref(from);
1632
1633         parsename(link_name, &e);
1634         kfree(link_store);
1635
1636         wh->nr_loops++;
1637         if (walk(&from, e.elems, e.ARRAY_SIZEs, wh, NULL) < 0) {
1638                 cclose(from);
1639                 from = NULL;
1640         } else {
1641                 cclose(symlink);
1642                 if (from->qid.type & QTSYMLINK) {
1643                         symlink = from;
1644                         from = walk_symlink(symlink, wh, nr_names_left);
1645                         if (!from)
1646                                 cclose(symlink);
1647                 }
1648         }
1649         wh->nr_loops--;
1650
1651         kfree(e.name);
1652         kfree(e.elems);
1653         kfree(e.off);
1654         return from;
1655 }