9ns: allow 'current-less' operations in 9ns
[akaros.git] / kern / src / ns / chan.c
1 /* Copyright © 1994-1999 Lucent Technologies Inc.  All rights reserved.
2  * Portions Copyright © 1997-1999 Vita Nuova Limited
3  * Portions Copyright © 2000-2007 Vita Nuova Holdings Limited
4  *                                (www.vitanuova.com)
5  * Revisions Copyright © 2000-2007 Lucent Technologies Inc. and others
6  *
7  * Modified for the Akaros operating system:
8  * Copyright (c) 2013-2014 The Regents of the University of California
9  * Copyright (c) 2013-2015 Google Inc.
10  *
11  * Permission is hereby granted, free of charge, to any person obtaining a copy
12  * of this software and associated documentation files (the "Software"), to deal
13  * in the Software without restriction, including without limitation the rights
14  * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
15  * copies of the Software, and to permit persons to whom the Software is
16  * furnished to do so, subject to the following conditions:
17  *
18  * The above copyright notice and this permission notice shall be included in
19  * all copies or substantial portions of the Software.
20  *
21  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
22  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
23  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL THE
24  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
25  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
26  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
27  * SOFTWARE. */
28
29 #include <vfs.h>
30 #include <kfs.h>
31 #include <slab.h>
32 #include <kmalloc.h>
33 #include <kref.h>
34 #include <string.h>
35 #include <stdio.h>
36 #include <assert.h>
37 #include <error.h>
38 #include <cpio.h>
39 #include <pmap.h>
40 #include <smp.h>
41 #include <syscall.h>
42
43 struct chan *kern_slash;
44
45 char *channame(struct chan *c)
46 {       /* DEBUGGING */
47         if (c == NULL)
48                 return "<NULL chan>";
49         if (c->name == NULL)
50                 return "<NULL name>";
51         if (c->name->s == NULL)
52                 return "<NULL name.s>";
53         return c->name->s;
54 }
55
56 enum {
57         CNAMESLOP = 20
58 };
59
60 struct {
61         spinlock_t lock;
62         int fid;
63         struct chan *free;
64         struct chan *list;
65 } chanalloc;
66
67 typedef struct Elemlist Elemlist;
68
69 struct Elemlist {
70         char *name;                                     /* copy of name, so '/' can be overwritten */
71         int ARRAY_SIZEs;
72         char **elems;
73         int *off;
74         int mustbedir;
75 };
76
77 struct walk_helper {
78         bool can_mount;
79         bool no_follow;
80         unsigned int nr_loops;
81 };
82 #define WALK_MAX_NR_LOOPS 8
83
84 static struct chan *walk_symlink(struct chan *symlink, struct walk_helper *wh,
85                                  unsigned int nr_names_left);
86
87 #define SEP(c) ((c) == 0 || (c) == '/')
88 void cleancname(struct cname *);
89
90 int isdotdot(char *p)
91 {
92         return p[0] == '.' && p[1] == '.' && p[2] == '\0';
93 }
94
95 int emptystr(char *s)
96 {
97         if (s == NULL)
98                 return 1;
99         if (s[0] == '\0')
100                 return 1;
101         return 0;
102 }
103
104 /*
105  * Atomically replace *p with copy of s
106  */
107 void kstrdup(char **p, char *s)
108 {
109         int n;
110         char *t, *prev;
111
112         n = strlen(s) + 1;
113         /* if it's a user, we can wait for memory; if not, something's very wrong */
114         if (current) {
115                 t = kzmalloc(n, 0);
116         } else {
117                 t = kzmalloc(n, 0);
118                 if (t == NULL)
119                         panic("kstrdup: no memory");
120         }
121         memmove(t, s, n);
122         prev = *p;
123         *p = t;
124         kfree(prev);
125 }
126
127 void chandevreset(void)
128 {
129         int i;
130
131         for (i = 0; &devtab[i] < __devtabend; i++) {
132                 if (devtab[i].reset)
133                         devtab[i].reset();
134         }
135 }
136
137 void chandevinit(void)
138 {
139         int i;
140
141         for (i = 0; &devtab[i] < __devtabend; i++) {
142                 if (devtab[i].init)
143                         devtab[i].init();
144         }
145 }
146
147 void chandevshutdown(void)
148 {
149         int i;
150
151         /* shutdown in reverse order */
152         for (i = 0; &devtab[i] < __devtabend; i++) ;
153         for (i--; i >= 0; i--) {
154                 if (devtab[i].shutdown)
155                         devtab[i].shutdown();
156         }
157 }
158
159 static void chan_release(struct kref *kref)
160 {
161         struct chan *c = container_of(kref, struct chan, ref);
162         ERRSTACK(1);
163         /* this style discards the error from close().  picture it as
164          * if (waserror()) { } else { close(); } chanfree_no_matter_what();  */
165         if (!waserror()) {
166                 printd("releasing chan %p, type %d\n", c, c->type);
167                 /* -1 means there is no dev yet.  wants a noop for close() */
168                 if (c->type != -1)
169                         devtab[c->type].close(c);
170         }
171         /* need to poperror regardless of whether we error'd or not */
172         poperror();
173         /* and chan free no matter what */
174         chanfree(c);
175 }
176
177 struct chan *newchan(void)
178 {
179         struct chan *c;
180
181         spin_lock(&(&chanalloc)->lock);
182         c = chanalloc.free;
183         if (c != 0)
184                 chanalloc.free = c->next;
185         spin_unlock(&(&chanalloc)->lock);
186
187         if (c == NULL) {
188                 c = kzmalloc(sizeof(struct chan), 0);
189                 spin_lock(&(&chanalloc)->lock);
190                 c->fid = ++chanalloc.fid;
191                 c->link = chanalloc.list;
192                 chanalloc.list = c;
193                 spin_unlock(&(&chanalloc)->lock);
194                 spinlock_init(&c->lock);
195                 qlock_init(&c->umqlock);
196         }
197
198         /* if you get an error before associating with a dev, cclose skips calling
199          * the dev's close */
200         c->type = -1;
201         c->flag = 0;
202         kref_init(&c->ref, chan_release, 1);
203         c->dev = 0;
204         c->offset = 0;
205         c->iounit = 0;
206         c->umh = 0;
207         c->uri = 0;
208         c->dri = 0;
209         c->aux = 0;
210         c->mchan = 0;
211         c->mcp = 0;
212         c->mux = 0;
213         c->mqid.path = 0;
214         c->mqid.vers = 0;
215         c->mqid.type = 0;
216         c->name = 0;
217         c->buf = NULL;
218         c->mountpoint = NULL;
219         return c;
220 }
221
222 static void __cname_release(struct kref *kref)
223 {
224         struct cname *n = container_of(kref, struct cname, ref);
225         kfree(n->s);
226         kfree(n);
227 }
228
229 struct cname *newcname(char *s)
230 {
231         struct cname *n;
232         int i;
233
234         n = kzmalloc(sizeof(*n), 0);
235         i = strlen(s);
236         n->len = i;
237         n->alen = i + CNAMESLOP;
238         n->s = kzmalloc(n->alen, 0);
239         memmove(n->s, s, i + 1);
240         kref_init(&n->ref, __cname_release, 1);
241         return n;
242 }
243
244 void cnameclose(struct cname *n)
245 {
246         if (n == NULL)
247                 return;
248         kref_put(&n->ref);
249 }
250
251 struct cname *addelem(struct cname *n, char *s)
252 {
253         int i, a;
254         char *t;
255         struct cname *new;
256
257         if (s[0] == '.' && s[1] == '\0')
258                 return n;
259
260         if (kref_refcnt(&n->ref) > 1) {
261                 /* copy on write */
262                 new = newcname(n->s);
263                 cnameclose(n);
264                 n = new;
265         }
266
267         i = strlen(s);
268         if (n->len + 1 + i + 1 > n->alen) {
269                 a = n->len + 1 + i + 1 + CNAMESLOP;
270                 t = kzmalloc(a, 0);
271                 memmove(t, n->s, n->len + 1);
272                 kfree(n->s);
273                 n->s = t;
274                 n->alen = a;
275         }
276         if (n->len > 0 && n->s[n->len - 1] != '/' && s[0] != '/')       /* don't insert extra slash if one is present */
277                 n->s[n->len++] = '/';
278         memmove(n->s + n->len, s, i + 1);
279         n->len += i;
280         if (isdotdot(s))
281                 cleancname(n);
282         return n;
283 }
284
285 void chanfree(struct chan *c)
286 {
287         c->flag = CFREE;
288
289         if (c->umh != NULL) {
290                 putmhead(c->umh);
291                 c->umh = NULL;
292         }
293         if (c->umc != NULL) {
294                 cclose(c->umc);
295                 c->umc = NULL;
296         }
297         if (c->mux != NULL) {
298                 //
299                 muxclose(c->mux);
300                 c->mux = NULL;
301         }
302         if (c->mchan != NULL) {
303                 cclose(c->mchan);
304                 c->mchan = NULL;
305         }
306
307         cnameclose(c->name);
308         if (c->buf)
309                 kfree(c->buf);
310         c->buf = NULL;
311         c->bufused = 0;
312         c->ateof = 0;
313
314         spin_lock(&(&chanalloc)->lock);
315         c->next = chanalloc.free;
316         chanalloc.free = c;
317         spin_unlock(&(&chanalloc)->lock);
318 }
319
320 void cclose(struct chan *c)
321 {
322         if (c == 0)
323                 return;
324
325         if (c->flag & CFREE)
326                 panic("cclose %p", getcallerpc(&c));
327
328         kref_put(&c->ref);
329 }
330
331 /* convenience wrapper for interposition.  if you do use this, don't forget
332  * about the kref_get_not_zero in plan9setup() */
333 void chan_incref(struct chan *c)
334 {
335         kref_get(&c->ref, 1);
336 }
337
338 /*
339  * Make sure we have the only copy of c.  (Copy on write.)
340  */
341 struct chan *cunique(struct chan *c)
342 {
343         struct chan *nc;
344
345         if (kref_refcnt(&c->ref) != 1) {
346                 nc = cclone(c);
347                 cclose(c);
348                 c = nc;
349         }
350
351         return c;
352 }
353
354 int eqqid(struct qid a, struct qid b)
355 {
356         return a.path == b.path && a.vers == b.vers;
357 }
358
359 int eqchan(struct chan *a, struct chan *b, int pathonly)
360 {
361         if (a->qid.path != b->qid.path)
362                 return 0;
363         if (!pathonly && a->qid.vers != b->qid.vers)
364                 return 0;
365         if (a->type != b->type)
366                 return 0;
367         if (a->dev != b->dev)
368                 return 0;
369         return 1;
370 }
371
372 int eqchantdqid(struct chan *a, int type, int dev, struct qid qid, int pathonly)
373 {
374         if (a->qid.path != qid.path)
375                 return 0;
376         if (!pathonly && a->qid.vers != qid.vers)
377                 return 0;
378         if (a->type != type)
379                 return 0;
380         if (a->dev != dev)
381                 return 0;
382         return 1;
383 }
384
385 static void mh_release(struct kref *kref)
386 {
387         struct mhead *mh = container_of(kref, struct mhead, ref);
388         mh->mount = (struct mount *)0xCafeBeef;
389         kfree(mh);
390 }
391
392 struct mhead *newmhead(struct chan *from)
393 {
394         struct mhead *mh;
395
396         mh = kzmalloc(sizeof(struct mhead), 0);
397         kref_init(&mh->ref, mh_release, 1);
398         rwinit(&mh->lock);
399         mh->from = from;
400         chan_incref(from);
401
402 /*
403         n = from->name->len;
404         if(n >= sizeof(mh->fromname))
405                 n = sizeof(mh->fromname)-1;
406         memmove(mh->fromname, from->name->s, n);
407         mh->fromname[n] = 0;
408 */
409         return mh;
410 }
411
412 int cmount(struct chan *new, struct chan *old, int flag, char *spec)
413 {
414         ERRSTACK(1);
415         struct pgrp *pg;
416         int order, flg;
417         struct mhead *m, **l, *mh;
418         struct mount *nm, *f, *um, **h;
419
420         /* Can bind anything onto a symlink's name.  Otherwise, both the old and the
421          * new must agree on whether or not it is a directory. */
422         if (!(old->qid.type & QTSYMLINK) &&
423             (QTDIR & (old->qid.type ^ new->qid.type)))
424                 error(EINVAL, ERROR_FIXME);
425
426         if (old->umh)
427                 printd("cmount old extra umh\n");
428
429         order = flag & MORDER;
430
431         if ((old->qid.type & QTDIR) == 0 && order != MREPL)
432                 error(EINVAL, ERROR_FIXME);
433
434         mh = new->umh;
435
436         /*
437          * Not allowed to bind when the old directory
438          * is itself a union.  (Maybe it should be allowed, but I don't see
439          * what the semantics would be.)
440          *
441          * We need to check mh->mount->next to tell unions apart from
442          * simple mount points, so that things like
443          *  mount -c fd /root
444          *  bind -c /root /
445          * work.  The check of mount->mflag catches things like
446          *  mount fd /root
447          *  bind -c /root /
448          *
449          * This is far more complicated than it should be, but I don't
450          * see an easier way at the moment.     -rsc
451          */
452         if ((flag & MCREATE) && mh && mh->mount
453                 && (mh->mount->next || !(mh->mount->mflag & MCREATE)))
454                 error(EEXIST, ERROR_FIXME);
455
456         pg = current->pgrp;
457         wlock(&pg->ns);
458
459         l = &MOUNTH(pg, old->qid);
460         for (m = *l; m; m = m->hash) {
461                 if (eqchan(m->from, old, 1))
462                         break;
463                 l = &m->hash;
464         }
465
466         if (m == NULL) {
467                 /*
468                  *  nothing mounted here yet.  create a mount
469                  *  head and add to the hash table.
470                  */
471                 m = newmhead(old);
472                 *l = m;
473
474                 /*
475                  *  if this is a union mount, add the old
476                  *  node to the mount chain.
477                  */
478                 if (order != MREPL)
479                         m->mount = newmount(m, old, 0, 0);
480         }
481         wlock(&m->lock);
482         if (waserror()) {
483                 wunlock(&m->lock);
484                 nexterror();
485         }
486         wunlock(&pg->ns);
487
488         nm = newmount(m, new, flag, spec);
489         if (mh != NULL && mh->mount != NULL) {
490                 /*
491                  *  copy a union when binding it onto a directory
492                  */
493                 flg = order;
494                 if (order == MREPL)
495                         flg = MAFTER;
496                 h = &nm->next;
497                 um = mh->mount;
498                 for (um = um->next; um; um = um->next) {
499                         f = newmount(m, um->to, flg, um->spec);
500                         *h = f;
501                         h = &f->next;
502                 }
503         }
504
505         if (m->mount && order == MREPL) {
506                 mountfree(m->mount);
507                 m->mount = 0;
508         }
509
510         if (flag & MCREATE)
511                 nm->mflag |= MCREATE;
512
513         if (m->mount && order == MAFTER) {
514                 for (f = m->mount; f->next; f = f->next) ;
515                 f->next = nm;
516         } else {
517                 for (f = nm; f->next; f = f->next) ;
518                 f->next = m->mount;
519                 m->mount = nm;
520         }
521
522         wunlock(&m->lock);
523         poperror();
524         return nm->mountid;
525 }
526
527 void cunmount(struct chan *mnt, struct chan *mounted)
528 {
529         struct pgrp *pg;
530         struct mhead *m, **l;
531         struct mount *f, **p;
532
533         if (mnt->umh)   /* should not happen */
534                 printd("cunmount newp extra umh %p has %p\n", mnt, mnt->umh);
535
536         /*
537          * It _can_ happen that mounted->umh is non-NULL,
538          * because mounted is the result of namec(Aopen)
539          * (see sysfile.c:/^sysunmount).
540          * If we open a union directory, it will have a umh.
541          * Although surprising, this is okay, since the
542          * cclose will take care of freeing the umh.
543          */
544
545         pg = current->pgrp;
546         wlock(&pg->ns);
547
548         l = &MOUNTH(pg, mnt->qid);
549         for (m = *l; m; m = m->hash) {
550                 if (eqchan(m->from, mnt, 1))
551                         break;
552                 l = &m->hash;
553         }
554
555         if (m == 0) {
556                 wunlock(&pg->ns);
557                 error(ENOENT, ERROR_FIXME);
558         }
559
560         wlock(&m->lock);
561         if (mounted == 0) {
562                 *l = m->hash;
563                 wunlock(&pg->ns);
564                 mountfree(m->mount);
565                 m->mount = NULL;
566                 cclose(m->from);
567                 wunlock(&m->lock);
568                 putmhead(m);
569                 return;
570         }
571
572         p = &m->mount;
573         for (f = *p; f; f = f->next) {
574                 /* BUG: Needs to be 2 pass */
575                 if (eqchan(f->to, mounted, 1) ||
576                         (f->to->mchan && eqchan(f->to->mchan, mounted, 1))) {
577                         *p = f->next;
578                         f->next = 0;
579                         mountfree(f);
580                         if (m->mount == NULL) {
581                                 *l = m->hash;
582                                 cclose(m->from);
583                                 wunlock(&m->lock);
584                                 wunlock(&pg->ns);
585                                 putmhead(m);
586                                 return;
587                         }
588                         wunlock(&m->lock);
589                         wunlock(&pg->ns);
590                         return;
591                 }
592                 p = &f->next;
593         }
594         wunlock(&m->lock);
595         wunlock(&pg->ns);
596         error(ENOENT, ERROR_FIXME);
597 }
598
599 struct chan *cclone(struct chan *c)
600 {
601         struct chan *nc;
602         struct walkqid *wq;
603
604         wq = devtab[c->type].walk(c, NULL, NULL, 0);
605         if (wq == NULL)
606                 error(EFAIL, "clone failed");
607         nc = wq->clone;
608         kfree(wq);
609         nc->name = c->name;
610         if (c->name)
611                 kref_get(&c->name->ref, 1);
612         return nc;
613 }
614
615 /* Helper: is something mounted on the chan? */
616 static bool is_mount_point(struct chan *c)
617 {
618         struct pgrp *pg;
619         struct mhead *m;
620         int type = c->type;
621         int dev = c->dev;
622         struct qid qid = c->qid;
623
624         if (!current)
625                 return false;
626         pg = current->pgrp;
627         rlock(&pg->ns);
628         for (m = MOUNTH(pg, qid); m; m = m->hash) {
629                 rlock(&m->lock);
630                 if (!m->from) {
631                         runlock(&m->lock);
632                         continue;
633                 }
634                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
635                         runlock(&m->lock);
636                         runlock(&pg->ns);
637                         return true;
638                 }
639                 runlock(&m->lock);
640         }
641         runlock(&pg->ns);
642         return false;
643 }
644
645 int
646 findmount(struct chan **cp,
647                   struct mhead **mp, int type, int dev, struct qid qid)
648 {
649         struct pgrp *pg;
650         struct mhead *m;
651
652         if (!current)
653                 return 0;
654         pg = current->pgrp;
655         rlock(&pg->ns);
656         for (m = MOUNTH(pg, qid); m; m = m->hash) {
657                 rlock(&m->lock);
658                 if (m->from == NULL) {
659                         printd("m %p m->from 0\n", m);
660                         runlock(&m->lock);
661                         continue;
662                 }
663                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
664                         runlock(&pg->ns);
665                         if (mp != NULL) {
666                                 kref_get(&m->ref, 1);
667                                 if (*mp != NULL)
668                                         putmhead(*mp);
669                                 *mp = m;
670                         }
671                         if (*cp != NULL)
672                                 cclose(*cp);
673                         chan_incref(m->mount->to);
674                         *cp = m->mount->to;
675                         runlock(&m->lock);
676                         return 1;
677                 }
678                 runlock(&m->lock);
679         }
680
681         runlock(&pg->ns);
682         return 0;
683 }
684
685 int domount(struct chan **cp, struct mhead **mp)
686 {
687         return findmount(cp, mp, (*cp)->type, (*cp)->dev, (*cp)->qid);
688 }
689
690 struct chan *undomount(struct chan *c, struct cname *name)
691 {
692         ERRSTACK(1);
693         struct chan *nc;
694         struct pgrp *pg;
695         struct mount *t;
696         struct mhead **h, **he, *f;
697
698         if (!current)
699                 return c;
700         pg = current->pgrp;
701         rlock(&pg->ns);
702         if (waserror()) {
703                 runlock(&pg->ns);
704                 nexterror();
705         }
706
707         he = &pg->mnthash[MNTHASH];
708         for (h = pg->mnthash; h < he; h++) {
709                 for (f = *h; f; f = f->hash) {
710                         if (strcmp(f->from->name->s, name->s) != 0)
711                                 continue;
712                         for (t = f->mount; t; t = t->next) {
713                                 if (eqchan(c, t->to, 1)) {
714                                         /*
715                                          * We want to come out on the left hand side of the mount
716                                          * point using the element of the union that we entered on.
717                                          * To do this, find the element that has a from name of
718                                          * c->name->s.
719                                          */
720                                         if (strcmp(t->head->from->name->s, name->s) != 0)
721                                                 continue;
722                                         nc = t->head->from;
723                                         chan_incref(nc);
724                                         cclose(c);
725                                         c = nc;
726                                         break;
727                                 }
728                         }
729                 }
730         }
731         poperror();
732         runlock(&pg->ns);
733         return c;
734 }
735
736 /*
737  * Either walks all the way or not at all.  No partial results in *cp.
738  * *nerror is the number of names to display in an error message.
739  */
740 int walk(struct chan **cp, char **names, int nnames, struct walk_helper *wh,
741          int *nerror)
742 {
743         int dev, dotdot, i, n, nhave, ntry, type;
744         struct chan *c, *nc, *lastmountpoint = NULL;
745         struct cname *cname;
746         struct mount *f;
747         struct mhead *mh, *nmh;
748         struct walkqid *wq;
749
750         c = *cp;
751         chan_incref(c);
752         cname = c->name;
753         kref_get(&cname->ref, 1);
754         mh = NULL;
755
756         /*
757          * While we haven't gotten all the way down the path:
758          *    1. step through a mount point, if any
759          *    2. send a walk request for initial dotdot or initial prefix without dotdot
760          *    3. move to the first mountpoint along the way.
761          *    4. repeat.
762          *
763          * An invariant is that each time through the loop, c is on the undomount
764          * side of the mount point, and c's name is cname.
765          */
766         for (nhave = 0; nhave < nnames; nhave += n) {
767                 /* We only allow symlink when they are first and it's .. (see below) */
768                 if ((c->qid.type & (QTDIR | QTSYMLINK)) == 0) {
769                         if (nerror)
770                                 *nerror = nhave;
771                         cnameclose(cname);
772                         cclose(c);
773                         set_error(ENOTDIR, ERROR_FIXME);
774                         if (mh != NULL)
775                                 putmhead(mh);
776                         return -1;
777                 }
778                 ntry = nnames - nhave;
779                 if (ntry > MAXWELEM)
780                         ntry = MAXWELEM;
781                 dotdot = 0;
782                 for (i = 0; i < ntry; i++) {
783                         if (isdotdot(names[nhave + i])) {
784                                 if (i == 0) {
785                                         dotdot = 1;
786                                         ntry = 1;
787                                 } else
788                                         ntry = i;
789                                 break;
790                         }
791                 }
792
793                 if (!dotdot && wh->can_mount)
794                         domount(&c, &mh);
795                 /* Bug - the only time we walk from a symlink should be during
796                  * walk_symlink, which should have given us a dotdot. */
797                 if ((c->qid.type & QTSYMLINK) && !dotdot)
798                         panic("Got a walk from a symlink that wasn't ..!");
799
800                 type = c->type;
801                 dev = c->dev;
802
803                 if ((wq = devtab[type].walk(c, NULL, names + nhave, ntry)) == NULL) {
804                         /* try a union mount, if any */
805                         if (mh && wh->can_mount) {
806                                 /*
807                                  * mh->mount == c, so start at mh->mount->next
808                                  */
809                                 rlock(&mh->lock);
810                                 for (f = mh->mount->next; f; f = f->next)
811                                         if ((wq =
812                                                  devtab[f->to->type].walk(f->to, NULL, names + nhave,
813                                                                                                   ntry)) != NULL)
814                                                 break;
815                                 runlock(&mh->lock);
816                                 if (f != NULL) {
817                                         type = f->to->type;
818                                         dev = f->to->dev;
819                                 }
820                         }
821                         if (wq == NULL) {
822                                 cclose(c);
823                                 cnameclose(cname);
824                                 if (nerror)
825                                         *nerror = nhave + 1;
826                                 if (mh != NULL)
827                                         putmhead(mh);
828                                 return -1;
829                         }
830                 }
831
832                 nmh = NULL;
833                 if (dotdot) {
834                         assert(wq->nqid == 1);
835                         assert(wq->clone != NULL);
836
837                         cname = addelem(cname, "..");
838                         nc = undomount(wq->clone, cname);
839                         n = 1;
840                 } else {
841                         nc = NULL;
842                         if (wh->can_mount)
843                                 for (i = 0; i < wq->nqid && i < ntry - 1; i++)
844                                         if (findmount(&nc, &nmh, type, dev, wq->qid[i]))
845                                                 break;
846                         if (nc == NULL) {       /* no mount points along path */
847                                 if (wq->clone == NULL) {
848                                         cclose(c);
849                                         cnameclose(cname);
850                                         if (wq->nqid == 0 || (wq->qid[wq->nqid - 1].type & QTDIR)) {
851                                                 if (nerror)
852                                                         *nerror = nhave + wq->nqid + 1;
853                                                 set_error(ENOENT, "walk failed");
854                                         } else {
855                                                 if (nerror)
856                                                         *nerror = nhave + wq->nqid;
857                                                 set_error(ENOTDIR, "walk failed");
858                                         }
859                                         kfree(wq);
860                                         if (mh != NULL)
861                                                 putmhead(mh);
862                                         return -1;
863                                 }
864                                 n = wq->nqid;
865                                 if (wq->clone->qid.type & QTSYMLINK) {
866                                         nc = walk_symlink(wq->clone, wh, nnames - nhave - n);
867                                         if (!nc) {
868                                                 /* walk_symlink() set error.  This seems to be the
869                                                  * standard walk() error-cleanup. */
870                                                 if (nerror)
871                                                         *nerror = nhave + wq->nqid;
872                                                 cclose(c);
873                                                 cclose(wq->clone);
874                                                 cnameclose(cname);
875                                                 kfree(wq);
876                                                 if (mh != NULL)
877                                                         putmhead(mh);
878                                                 return -1;
879                                         }
880                                 } else {
881                                         nc = wq->clone;
882                                 }
883                         } else {        /* stopped early, at a mount point */
884                                 if (wq->clone != NULL) {
885                                         cclose(wq->clone);
886                                         wq->clone = NULL;
887                                 }
888                                 lastmountpoint = nc;
889                                 n = i + 1;
890                         }
891                         for (i = 0; i < n; i++)
892                                 cname = addelem(cname, names[nhave + i]);
893                 }
894                 cclose(c);
895                 c = nc;
896                 putmhead(mh);
897                 mh = nmh;
898                 kfree(wq);
899         }
900
901         putmhead(mh);
902
903         c = cunique(c);
904
905         if (c->umh != NULL) {   //BUG
906                 printd("walk umh\n");
907                 putmhead(c->umh);
908                 c->umh = NULL;
909         }
910
911         cnameclose(c->name);
912         c->name = cname;
913         c->mountpoint = lastmountpoint;
914
915         cclose(*cp);
916         *cp = c;
917         if (nerror)
918                 *nerror = 0;
919         return 0;
920 }
921
922 /*
923  * c is a mounted non-creatable directory.  find a creatable one.
924  */
925 struct chan *createdir(struct chan *c, struct mhead *m)
926 {
927         ERRSTACK(1);
928         struct chan *nc;
929         struct mount *f;
930
931         rlock(&m->lock);
932         if (waserror()) {
933                 runlock(&m->lock);
934                 nexterror();
935         }
936         for (f = m->mount; f; f = f->next) {
937                 if (f->mflag & MCREATE) {
938                         nc = cclone(f->to);
939                         runlock(&m->lock);
940                         poperror();
941                         cclose(c);
942                         return nc;
943                 }
944         }
945         error(EPERM, ERROR_FIXME);
946         poperror();
947         return 0;
948 }
949
950 /*
951  * In place, rewrite name to compress multiple /, eliminate ., and process ..
952  */
953 void cleancname(struct cname *n)
954 {
955         char *p;
956
957         if (n->s[0] == '#') {
958                 p = strchr(n->s, '/');
959                 if (p == NULL)
960                         return;
961                 cleanname(p);
962
963                 /*
964                  * The correct name is #i rather than #i/,
965                  * but the correct name of #/ is #/.
966                  */
967                 if (strcmp(p, "/") == 0 && n->s[1] != '/')
968                         *p = '\0';
969         } else
970                 cleanname(n->s);
971         n->len = strlen(n->s);
972 }
973
974 static void growparse(Elemlist * e)
975 {
976         char **new;
977         int *inew;
978         enum { Delta = 8 };
979
980         if (e->ARRAY_SIZEs % Delta == 0) {
981                 new = kzmalloc((e->ARRAY_SIZEs + Delta) * sizeof(char *), 0);
982                 memmove(new, e->elems, e->ARRAY_SIZEs * sizeof(char *));
983                 kfree(e->elems);
984                 e->elems = new;
985                 inew = kzmalloc((e->ARRAY_SIZEs + Delta + 1) * sizeof(int), 0);
986                 memmove(inew, e->off, e->ARRAY_SIZEs * sizeof(int));
987                 kfree(e->off);
988                 e->off = inew;
989         }
990 }
991
992 /*
993  * The name is known to be valid.
994  * Copy the name so slashes can be overwritten.
995  * An empty string will set ARRAY_SIZE=0.
996  * A path ending in / or /. or /.//./ etc. will have
997  * e.mustbedir = 1, so that we correctly
998  * reject, e.g., "/adm/users/." when /adm/users is a file
999  * rather than a directory.
1000  */
1001 static void parsename(char *name, Elemlist * e)
1002 {
1003         char *slash;
1004
1005         kstrdup(&e->name, name);
1006         name = e->name;
1007         e->ARRAY_SIZEs = 0;
1008         e->elems = NULL;
1009         e->off = kzmalloc(sizeof(int), 0);
1010         e->off[0] = skipslash(name) - name;
1011         for (;;) {
1012                 name = skipslash(name);
1013                 if (*name == '\0') {
1014                         e->mustbedir = 1;
1015                         break;
1016                 }
1017                 growparse(e);
1018
1019                 e->elems[e->ARRAY_SIZEs++] = name;
1020                 /* we may want to do this again some day
1021                    slash = utfrune(name, '/');
1022                  */
1023                 slash = strchr(name, '/');
1024                 if (slash == NULL) {
1025                         e->off[e->ARRAY_SIZEs] = name + strlen(name) - e->name;
1026                         e->mustbedir = 0;
1027                         break;
1028                 }
1029                 e->off[e->ARRAY_SIZEs] = slash - e->name;
1030                 *slash++ = '\0';
1031                 name = slash;
1032         }
1033 }
1034
1035 void *memrchr(void *va, int c, long n)
1036 {
1037         uint8_t *a, *e;
1038
1039         a = va;
1040         for (e = a + n - 1; e > a; e--)
1041                 if (*e == c)
1042                         return e;
1043         return NULL;
1044 }
1045
1046 /*
1047  * Turn a name into a channel.
1048  * &name[0] is known to be a valid address.  It may be a kernel address.
1049  *
1050  * Opening with amode Aopen, Acreate, or Aremove guarantees
1051  * that the result will be the only reference to that particular fid.
1052  * This is necessary since we might pass the result to
1053  * devtab[].remove().
1054  *
1055  * Opening Atodir, Amount, or Aaccess does not guarantee this.
1056  *
1057  * Opening Aaccess can, under certain conditions, return a
1058  * correct Chan* but with an incorrect struct cname attached.
1059  * Since the functions that open Aaccess (sysstat, syswstat, sys_stat)
1060  * do not use the struct cname*, this avoids an unnecessary clone.
1061  *
1062  * The classic namec() is broken into a front end to get the starting point and
1063  * a __namec_from, which does the guts of the lookup.  */
1064 static struct chan *__namec_from(struct chan *c, char *aname, int amode,
1065                                  int omode, uint32_t perm,
1066                                  struct walk_helper *wh, void *ext)
1067 {
1068         ERRSTACK(2);
1069         int len, npath;
1070         struct chan *cnew;
1071         struct cname *cname;
1072         Elemlist e;
1073         struct mhead *m;
1074         char tmperrbuf[ERRMAX];
1075         int saved_errno;
1076         // Rune r;
1077
1078         static_assert(!(CINTERNAL_FLAGS & CEXTERNAL_FLAGS));
1079
1080         e.name = NULL;
1081         e.elems = NULL;
1082         e.off = NULL;
1083         e.ARRAY_SIZEs = 0;
1084         if (waserror()) {
1085                 cclose(c);
1086                 kfree(e.name);
1087                 kfree(e.elems);
1088                 kfree(e.off);
1089                 //dumpmount();
1090                 nexterror();
1091         }
1092
1093         /*
1094          * Build a list of elements in the path.
1095          */
1096         parsename(aname, &e);
1097
1098         if (e.mustbedir)
1099                 omode &= ~O_NOFOLLOW;
1100         /*
1101          * On create, ....
1102          */
1103         if (amode == Acreate) {
1104                 /* perm must have DMDIR if last element is / or /. */
1105                 if (e.mustbedir && !(perm & DMDIR)) {
1106                         npath = e.ARRAY_SIZEs;
1107                         error(EINVAL, "create without DMDIR");
1108                 }
1109
1110                 /* don't try to walk the last path element just yet. */
1111                 if (e.ARRAY_SIZEs == 0)
1112                         error(EEXIST, ERROR_FIXME);
1113                 e.ARRAY_SIZEs--;
1114                 /* We're dropping the last element, which O_NOFOLLOW applied to.  Not
1115                  * sure if there are any legit reasons to have O_NOFOLLOW with create.*/
1116                 omode &= ~O_NOFOLLOW;
1117         }
1118         switch (amode) {
1119         /* the difference for stat and lstat (Aaccess) are handled in sysfile.c */
1120         case Abind:
1121         case Amount:
1122         case Aremove:
1123                 omode |= O_NOFOLLOW;
1124                 break;
1125         }
1126         if (omode & O_NOFOLLOW)
1127                 wh->no_follow = true;
1128
1129         if (walk(&c, e.elems, e.ARRAY_SIZEs, wh, &npath) < 0) {
1130                 if (npath < 0 || npath > e.ARRAY_SIZEs) {
1131                         printd("namec %s walk error npath=%d\n", aname, npath);
1132                         error(EFAIL, "walk failed");
1133                 }
1134                 /* Old plan 9 errors would jump here for the magic error parsing. */
1135 NameError:
1136                 if (current_errstr()[0]) {
1137                         /* errstr is set, we'll just stick with it and error out */
1138                         error_jmp();
1139                 } else {
1140                         error(EFAIL, "Name to chan lookup failed");
1141                 }
1142                 /* brho: skipping the namec custom error string business, since it hides
1143                  * the underlying failure.  implement this if you want the old stuff. */
1144 #if 0
1145                 strlcpy(tmperrbuf, current->errstr, sizeof(tmperrbuf));
1146                 len = prefix + e.off[npath]; // prefix was name - aname, the start pt
1147                 if (len < ERRMAX / 3 || (name = memrchr(aname, '/', len)) == NULL
1148                         || name == aname)
1149                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "%.*s", len,
1150                                          aname);
1151                 else
1152                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "...%.*s",
1153                                          (int)(len - (name - aname)), name);
1154                 snprintf(current->errstr, ERRMAX, "%#q %s", get_cur_genbuf(),
1155                                  tmperrbuf);
1156 #endif
1157         }
1158
1159         if (e.mustbedir && !(c->qid.type & QTDIR)) {
1160                 npath = e.ARRAY_SIZEs;
1161                 error(ENOTDIR, "not a dir, but mustbedir.  trailing slash?");
1162         }
1163
1164         if ((amode == Aopen) && (omode & O_EXEC) && (c->qid.type & QTDIR)) {
1165                 npath = e.ARRAY_SIZEs;
1166                 error(EFAIL, "cannot exec directory");
1167         }
1168
1169         switch (amode) {
1170                 case Aaccess:
1171                         if (wh->can_mount)
1172                                 domount(&c, NULL);
1173                         break;
1174
1175                 case Abind:
1176                         m = NULL;
1177                         if (wh->can_mount)
1178                                 domount(&c, &m);
1179                         if (c->umh != NULL)
1180                                 putmhead(c->umh);
1181                         c->umh = m;
1182                         break;
1183
1184                 case Aremove:
1185                 case Aopen:
1186 Open:
1187                         /* save the name; domount might change c */
1188                         cname = c->name;
1189                         kref_get(&cname->ref, 1);
1190                         m = NULL;
1191                         if (wh->can_mount)
1192                                 domount(&c, &m);
1193
1194                         /* our own copy to open or remove */
1195                         c = cunique(c);
1196
1197                         /* now it's our copy anyway, we can put the name back */
1198                         cnameclose(c->name);
1199                         c->name = cname;
1200
1201                         switch (amode) {
1202                                 case Aremove:
1203                                         putmhead(m);
1204                                         break;
1205
1206                                 case Aopen:
1207                                 case Acreate:
1208                                         if (c->umh != NULL) {
1209                                                 printd("cunique umh\n");
1210                                                 putmhead(c->umh);
1211                                                 c->umh = NULL;
1212                                         }
1213
1214                                         /* only save the mount head if it's a multiple element union */
1215                                         if (m && m->mount && m->mount->next)
1216                                                 c->umh = m;
1217                                         else
1218                                                 putmhead(m);
1219                                         if (omode == O_EXEC)
1220                                                 c->flag &= ~CCACHE;
1221                                         /* here is where convert omode/vfs flags to c->flags.
1222                                          * careful, O_CLOEXEC and O_REMCLO are in there.  might need
1223                                          * to change that. */
1224                                         c->flag |= omode & CEXTERNAL_FLAGS;
1225                                         c = devtab[c->type].open(c,
1226                                                                  omode & ~O_CLOEXEC);
1227                                         /* if you get this from a dev, in the dev's open, you are
1228                                          * probably saving mode directly, without passing it through
1229                                          * openmode. */
1230                                         if (c->mode & O_TRUNC)
1231                                                 error(EFAIL, "Device %s open failed to clear O_TRUNC",
1232                                                       devtab[c->type].name);
1233                                         break;
1234                         }
1235                         break;
1236
1237                 case Atodir:
1238                         /*
1239                          * Directories (e.g. for cd) are left before the mount point,
1240                          * so one may mount on / or . and see the effect.
1241                          */
1242                         if (!(c->qid.type & QTDIR))
1243                                 error(ENOTDIR, ERROR_FIXME);
1244                         break;
1245
1246                 case Amount:
1247                         /*
1248                          * When mounting on an already mounted upon directory,
1249                          * one wants subsequent mounts to be attached to the
1250                          * original directory, not the replacement.  Don't domount.
1251                          */
1252                         break;
1253
1254                 case Acreate:
1255                         /*
1256                          * We've already walked all but the last element.
1257                          * If the last exists, try to open it OTRUNC.
1258                          * If omode&OEXCL is set, just give up.
1259                          */
1260                         e.ARRAY_SIZEs++;
1261                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, wh, NULL) == 0) {
1262                                 if (omode & O_EXCL)
1263                                         error(EEXIST, ERROR_FIXME);
1264                                 omode |= O_TRUNC;
1265                                 goto Open;
1266                         }
1267
1268                         /*
1269                          * The semantics of the create(2) system call are that if the
1270                          * file exists and can be written, it is to be opened with truncation.
1271                          * On the other hand, the create(5) message fails if the file exists.
1272                          * If we get two create(2) calls happening simultaneously,
1273                          * they might both get here and send create(5) messages, but only
1274                          * one of the messages will succeed.  To provide the expected create(2)
1275                          * semantics, the call with the failed message needs to try the above
1276                          * walk again, opening for truncation.  This correctly solves the
1277                          * create/create race, in the sense that any observable outcome can
1278                          * be explained as one happening before the other.
1279                          * The create/create race is quite common.  For example, it happens
1280                          * when two rc subshells simultaneously update the same
1281                          * environment variable.
1282                          *
1283                          * The implementation still admits a create/create/remove race:
1284                          * (A) walk to file, fails
1285                          * (B) walk to file, fails
1286                          * (A) create file, succeeds, returns
1287                          * (B) create file, fails
1288                          * (A) remove file, succeeds, returns
1289                          * (B) walk to file, return failure.
1290                          *
1291                          * This is hardly as common as the create/create race, and is really
1292                          * not too much worse than what might happen if (B) got a hold of a
1293                          * file descriptor and then the file was removed -- either way (B) can't do
1294                          * anything with the result of the create call.  So we don't care about this race.
1295                          *
1296                          * Applications that care about more fine-grained decision of the races
1297                          * can use the OEXCL flag to get at the underlying create(5) semantics;
1298                          * by default we provide the common case.
1299                          *
1300                          * We need to stay behind the mount point in case we
1301                          * need to do the first walk again (should the create fail).
1302                          *
1303                          * We also need to cross the mount point and find the directory
1304                          * in the union in which we should be creating.
1305                          *
1306                          * The channel staying behind is c, the one moving forward is cnew.
1307                          */
1308                         m = NULL;
1309                         cnew = NULL;    /* is this assignment necessary? */
1310                         /* discard error */
1311                         if (!waserror()) {      /* try create */
1312                                 if (wh->can_mount && findmount(&cnew, &m, c->type, c->dev,
1313                                                                c->qid))
1314                                         cnew = createdir(cnew, m);
1315                                 else {
1316                                         cnew = c;
1317                                         chan_incref(cnew);
1318                                 }
1319
1320                                 /*
1321                                  * We need our own copy of the Chan because we're
1322                                  * about to send a create, which will move it.  Once we have
1323                                  * our own copy, we can fix the name, which might be wrong
1324                                  * if findmount gave us a new Chan.
1325                                  */
1326                                 cnew = cunique(cnew);
1327                                 cnameclose(cnew->name);
1328                                 cnew->name = c->name;
1329                                 kref_get(&cnew->name->ref, 1);
1330
1331                                 cnew->flag |= omode & CEXTERNAL_FLAGS;
1332                                 devtab[cnew->type].create(cnew, e.elems[e.ARRAY_SIZEs - 1],
1333                                                                                   omode & ~(O_EXCL | O_CLOEXEC),
1334                                                                                   perm, ext);
1335                                 poperror();
1336
1337                                 if (m)
1338                                         putmhead(m);
1339                                 cclose(c);
1340                                 c = cnew;
1341                                 c->name = addelem(c->name, e.elems[e.ARRAY_SIZEs - 1]);
1342                                 break;
1343                         }
1344
1345                         /* create failed */
1346                         cclose(cnew);
1347                         if (m)
1348                                 putmhead(m);
1349                         if (omode & O_EXCL)
1350                                 nexterror();    /* safe since we're in a waserror() */
1351                         poperror();     /* matching the if(!waserror) */
1352
1353                         /* save error, so walk doesn't clobber our existing errstr */
1354                         strlcpy(tmperrbuf, current_errstr(), sizeof(tmperrbuf));
1355                         saved_errno = get_errno();
1356                         /* note: we depend that walk does not error */
1357                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, wh, NULL) < 0) {
1358                                 set_errno(saved_errno);
1359                                 /* Report the error we had originally */
1360                                 error(EFAIL, tmperrbuf);
1361                         }
1362                         strlcpy(current_errstr(), tmperrbuf, MAX_ERRSTR_LEN);
1363                         omode |= O_TRUNC;
1364                         goto Open;
1365
1366                 default:
1367                         panic("unknown namec access %d\n", amode);
1368         }
1369
1370         poperror();
1371
1372         if (e.ARRAY_SIZEs > 0)
1373                 strlcpy(get_cur_genbuf(), e.elems[e.ARRAY_SIZEs - 1], GENBUF_SZ);
1374         else
1375                 strlcpy(get_cur_genbuf(), ".", GENBUF_SZ);
1376
1377         kfree(e.name);
1378         kfree(e.elems);
1379         kfree(e.off);
1380
1381         return c;
1382 }
1383
1384 struct chan *namec(char *name, int amode, int omode, uint32_t perm, void *ext)
1385 {
1386         struct walk_helper wh = {.can_mount = true};
1387         struct chan *c;
1388         char *devname, *devspec;
1389         int n, devtype;
1390
1391         if (name[0] == '\0')
1392                 error(EFAIL, "empty file name");
1393         validname(name, 1);
1394         /*
1395          * Find the starting off point (the current slash, the root of
1396          * a device tree, or the current dot) as well as the name to
1397          * evaluate starting there.
1398          */
1399         switch (name[0]) {
1400                 case '/':
1401                         if (current)
1402                                 c = current->slash;
1403                         else
1404                                 c = kern_slash;
1405                         chan_incref(c);
1406                         break;
1407
1408                 case '#':
1409                         wh.can_mount = false;
1410                         devname = get_cur_genbuf();
1411                         devname[0] = '\0';
1412                         n = 0;
1413                         name++; /* drop the # */
1414                         while ((*name != '\0') && (*name != '/')) {
1415                                 if (n >= GENBUF_SZ - 1)
1416                                         error(ENAMETOOLONG, ERROR_FIXME);
1417                                 devname[n++] = *name++;
1418                         }
1419                         devname[n] = '\0';
1420                         /* for a name #foo.spec, devname = foo\0, devspec = spec\0.
1421                          * genbuf contains foo\0spec\0.  for no spec, devspec = \0 */
1422                         devspec = strchr(devname, '.');
1423                         if (devspec) {
1424                                 *devspec = '\0';
1425                                 devspec++;
1426                         } else {
1427                                 devspec = &devname[n];
1428                         }
1429                         if (!strcmp(devname, "mnt"))
1430                                 error(EINVAL, ERROR_FIXME);
1431                         /* TODO: deal with this "nodevs" business. */
1432                         #if 0
1433                         /*
1434                          *  the nodevs exceptions are
1435                          *  |  it only gives access to pipes you create
1436                          *  e  this process's environment
1437                          *  s  private file2chan creation space
1438                          *  D private secure sockets name space
1439                          *  a private TLS name space
1440                          */
1441                         if (current->pgrp->nodevs &&
1442                                 //          (utfrune("|esDa", r) == NULL
1443                                 ((strchr("|esDa", get_cur_genbuf()[1]) == NULL)
1444                                  || (get_cur_genbuf()[1] == 's' // || r == 's'
1445                                          && get_cur_genbuf()[n] != '\0')))
1446                                 error(EINVAL, ERROR_FIXME);
1447                         #endif
1448                         devtype = devno(devname, 1);
1449                         if (devtype == -1)
1450                                 error(EFAIL, "Unknown #device %s (spec %s)", devname, devspec);
1451                         c = devtab[devtype].attach(devspec);
1452                         break;
1453                 default:
1454                         /* this case also covers \0 */
1455                         c = current->dot;
1456                         if (!c)
1457                                 panic("no dot!");
1458                         chan_incref(c);
1459                         break;
1460         }
1461         return __namec_from(c, name, amode, omode, perm, &wh, ext);
1462 }
1463
1464 struct chan *namec_from(struct chan *c, char *name, int amode, int omode,
1465                         uint32_t perm, void *ext)
1466 {
1467         struct walk_helper wh = {.can_mount = true};
1468
1469         if (name[0] == '\0') {
1470                 /* Our responsibility to cclose 'c' on our error */
1471                 cclose(c);
1472                 error(EFAIL, "empty file name");
1473         }
1474         validname(name, 1);
1475         return __namec_from(c, name, amode, omode, perm, &wh, ext);
1476 }
1477
1478 /*
1479  * name is valid. skip leading / and ./ as much as possible
1480  */
1481 char *skipslash(char *name)
1482 {
1483         while (name[0] == '/'
1484                    || (name[0] == '.' && (name[1] == 0 || name[1] == '/')))
1485                 name++;
1486         return name;
1487 }
1488
1489 char isfrog[256] = {
1490          /*NUL*/ 1, 1, 1, 1, 1, 1, 1, 1,
1491          /*BKS*/ 1, 1, 1, 1, 1, 1, 1, 1,
1492          /*DLE*/ 1, 1, 1, 1, 1, 1, 1, 1,
1493          /*CAN*/ 1, 1, 1, 1, 1, 1, 1, 1,
1494         ['/'] 1,
1495         [0x7f] 1,
1496 };
1497
1498 /*
1499  * Check that the name
1500  *  a) is in valid memory.
1501  *  b) is shorter than 2^16 bytes, so it can fit in a 9P string field.
1502  *  c) contains no frogs.
1503  * The first byte is known to be addressible by the requester, so the
1504  * routine works for kernel and user memory both.
1505  * The parameter slashok flags whether a slash character is an error
1506  * or a valid character.
1507  */
1508 void validname(char *aname, int slashok)
1509 {
1510         char *ename, *name;
1511         int c;
1512
1513         name = aname;
1514         ename = memchr(name, 0, (1 << 16));
1515
1516         if (ename == NULL || ename - name >= (1 << 16))
1517                 error(EINVAL, "Name too long");
1518
1519         while (*name) {
1520                 /* all characters above '~' are ok */
1521                 c = *(uint8_t *) name;
1522 #if 0
1523                 if (c >= Runeself)
1524                         name += chartorune(&r, name);
1525 #endif
1526                 if (c >= 0x7f) {
1527                         error(EFAIL, "Akaros doesn't do UTF-8");
1528                 } else {
1529                         if (isfrog[c])
1530                                 if (!slashok || c != '/') {
1531                                         error(EINVAL, "%s (%p), at char %c", aname, aname, c);
1532                                 }
1533                         name++;
1534                 }
1535         }
1536 }
1537
1538 void isdir(struct chan *c)
1539 {
1540         if (c->qid.type & QTDIR)
1541                 return;
1542         error(ENOTDIR, ERROR_FIXME);
1543 }
1544
1545 /*
1546  * This is necessary because there are many
1547  * pointers to the top of a given mount list:
1548  *
1549  *      - the mhead in the namespace hash table
1550  *      - the mhead in chans returned from findmount:
1551  *        used in namec and then by unionread.
1552  *      - the mhead in chans returned from createdir:
1553  *        used in the open/create race protect, which is gone.
1554  *
1555  * The RWlock in the Mhead protects the mount list it contains.
1556  * The mount list is deleted when we cunmount.
1557  * The RWlock ensures that nothing is using the mount list at that time.
1558  *
1559  * It is okay to replace c->mh with whatever you want as
1560  * long as you are sure you have a unique reference to it.
1561  *
1562  * This comment might belong somewhere else.
1563  */
1564 void putmhead(struct mhead *m)
1565 {
1566         if (m)
1567                 kref_put(&m->ref);
1568 }
1569
1570 /* Given s, make a copy of a string with padding bytes in front.  Returns a
1571  * pointer to the start of the string and the memory to free in str_store.
1572  *
1573  * Free str_store with kfree. */
1574 static char *pad_and_strdup(char *s, int padding, char **str_store)
1575 {
1576         char *store = kzmalloc(strlen(s) + 1 + padding, MEM_WAIT);
1577
1578         strlcpy(store + padding, s, strlen(s) + 1);
1579         *str_store = store;
1580         return store + padding;
1581 }
1582
1583 /* Walks a symlink c.  Returns the target chan, which could be the symlink
1584  * itself, if we're NO_FOLLOW.  On success, we'll decref the symlink and give
1585  * you a ref counted result.
1586  *
1587  * Returns NULL on error, and does not close the symlink.  Like regular walk, it
1588  * is all or nothing. */
1589 static struct chan *walk_symlink(struct chan *symlink, struct walk_helper *wh,
1590                                  unsigned int nr_names_left)
1591 {
1592         struct dir *dir;
1593         char *link_name, *link_store;
1594         struct chan *from;
1595         Elemlist e = {0};
1596
1597         /* mildly expensive: need to rlock the namespace */
1598         if (is_mount_point(symlink))
1599                 return symlink;
1600         if (!nr_names_left && wh->no_follow)
1601                 return symlink;
1602         if (wh->nr_loops >= WALK_MAX_NR_LOOPS) {
1603                 set_error(ELOOP, "too many nested symlinks in walk");
1604                 return NULL;
1605         }
1606         dir = chandirstat(symlink);
1607         if (!dir) {
1608                 /* Should propagate the error from dev.stat() */
1609                 return NULL;
1610         }
1611         if (!(dir->mode & DMSYMLINK)) {
1612                 set_error(ELOOP, "symlink isn't a symlink!");
1613                 kfree(dir);
1614                 return NULL;
1615         }
1616         link_name = pad_and_strdup(dir->ext, 3, &link_store);
1617         kfree(dir);
1618
1619         if (link_name[0] == '/') {
1620                 if (current)
1621                         from = current->slash;
1622                 else
1623                         from = kern_slash;
1624         } else {
1625                 from = symlink;
1626                 link_name -= 3;
1627                 strncpy(link_name, "../", 3);
1628                 if (!from->name)
1629                         from->name = newcname("");
1630         }
1631         /* we close this ref on failure or it gets walked to the result. */
1632         chan_incref(from);
1633
1634         parsename(link_name, &e);
1635         kfree(link_store);
1636
1637         wh->nr_loops++;
1638         if (walk(&from, e.elems, e.ARRAY_SIZEs, wh, NULL) < 0) {
1639                 cclose(from);
1640                 from = NULL;
1641         } else {
1642                 cclose(symlink);
1643                 if (from->qid.type & QTSYMLINK) {
1644                         symlink = from;
1645                         from = walk_symlink(symlink, wh, nr_names_left);
1646                         if (!from)
1647                                 cclose(symlink);
1648                 }
1649         }
1650         wh->nr_loops--;
1651
1652         kfree(e.name);
1653         kfree(e.elems);
1654         kfree(e.off);
1655         return from;
1656 }