af83d1bac23203bdfe715b1a1915baa3d11ce2c2
[akaros.git] / kern / src / ns / chan.c
1 /* Copyright © 1994-1999 Lucent Technologies Inc.  All rights reserved.
2  * Portions Copyright © 1997-1999 Vita Nuova Limited
3  * Portions Copyright © 2000-2007 Vita Nuova Holdings Limited
4  *                                (www.vitanuova.com)
5  * Revisions Copyright © 2000-2007 Lucent Technologies Inc. and others
6  *
7  * Modified for the Akaros operating system:
8  * Copyright (c) 2013-2014 The Regents of the University of California
9  * Copyright (c) 2013-2015 Google Inc.
10  *
11  * Permission is hereby granted, free of charge, to any person obtaining a copy
12  * of this software and associated documentation files (the "Software"), to deal
13  * in the Software without restriction, including without limitation the rights
14  * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
15  * copies of the Software, and to permit persons to whom the Software is
16  * furnished to do so, subject to the following conditions:
17  *
18  * The above copyright notice and this permission notice shall be included in
19  * all copies or substantial portions of the Software.
20  *
21  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
22  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
23  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL THE
24  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
25  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
26  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
27  * SOFTWARE. */
28
29 #include <slab.h>
30 #include <kmalloc.h>
31 #include <kref.h>
32 #include <string.h>
33 #include <stdio.h>
34 #include <assert.h>
35 #include <error.h>
36 #include <cpio.h>
37 #include <pmap.h>
38 #include <smp.h>
39 #include <syscall.h>
40
41 struct chan *kern_slash;
42
43 char *channame(struct chan *c)
44 {       /* DEBUGGING */
45         if (c == NULL)
46                 return "<NULL chan>";
47         if (c->name == NULL)
48                 return "<NULL name>";
49         if (c->name->s == NULL)
50                 return "<NULL name.s>";
51         return c->name->s;
52 }
53
54 enum {
55         CNAMESLOP = 20
56 };
57
58 struct {
59         spinlock_t lock;
60         int fid;
61         struct chan *free;
62         struct chan *list;
63 } chanalloc;
64
65 typedef struct Elemlist Elemlist;
66
67 struct Elemlist {
68         char *name;             /* copy of name, so '/' can be overwritten */
69         int ARRAY_SIZEs;
70         char **elems;
71         int *off;
72         int mustbedir;
73 };
74
75 struct walk_helper {
76         bool can_mount;
77         bool no_follow;
78         unsigned int nr_loops;
79 };
80 #define WALK_MAX_NR_LOOPS 8
81
82 static struct chan *walk_symlink(struct chan *symlink, struct walk_helper *wh,
83                                  unsigned int nr_names_left);
84
85 #define SEP(c) ((c) == 0 || (c) == '/')
86 void cleancname(struct cname *);
87
88 int isdotdot(char *p)
89 {
90         return p[0] == '.' && p[1] == '.' && p[2] == '\0';
91 }
92
93 int emptystr(char *s)
94 {
95         if (s == NULL)
96                 return 1;
97         if (s[0] == '\0')
98                 return 1;
99         return 0;
100 }
101
102 /*
103  * Atomically replace *p with copy of s
104  */
105 void kstrdup(char **p, char *s)
106 {
107         int n;
108         char *t, *prev;
109
110         n = strlen(s) + 1;
111         /* if it's a user, we can wait for memory; if not, something's very
112          * wrong */
113         if (current) {
114                 t = kzmalloc(n, 0);
115         } else {
116                 t = kzmalloc(n, 0);
117                 if (t == NULL)
118                         panic("kstrdup: no memory");
119         }
120         memmove(t, s, n);
121
122         prev = atomic_swap_ptr((void**)p, t);
123         kfree(prev);
124 }
125
126 void chandevreset(void)
127 {
128         int i;
129
130         for (i = 0; &devtab[i] < __devtabend; i++) {
131                 if (devtab[i].reset)
132                         devtab[i].reset();
133         }
134 }
135
136 void chandevinit(void)
137 {
138         int i;
139
140         for (i = 0; &devtab[i] < __devtabend; i++) {
141                 if (devtab[i].init)
142                         devtab[i].init();
143         }
144 }
145
146 void chandevshutdown(void)
147 {
148         int i;
149
150         /* shutdown in reverse order */
151         for (i = 0; &devtab[i] < __devtabend; i++) ;
152         for (i--; i >= 0; i--) {
153                 if (devtab[i].shutdown)
154                         devtab[i].shutdown();
155         }
156 }
157
158 static void chan_release(struct kref *kref)
159 {
160         struct chan *c = container_of(kref, struct chan, ref);
161         ERRSTACK(1);
162
163         /* We can be called from RCU callbacks, but close methods can block.  In
164          * those cases, and any other context that cannot block, we need to
165          * defer our work to a kernel message. */
166         if (!can_block(this_pcpui_ptr())) {
167                 run_as_rkm(chan_release, kref);
168                 return;
169         }
170         /* this style discards the error from close().  picture it as
171          * if (waserror()) { } else { close(); } chanfree_no_matter_what();  */
172         if (!waserror()) {
173                 printd("releasing chan %p, type %d\n", c, c->type);
174                 /* -1 means there is no dev yet.  wants a noop for close() */
175                 if (c->type != -1)
176                         devtab[c->type].close(c);
177         }
178         /* need to poperror regardless of whether we error'd or not */
179         poperror();
180         /* and chan free no matter what */
181         chanfree(c);
182 }
183
184 struct chan *newchan(void)
185 {
186         struct chan *c;
187
188         spin_lock(&(&chanalloc)->lock);
189         c = chanalloc.free;
190         if (c != 0)
191                 chanalloc.free = c->next;
192         spin_unlock(&(&chanalloc)->lock);
193
194         if (c == NULL) {
195                 c = kzmalloc(sizeof(struct chan), 0);
196                 spin_lock(&(&chanalloc)->lock);
197                 c->fid = ++chanalloc.fid;
198                 c->link = chanalloc.list;
199                 chanalloc.list = c;
200                 spin_unlock(&(&chanalloc)->lock);
201                 spinlock_init(&c->lock);
202                 qlock_init(&c->umqlock);
203         }
204
205         /* if you get an error before associating with a dev, cclose skips
206          * calling the dev's close */
207         c->type = -1;
208         c->flag = 0;
209         kref_init(&c->ref, chan_release, 1);
210         c->dev = 0;
211         c->offset = 0;
212         c->iounit = 0;
213         c->umh = 0;
214         c->uri = 0;
215         c->dri = 0;
216         c->aux = 0;
217         c->mchan = 0;
218         c->mcp = 0;
219         c->mux = 0;
220         c->mqid.path = 0;
221         c->mqid.vers = 0;
222         c->mqid.type = 0;
223         c->name = 0;
224         c->buf = NULL;
225         c->mountpoint = NULL;
226         return c;
227 }
228
229 static void __cname_release(struct kref *kref)
230 {
231         struct cname *n = container_of(kref, struct cname, ref);
232         kfree(n->s);
233         kfree(n);
234 }
235
236 struct cname *newcname(char *s)
237 {
238         struct cname *n;
239         int i;
240
241         n = kzmalloc(sizeof(*n), 0);
242         i = strlen(s);
243         n->len = i;
244         n->alen = i + CNAMESLOP;
245         n->s = kzmalloc(n->alen, 0);
246         memmove(n->s, s, i + 1);
247         kref_init(&n->ref, __cname_release, 1);
248         return n;
249 }
250
251 void cnameclose(struct cname *n)
252 {
253         if (n == NULL)
254                 return;
255         kref_put(&n->ref);
256 }
257
258 struct cname *addelem(struct cname *n, char *s)
259 {
260         int i, a;
261         char *t;
262         struct cname *new;
263
264         if (s[0] == '.' && s[1] == '\0')
265                 return n;
266
267         if (kref_refcnt(&n->ref) > 1) {
268                 /* copy on write */
269                 new = newcname(n->s);
270                 cnameclose(n);
271                 n = new;
272         }
273
274         i = strlen(s);
275         if (n->len + 1 + i + 1 > n->alen) {
276                 a = n->len + 1 + i + 1 + CNAMESLOP;
277                 t = kzmalloc(a, 0);
278                 memmove(t, n->s, n->len + 1);
279                 kfree(n->s);
280                 n->s = t;
281                 n->alen = a;
282         }
283         /* don't insert extra slash if one is present */
284         if (n->len > 0 && n->s[n->len - 1] != '/' && s[0] != '/')
285                 n->s[n->len++] = '/';
286         memmove(n->s + n->len, s, i + 1);
287         n->len += i;
288         if (isdotdot(s))
289                 cleancname(n);
290         return n;
291 }
292
293 void chanfree(struct chan *c)
294 {
295         c->flag = CFREE;
296
297         if (c->umh != NULL) {
298                 putmhead(c->umh);
299                 c->umh = NULL;
300         }
301         if (c->umc != NULL) {
302                 cclose(c->umc);
303                 c->umc = NULL;
304         }
305         if (c->mux != NULL) {
306                 //
307                 muxclose(c->mux);
308                 c->mux = NULL;
309         }
310         if (c->mchan != NULL) {
311                 cclose(c->mchan);
312                 c->mchan = NULL;
313         }
314
315         cnameclose(c->name);
316         if (c->buf)
317                 kfree(c->buf);
318         c->buf = NULL;
319         c->bufused = 0;
320         c->ateof = 0;
321
322         spin_lock(&(&chanalloc)->lock);
323         c->next = chanalloc.free;
324         chanalloc.free = c;
325         spin_unlock(&(&chanalloc)->lock);
326 }
327
328 void cclose(struct chan *c)
329 {
330         if (c == 0)
331                 return;
332
333         if (c->flag & CFREE)
334                 panic("double cclose %p.  maybe kfunc channame and hexdump", c);
335
336         kref_put(&c->ref);
337 }
338
339 /* convenience wrapper for interposition.  if you do use this, don't forget
340  * about the kref_get_not_zero in plan9setup() */
341 void chan_incref(struct chan *c)
342 {
343         kref_get(&c->ref, 1);
344 }
345
346 /*
347  * Make sure we have the only copy of c.  (Copy on write.)
348  */
349 struct chan *cunique(struct chan *c)
350 {
351         struct chan *nc;
352
353         if (kref_refcnt(&c->ref) != 1) {
354                 nc = cclone(c);
355                 cclose(c);
356                 c = nc;
357         }
358
359         return c;
360 }
361
362 int eqqid(struct qid a, struct qid b)
363 {
364         return a.path == b.path && a.vers == b.vers;
365 }
366
367 int eqchan(struct chan *a, struct chan *b, int pathonly)
368 {
369         if (a->qid.path != b->qid.path)
370                 return 0;
371         if (!pathonly && a->qid.vers != b->qid.vers)
372                 return 0;
373         if (a->type != b->type)
374                 return 0;
375         if (a->dev != b->dev)
376                 return 0;
377         return 1;
378 }
379
380 int eqchantdqid(struct chan *a, int type, int dev, struct qid qid, int pathonly)
381 {
382         if (a->qid.path != qid.path)
383                 return 0;
384         if (!pathonly && a->qid.vers != qid.vers)
385                 return 0;
386         if (a->type != type)
387                 return 0;
388         if (a->dev != dev)
389                 return 0;
390         return 1;
391 }
392
393 static void mh_release(struct kref *kref)
394 {
395         struct mhead *mh = container_of(kref, struct mhead, ref);
396
397         mh->mount = (struct mount *)0xCafeBeef;
398         kfree(mh);
399 }
400
401 struct mhead *newmhead(struct chan *from)
402 {
403         struct mhead *mh;
404
405         mh = kzmalloc(sizeof(struct mhead), 0);
406         kref_init(&mh->ref, mh_release, 1);
407         rwinit(&mh->lock);
408         mh->from = from;
409         chan_incref(from);
410
411 /*
412         n = from->name->len;
413         if(n >= sizeof(mh->fromname))
414                 n = sizeof(mh->fromname)-1;
415         memmove(mh->fromname, from->name->s, n);
416         mh->fromname[n] = 0;
417 */
418         return mh;
419 }
420
421 int cmount(struct chan *new, struct chan *old, int flag, char *spec)
422 {
423         ERRSTACK(1);
424         struct pgrp *pg;
425         int order, flg;
426         struct mhead *m, **l, *mh;
427         struct mount *nm, *f, *um, **h;
428
429         /* Can't bind pointing to a symlink, since it vastly complicates namec
430          * and walk.  In particular, walk() only follows mounts on the
431          * intermediate path elements.  Grep 'ntry - 1'.  Because of that,
432          * walk() can end on a symlink.  Having domount() follow symlinks is a
433          * pain: undomount. */
434         if (new->qid.type & QTSYMLINK)
435                 error(EINVAL, "cannot bind a symlink");
436
437         /* Can bind anything onto a symlink's name.  Otherwise, both the old and
438          * the new must agree on whether or not it is a directory. */
439         if (!(old->qid.type & QTSYMLINK) &&
440             (QTDIR & (old->qid.type ^ new->qid.type)))
441                 error(EINVAL, ERROR_FIXME);
442
443         if (old->umh)
444                 printd("cmount old extra umh\n");
445
446         order = flag & MORDER;
447
448         if ((old->qid.type & QTDIR) == 0 && order != MREPL)
449                 error(EINVAL, ERROR_FIXME);
450
451         mh = new->umh;
452
453         /*
454          * Not allowed to bind when the old directory
455          * is itself a union.  (Maybe it should be allowed, but I don't see
456          * what the semantics would be.)
457          *
458          * We need to check mh->mount->next to tell unions apart from
459          * simple mount points, so that things like
460          *  mount -c fd /root
461          *  bind -c /root /
462          * work.  The check of mount->mflag catches things like
463          *  mount fd /root
464          *  bind -c /root /
465          *
466          * This is far more complicated than it should be, but I don't
467          * see an easier way at the moment.     -rsc
468          */
469         if ((flag & MCREATE) && mh && mh->mount
470                 && (mh->mount->next || !(mh->mount->mflag & MCREATE)))
471                 error(EEXIST, ERROR_FIXME);
472
473         pg = current->pgrp;
474         wlock(&pg->ns);
475
476         l = &MOUNTH(pg, old->qid);
477         for (m = *l; m; m = m->hash) {
478                 if (eqchan(m->from, old, 1))
479                         break;
480                 l = &m->hash;
481         }
482
483         if (m == NULL) {
484                 /*
485                  *  nothing mounted here yet.  create a mount
486                  *  head and add to the hash table.
487                  */
488                 m = newmhead(old);
489                 *l = m;
490
491                 /*
492                  *  if this is a union mount, add the old
493                  *  node to the mount chain.
494                  */
495                 if (order != MREPL)
496                         m->mount = newmount(m, old, 0, 0);
497         }
498         wlock(&m->lock);
499         if (waserror()) {
500                 wunlock(&m->lock);
501                 nexterror();
502         }
503         wunlock(&pg->ns);
504
505         nm = newmount(m, new, flag, spec);
506         if (mh != NULL && mh->mount != NULL) {
507                 /*
508                  *  copy a union when binding it onto a directory
509                  */
510                 flg = order;
511                 if (order == MREPL)
512                         flg = MAFTER;
513                 h = &nm->next;
514                 um = mh->mount;
515                 for (um = um->next; um; um = um->next) {
516                         f = newmount(m, um->to, flg, um->spec);
517                         *h = f;
518                         h = &f->next;
519                 }
520         }
521
522         if (m->mount && order == MREPL) {
523                 mountfree(m->mount);
524                 m->mount = 0;
525         }
526
527         if (flag & MCREATE)
528                 nm->mflag |= MCREATE;
529
530         if (m->mount && order == MAFTER) {
531                 for (f = m->mount; f->next; f = f->next) ;
532                 f->next = nm;
533         } else {
534                 for (f = nm; f->next; f = f->next) ;
535                 f->next = m->mount;
536                 m->mount = nm;
537         }
538
539         wunlock(&m->lock);
540         poperror();
541         return nm->mountid;
542 }
543
544 void cunmount(struct chan *mnt, struct chan *mounted)
545 {
546         struct pgrp *pg;
547         struct mhead *m, **l;
548         struct mount *f, **p;
549
550         if (mnt->umh)   /* should not happen */
551                 printd("cunmount newp extra umh %p has %p\n", mnt, mnt->umh);
552
553         /*
554          * It _can_ happen that mounted->umh is non-NULL,
555          * because mounted is the result of namec(Aopen)
556          * (see sysfile.c:/^sysunmount).
557          * If we open a union directory, it will have a umh.
558          * Although surprising, this is okay, since the
559          * cclose will take care of freeing the umh.
560          */
561
562         pg = current->pgrp;
563         wlock(&pg->ns);
564
565         l = &MOUNTH(pg, mnt->qid);
566         for (m = *l; m; m = m->hash) {
567                 if (eqchan(m->from, mnt, 1))
568                         break;
569                 l = &m->hash;
570         }
571
572         if (m == 0) {
573                 wunlock(&pg->ns);
574                 error(ENOENT, ERROR_FIXME);
575         }
576
577         wlock(&m->lock);
578         if (mounted == 0) {
579                 *l = m->hash;
580                 wunlock(&pg->ns);
581                 mountfree(m->mount);
582                 m->mount = NULL;
583                 cclose(m->from);
584                 wunlock(&m->lock);
585                 putmhead(m);
586                 return;
587         }
588
589         p = &m->mount;
590         for (f = *p; f; f = f->next) {
591                 /* BUG: Needs to be 2 pass */
592                 if (eqchan(f->to, mounted, 1) ||
593                         (f->to->mchan && eqchan(f->to->mchan, mounted, 1))) {
594                         *p = f->next;
595                         f->next = 0;
596                         mountfree(f);
597                         if (m->mount == NULL) {
598                                 *l = m->hash;
599                                 cclose(m->from);
600                                 wunlock(&m->lock);
601                                 wunlock(&pg->ns);
602                                 putmhead(m);
603                                 return;
604                         }
605                         wunlock(&m->lock);
606                         wunlock(&pg->ns);
607                         return;
608                 }
609                 p = &f->next;
610         }
611         wunlock(&m->lock);
612         wunlock(&pg->ns);
613         error(ENOENT, ERROR_FIXME);
614 }
615
616 struct chan *cclone(struct chan *c)
617 {
618         struct chan *nc;
619         struct walkqid *wq;
620
621         wq = devtab[c->type].walk(c, NULL, NULL, 0);
622         if (wq == NULL)
623                 error(EFAIL, "clone failed");
624         nc = wq->clone;
625         kfree(wq);
626         nc->name = c->name;
627         if (c->name)
628                 kref_get(&c->name->ref, 1);
629         return nc;
630 }
631
632 /* Helper: is something mounted on the chan? */
633 static bool is_mount_point(struct chan *c)
634 {
635         struct pgrp *pg;
636         struct mhead *m;
637         int type = c->type;
638         int dev = c->dev;
639         struct qid qid = c->qid;
640
641         if (!current)
642                 return false;
643         pg = current->pgrp;
644         rlock(&pg->ns);
645         for (m = MOUNTH(pg, qid); m; m = m->hash) {
646                 rlock(&m->lock);
647                 if (!m->from) {
648                         runlock(&m->lock);
649                         continue;
650                 }
651                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
652                         runlock(&m->lock);
653                         runlock(&pg->ns);
654                         return true;
655                 }
656                 runlock(&m->lock);
657         }
658         runlock(&pg->ns);
659         return false;
660 }
661
662 int findmount(struct chan **cp, struct mhead **mp, int type, int dev,
663               struct qid qid)
664 {
665         struct pgrp *pg;
666         struct mhead *m;
667
668         if (!current)
669                 return 0;
670         pg = current->pgrp;
671         rlock(&pg->ns);
672         for (m = MOUNTH(pg, qid); m; m = m->hash) {
673                 rlock(&m->lock);
674                 if (m->from == NULL) {
675                         printd("m %p m->from 0\n", m);
676                         runlock(&m->lock);
677                         continue;
678                 }
679                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
680                         runlock(&pg->ns);
681                         if (mp != NULL) {
682                                 kref_get(&m->ref, 1);
683                                 if (*mp != NULL)
684                                         putmhead(*mp);
685                                 *mp = m;
686                         }
687                         if (*cp != NULL)
688                                 cclose(*cp);
689                         chan_incref(m->mount->to);
690                         *cp = m->mount->to;
691                         runlock(&m->lock);
692                         return 1;
693                 }
694                 runlock(&m->lock);
695         }
696
697         runlock(&pg->ns);
698         return 0;
699 }
700
701 int domount(struct chan **cp, struct mhead **mp)
702 {
703         return findmount(cp, mp, (*cp)->type, (*cp)->dev, (*cp)->qid);
704 }
705
706 struct chan *undomount(struct chan *c, struct cname *name)
707 {
708         ERRSTACK(1);
709         struct chan *nc;
710         struct pgrp *pg;
711         struct mount *t;
712         struct mhead **h, **he, *f;
713
714         if (!current)
715                 return c;
716         pg = current->pgrp;
717         rlock(&pg->ns);
718         if (waserror()) {
719                 runlock(&pg->ns);
720                 nexterror();
721         }
722
723         he = &pg->mnthash[MNTHASH];
724         for (h = pg->mnthash; h < he; h++) {
725                 for (f = *h; f; f = f->hash) {
726                         if (strcmp(f->from->name->s, name->s) != 0)
727                                 continue;
728                         for (t = f->mount; t; t = t->next) {
729                                 if (eqchan(c, t->to, 1)) {
730                                         /*
731                                          * We want to come out on the left hand
732                                          * side of the mount point using the
733                                          * element of the union that we entered
734                                          * on.  To do this, find the element
735                                          * that has a from name of c->name->s.
736                                          */
737                                         if (strcmp(t->head->from->name->s,
738                                                    name->s) != 0)
739                                                 continue;
740                                         nc = t->head->from;
741                                         chan_incref(nc);
742                                         cclose(c);
743                                         c = nc;
744                                         break;
745                                 }
746                         }
747                 }
748         }
749         poperror();
750         runlock(&pg->ns);
751         return c;
752 }
753
754 /*
755  * Either walks all the way or not at all.  No partial results in *cp.
756  * *nerror is the number of names to display in an error message.
757  */
758 int walk(struct chan **cp, char **names, int nnames, struct walk_helper *wh,
759          int *nerror)
760 {
761         int dev, dotdot, i, n, nhave, ntry, type;
762         struct chan *c, *nc, *lastmountpoint = NULL;
763         struct cname *cname;
764         struct mount *f;
765         struct mhead *mh, *nmh;
766         struct walkqid *wq;
767
768         c = *cp;
769         chan_incref(c);
770         cname = c->name;
771         kref_get(&cname->ref, 1);
772         mh = NULL;
773
774         /*
775          * While we haven't gotten all the way down the path:
776          *    1. step through a mount point, if any
777          *    2. send a walk request for initial dotdot or initial prefix
778          *    without dotdot
779          *    3. move to the first mountpoint along the way.
780          *    4. repeat.
781          *
782          * An invariant is that each time through the loop, c is on the
783          * undomount side of the mount point, and c's name is cname.
784          */
785         for (nhave = 0; nhave < nnames; nhave += n) {
786                 /* We only allow symlink when they are first and it's .. (see
787                  * below) */
788                 if ((c->qid.type & (QTDIR | QTSYMLINK)) == 0) {
789                         if (nerror)
790                                 *nerror = nhave;
791                         cnameclose(cname);
792                         cclose(c);
793                         set_error(ENOTDIR, ERROR_FIXME);
794                         if (mh != NULL)
795                                 putmhead(mh);
796                         return -1;
797                 }
798                 ntry = nnames - nhave;
799                 if (ntry > MAXWELEM)
800                         ntry = MAXWELEM;
801                 dotdot = 0;
802                 for (i = 0; i < ntry; i++) {
803                         if (isdotdot(names[nhave + i])) {
804                                 if (i == 0) {
805                                         dotdot = 1;
806                                         ntry = 1;
807                                 } else
808                                         ntry = i;
809                                 break;
810                         }
811                 }
812
813                 if (!dotdot && wh->can_mount)
814                         domount(&c, &mh);
815                 /* Bug - the only time we walk from a symlink should be during
816                  * walk_symlink, which should have given us a dotdot. */
817                 if ((c->qid.type & QTSYMLINK) && !dotdot)
818                         panic("Got a walk from a symlink that wasn't ..!");
819
820                 type = c->type;
821                 dev = c->dev;
822
823                 if ((wq = devtab[type].walk(c, NULL, names + nhave, ntry)) ==
824                     NULL) {
825                         /* try a union mount, if any */
826                         if (mh && wh->can_mount) {
827                                 /*
828                                  * mh->mount == c, so start at mh->mount->next
829                                  */
830                                 rlock(&mh->lock);
831                                 for (f = mh->mount->next; f; f = f->next)
832                                         if ((wq =
833                                              devtab[f->to->type].walk(f->to,
834                                                                       NULL,
835                                                                       names +
836                                                                       nhave,
837                                                                       ntry)) !=
838                                             NULL)
839                                                 break;
840                                 runlock(&mh->lock);
841                                 if (f != NULL) {
842                                         type = f->to->type;
843                                         dev = f->to->dev;
844                                 }
845                         }
846                         if (wq == NULL) {
847                                 cclose(c);
848                                 cnameclose(cname);
849                                 if (nerror)
850                                         *nerror = nhave + 1;
851                                 if (mh != NULL)
852                                         putmhead(mh);
853                                 return -1;
854                         }
855                 }
856
857                 nmh = NULL;
858                 if (dotdot) {
859                         assert(wq->nqid == 1);
860                         assert(wq->clone != NULL);
861
862                         cname = addelem(cname, "..");
863                         nc = undomount(wq->clone, cname);
864                         n = 1;
865                 } else {
866                         nc = NULL;
867                         if (wh->can_mount)
868                                 for (i = 0; i < wq->nqid && i < ntry - 1; i++)
869                                         if (findmount(&nc, &nmh, type, dev,
870                                                       wq->qid[i]))
871                                                 break;
872                         if (nc == NULL) {       /* no mount points along path */
873                                 if (wq->clone == NULL) {
874                                         cclose(c);
875                                         cnameclose(cname);
876                                         if (wq->nqid == 0 ||
877                                             (wq->qid[wq->nqid - 1].type &
878                                              QTDIR)) {
879                                                 if (nerror)
880                                                         *nerror = nhave +
881                                                                 wq->nqid + 1;
882                                                 set_error(ENOENT,
883                                                           "walk failed");
884                                         } else {
885                                                 if (nerror)
886                                                         *nerror = nhave +
887                                                                 wq->nqid;
888                                                 set_error(ENOTDIR,
889                                                           "walk failed");
890                                         }
891                                         kfree(wq);
892                                         if (mh != NULL)
893                                                 putmhead(mh);
894                                         return -1;
895                                 }
896                                 n = wq->nqid;
897                                 nc = wq->clone;
898                         } else {        /* stopped early, at a mount point */
899                                 if (wq->clone != NULL) {
900                                         cclose(wq->clone);
901                                         wq->clone = NULL;
902                                 }
903                                 lastmountpoint = nc;
904                                 n = i + 1;
905                         }
906                         if (nc->qid.type & QTSYMLINK) {
907                                 struct chan *old_nc = nc;
908
909                                 nc = walk_symlink(old_nc, wh,
910                                                   nnames - nhave - n);
911                                 if (!nc) {
912                                         /* walk_symlink() set error.
913                                          * This seems to be the standard
914                                          * walk() error-cleanup. */
915                                         if (nerror)
916                                                 *nerror = nhave + n;
917                                         cclose(c);
918                                         cclose(old_nc);
919                                         cnameclose(cname);
920                                         kfree(wq);
921                                         if (mh != NULL)
922                                                 putmhead(mh);
923                                         return -1;
924                                 }
925                         }
926                         for (i = 0; i < n; i++)
927                                 cname = addelem(cname, names[nhave + i]);
928                 }
929                 cclose(c);
930                 c = nc;
931                 putmhead(mh);
932                 mh = nmh;
933                 kfree(wq);
934         }
935
936         putmhead(mh);
937
938         c = cunique(c);
939
940         if (c->umh != NULL) {   //BUG
941                 printd("walk umh\n");
942                 putmhead(c->umh);
943                 c->umh = NULL;
944         }
945
946         cnameclose(c->name);
947         c->name = cname;
948         c->mountpoint = lastmountpoint;
949
950         cclose(*cp);
951         *cp = c;
952         if (nerror)
953                 *nerror = 0;
954         return 0;
955 }
956
957 /*
958  * c is a mounted non-creatable directory.  find a creatable one.
959  */
960 struct chan *createdir(struct chan *c, struct mhead *m)
961 {
962         ERRSTACK(1);
963         struct chan *nc;
964         struct mount *f;
965
966         rlock(&m->lock);
967         if (waserror()) {
968                 runlock(&m->lock);
969                 nexterror();
970         }
971         for (f = m->mount; f; f = f->next) {
972                 if (f->mflag & MCREATE) {
973                         nc = cclone(f->to);
974                         runlock(&m->lock);
975                         poperror();
976                         cclose(c);
977                         return nc;
978                 }
979         }
980         error(EPERM, ERROR_FIXME);
981         poperror();
982         return 0;
983 }
984
985 /*
986  * In place, rewrite name to compress multiple /, eliminate ., and process ..
987  */
988 void cleancname(struct cname *n)
989 {
990         char *p;
991
992         if (n->s[0] == '#') {
993                 p = strchr(n->s, '/');
994                 if (p == NULL)
995                         return;
996                 cleanname(p);
997
998                 /*
999                  * The correct name is #i rather than #i/,
1000                  * but the correct name of #/ is #/.
1001                  */
1002                 if (strcmp(p, "/") == 0 && n->s[1] != '/')
1003                         *p = '\0';
1004         } else
1005                 cleanname(n->s);
1006         n->len = strlen(n->s);
1007 }
1008
1009 static void growparse(Elemlist * e)
1010 {
1011         char **new;
1012         int *inew;
1013         enum { Delta = 8 };
1014
1015         if (e->ARRAY_SIZEs % Delta == 0) {
1016                 new = kzmalloc((e->ARRAY_SIZEs + Delta) * sizeof(char *), 0);
1017                 memmove(new, e->elems, e->ARRAY_SIZEs * sizeof(char *));
1018                 kfree(e->elems);
1019                 e->elems = new;
1020                 inew = kzmalloc((e->ARRAY_SIZEs + Delta + 1) * sizeof(int), 0);
1021                 memmove(inew, e->off, e->ARRAY_SIZEs * sizeof(int));
1022                 kfree(e->off);
1023                 e->off = inew;
1024         }
1025 }
1026
1027 /*
1028  * The name is known to be valid.
1029  * Copy the name so slashes can be overwritten.
1030  * An empty string will set ARRAY_SIZE=0.
1031  * A path ending in / or /. or /.//./ etc. will have
1032  * e.mustbedir = 1, so that we correctly
1033  * reject, e.g., "/adm/users/." when /adm/users is a file
1034  * rather than a directory.
1035  */
1036 static void parsename(char *name, Elemlist * e)
1037 {
1038         char *slash;
1039
1040         kstrdup(&e->name, name);
1041         name = e->name;
1042         e->ARRAY_SIZEs = 0;
1043         e->elems = NULL;
1044         e->off = kzmalloc(sizeof(int), 0);
1045         e->off[0] = skipslash(name) - name;
1046         for (;;) {
1047                 name = skipslash(name);
1048                 if (*name == '\0') {
1049                         e->mustbedir = 1;
1050                         break;
1051                 }
1052                 growparse(e);
1053
1054                 e->elems[e->ARRAY_SIZEs++] = name;
1055                 /* we may want to do this again some day
1056                    slash = utfrune(name, '/');
1057                  */
1058                 slash = strchr(name, '/');
1059                 if (slash == NULL) {
1060                         e->off[e->ARRAY_SIZEs] = name + strlen(name) - e->name;
1061                         e->mustbedir = 0;
1062                         break;
1063                 }
1064                 e->off[e->ARRAY_SIZEs] = slash - e->name;
1065                 *slash++ = '\0';
1066                 name = slash;
1067         }
1068 }
1069
1070 void *memrchr(void *va, int c, long n)
1071 {
1072         uint8_t *a, *e;
1073
1074         a = va;
1075         for (e = a + n - 1; e > a; e--)
1076                 if (*e == c)
1077                         return e;
1078         return NULL;
1079 }
1080
1081 /*
1082  * Turn a name into a channel.
1083  * &name[0] is known to be a valid address.  It may be a kernel address.
1084  *
1085  * Opening with amode Aopen, Acreate, or Aremove guarantees
1086  * that the result will be the only reference to that particular fid.
1087  * This is necessary since we might pass the result to
1088  * devtab[].remove().
1089  *
1090  * Opening Atodir, Amount, or Aaccess does not guarantee this.
1091  *
1092  * Opening Aaccess can, under certain conditions, return a
1093  * correct Chan* but with an incorrect struct cname attached.
1094  * Since the functions that open Aaccess (sysstat, syswstat, sys_stat)
1095  * do not use the struct cname*, this avoids an unnecessary clone.
1096  *
1097  * The classic namec() is broken into a front end to get the starting point and
1098  * a __namec_from, which does the guts of the lookup.  */
1099 static struct chan *__namec_from(struct chan *c, char *aname, int amode,
1100                                  int omode, uint32_t perm,
1101                                  struct walk_helper *wh, void *ext)
1102 {
1103         ERRSTACK(2);
1104         int len, npath;
1105         struct chan *cnew, *renamee;
1106         struct cname *cname;
1107         Elemlist e;
1108         struct mhead *m;
1109         char tmperrbuf[ERRMAX];
1110         int saved_errno;
1111         // Rune r;
1112
1113         static_assert(!(CINTERNAL_FLAGS & CEXTERNAL_FLAGS));
1114
1115         e.name = NULL;
1116         e.elems = NULL;
1117         e.off = NULL;
1118         e.ARRAY_SIZEs = 0;
1119         if (waserror()) {
1120                 cclose(c);
1121                 kfree(e.name);
1122                 kfree(e.elems);
1123                 kfree(e.off);
1124                 //dumpmount();
1125                 nexterror();
1126         }
1127
1128         /*
1129          * Build a list of elements in the path.
1130          */
1131         parsename(aname, &e);
1132
1133         if (e.mustbedir)
1134                 omode &= ~O_NOFOLLOW;
1135
1136         switch (amode) {
1137         case Acreate:
1138                 /* perm must have DMDIR if last element is / or /. */
1139                 if (e.mustbedir && !(perm & DMDIR)) {
1140                         npath = e.ARRAY_SIZEs;
1141                         error(EINVAL, "create without DMDIR");
1142                 }
1143                 /* don't try to walk the last path element just yet. */
1144                 if (e.ARRAY_SIZEs == 0)
1145                         error(EEXIST, ERROR_FIXME);
1146                 e.ARRAY_SIZEs--;
1147                 /* We're dropping the last element, which O_NOFOLLOW applied to.
1148                  * Not sure if there are any legit reasons to have O_NOFOLLOW
1149                  * with create.*/
1150                 omode &= ~O_NOFOLLOW;
1151                 break;
1152         case Arename:
1153                 if (e.ARRAY_SIZEs == 0)
1154                         error(EINVAL, "rename needs at least one name");
1155                 e.ARRAY_SIZEs--;
1156                 omode &= ~O_NOFOLLOW;
1157                 break;
1158         /* the difference for stat and lstat (Aaccess) are handled in sysfile.c
1159          */
1160         case Abind:
1161         case Amount:
1162         case Aremove:
1163                 omode |= O_NOFOLLOW;
1164                 break;
1165         }
1166
1167         if (omode & O_NOFOLLOW)
1168                 wh->no_follow = true;
1169
1170         if (walk(&c, e.elems, e.ARRAY_SIZEs, wh, &npath) < 0) {
1171                 if (npath < 0 || npath > e.ARRAY_SIZEs) {
1172                         printd("namec %s walk error npath=%d\n", aname, npath);
1173                         error(EFAIL, "walk failed");
1174                 }
1175                 /* Old plan 9 errors would jump here for the magic error
1176                  * parsing. */
1177 NameError:
1178                 if (current_errstr()[0]) {
1179                         /* errstr is set, just stick with it and error out */
1180                         error_jmp();
1181                 } else {
1182                         error(EFAIL, "Name to chan lookup failed");
1183                 }
1184                 /* brho: skipping the namec custom error string business, since
1185                  * it hides the underlying failure.  implement this if you want
1186                  * the old stuff. */
1187 #if 0
1188                 strlcpy(tmperrbuf, current->errstr, sizeof(tmperrbuf));
1189                 // prefix was name - aname, the start pt
1190                 len = prefix + e.off[npath];
1191                 if (len < ERRMAX / 3 || (name = memrchr(aname, '/', len)) ==
1192                     NULL || name == aname)
1193                         snprintf(get_cur_genbuf(), sizeof current->genbuf,
1194                                  "%.*s", len, aname);
1195                 else
1196                         snprintf(get_cur_genbuf(), sizeof current->genbuf,
1197                                  "...%.*s", (int)(len - (name - aname)), name);
1198                 snprintf(current->errstr, ERRMAX, "%#q %s", get_cur_genbuf(),
1199                                  tmperrbuf);
1200 #endif
1201         }
1202
1203         if (e.mustbedir && !(c->qid.type & QTDIR)) {
1204                 npath = e.ARRAY_SIZEs;
1205                 error(ENOTDIR, "not a dir, but mustbedir.  trailing slash?");
1206         }
1207
1208         if ((amode == Aopen) && (omode & O_EXEC) && (c->qid.type & QTDIR)) {
1209                 npath = e.ARRAY_SIZEs;
1210                 error(EFAIL, "cannot exec directory");
1211         }
1212
1213         switch (amode) {
1214         case Aaccess:
1215                 if (wh->can_mount)
1216                         domount(&c, NULL);
1217                 break;
1218
1219         case Abind:
1220                 m = NULL;
1221                 if (wh->can_mount)
1222                         domount(&c, &m);
1223                 if (c->umh != NULL)
1224                         putmhead(c->umh);
1225                 c->umh = m;
1226                 break;
1227
1228         case Aremove:
1229         case Aopen:
1230 Open:
1231                 /* save the name; domount might change c */
1232                 cname = c->name;
1233                 kref_get(&cname->ref, 1);
1234                 m = NULL;
1235                 if (wh->can_mount)
1236                         domount(&c, &m);
1237
1238                 /* our own copy to open or remove */
1239                 c = cunique(c);
1240
1241                 /* now it's our copy anyway, we can put the name back */
1242                 cnameclose(c->name);
1243                 c->name = cname;
1244
1245                 switch (amode) {
1246                 case Aremove:
1247                         putmhead(m);
1248                         break;
1249
1250                 case Aopen:
1251                 case Acreate:
1252                         if (c->umh != NULL) {
1253                                 printd("cunique umh\n");
1254                                 putmhead(c->umh);
1255                                 c->umh = NULL;
1256                         }
1257
1258                         /* only save the mount head if it's a multiple element
1259                          * union */
1260                         if (m && m->mount && m->mount->next)
1261                                 c->umh = m;
1262                         else
1263                                 putmhead(m);
1264                         /* here is where convert omode/vfs flags to c->flags.
1265                          * careful, O_CLOEXEC and O_REMCLO are in there.  might
1266                          * need to change that. */
1267                         c->flag |= omode & CEXTERNAL_FLAGS;
1268                         c = devtab[c->type].open(c,
1269                                                  omode & ~O_CLOEXEC);
1270                         /* if you get this from a dev, in the dev's open, you
1271                          * are probably saving mode directly, without passing it
1272                          * through openmode. */
1273                         if (c->mode & O_TRUNC)
1274                                 error(EFAIL,
1275                                       "Device %s open failed to clear O_TRUNC",
1276                                       devtab[c->type].name);
1277                         break;
1278                 }
1279                 break;
1280
1281         case Atodir:
1282                 /*
1283                  * Directories (e.g. for cd) are left before the mount point,
1284                  * so one may mount on / or . and see the effect.
1285                  */
1286                 if (!(c->qid.type & QTDIR))
1287                         error(ENOTDIR, ERROR_FIXME);
1288                 break;
1289
1290         case Amount:
1291                 /*
1292                  * When mounting on an already mounted upon directory,
1293                  * one wants subsequent mounts to be attached to the
1294                  * original directory, not the replacement.  Don't domount.
1295                  */
1296                 break;
1297
1298         case Arename:
1299                 /* We already walked to the parent of new_path, which is in c.
1300                  * We're a lot like create here - need to find mounts, etc.  On
1301                  * the way out, we putmhead if we have an m, and clean up our
1302                  * chans.  On success, c becomes cnew (thus close the old c).
1303                  * On failure, we just close cnew. */
1304                 if (!(c->qid.type & QTDIR))
1305                         error(ENOTDIR, "rename target parent is not a dir");
1306                 e.ARRAY_SIZEs++;
1307                 m = NULL;
1308                 cnew = NULL;
1309                 if (waserror()) {
1310                         /* rename or createdir failed */
1311                         cclose(cnew);
1312                         if (m)
1313                                 putmhead(m);
1314                         nexterror();    /* safe since we're in a waserror() */
1315                 }
1316                 if (wh->can_mount && findmount(&cnew, &m, c->type, c->dev,
1317                                                c->qid)) {
1318                         cnew = createdir(cnew, m);
1319                 } else {
1320                         cnew = c;
1321                         chan_incref(cnew);
1322                 }
1323                 cnew = cunique(cnew);
1324                 cnameclose(cnew->name);
1325                 cnew->name = c->name;
1326                 kref_get(&cnew->name->ref, 1);
1327                 /* At this point, we have our new_path parent chan (cnew) and
1328                  * the renamee chan */
1329                 renamee = ext;
1330                 if (cnew->type != renamee->type)
1331                         error(EXDEV, "can't rename across device types");
1332
1333                 devtab[cnew->type].rename(renamee, cnew,
1334                                           e.elems[e.ARRAY_SIZEs - 1], 0);
1335                 poperror();
1336
1337                 if (m)
1338                         putmhead(m);
1339                 cclose(c);
1340                 c = cnew;
1341                 c->name = addelem(c->name, e.elems[e.ARRAY_SIZEs - 1]);
1342                 break;
1343
1344         case Acreate:
1345                 /*
1346                  * We've already walked all but the last element.
1347                  * If the last exists, try to open it OTRUNC.
1348                  * If omode&OEXCL is set, just give up.
1349                  */
1350                 e.ARRAY_SIZEs++;
1351                 if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, wh, NULL) == 0) {
1352                         if (omode & O_EXCL)
1353                                 error(EEXIST, ERROR_FIXME);
1354                         omode |= O_TRUNC;
1355                         goto Open;
1356                 }
1357
1358                 /*
1359                  * The semantics of the create(2) system call are that if the
1360                  * file exists and can be written, it is to be opened with
1361                  * truncation.  On the other hand, the create(5) message fails
1362                  * if the file exists.
1363                  *
1364                  * If we get two create(2) calls happening simultaneously, they
1365                  * might both get here and send create(5) messages, but only one
1366                  * of the messages will succeed.  To provide the expected
1367                  * create(2) semantics, the call with the failed message needs
1368                  * to try the above walk again, opening for truncation.  This
1369                  * correctly solves the create/create race, in the sense that
1370                  * any observable outcome can be explained as one happening
1371                  * before the other.  The create/create race is quite common.
1372                  * For example, it happens when two rc subshells simultaneously
1373                  * update the same environment variable.
1374                  *
1375                  * The implementation still admits a create/create/remove race:
1376                  * (A) walk to file, fails
1377                  * (B) walk to file, fails
1378                  * (A) create file, succeeds, returns
1379                  * (B) create file, fails
1380                  * (A) remove file, succeeds, returns
1381                  * (B) walk to file, return failure.
1382                  *
1383                  * This is hardly as common as the create/create race, and is
1384                  * really not too much worse than what might happen if (B) got a
1385                  * hold of a file descriptor and then the file was removed --
1386                  * either way (B) can't do anything with the result of the
1387                  * create call.  So we don't care about this race.
1388                  *
1389                  * Applications that care about more fine-grained decision of
1390                  * the races can use the OEXCL flag to get at the underlying
1391                  * create(5) semantics; by default we provide the common case.
1392                  *
1393                  * We need to stay behind the mount point in case we
1394                  * need to do the first walk again (should the create fail).
1395                  *
1396                  * We also need to cross the mount point and find the directory
1397                  * in the union in which we should be creating.
1398                  *
1399                  * The channel staying behind is c, the one moving forward is
1400                  * cnew.
1401                  */
1402                 m = NULL;
1403                 cnew = NULL;    /* is this assignment necessary? */
1404                 /* discard error */
1405                 if (!waserror()) {      /* try create */
1406                         if (wh->can_mount &&
1407                             findmount(&cnew, &m, c->type, c->dev, c->qid))
1408                                 cnew = createdir(cnew, m);
1409                         else {
1410                                 cnew = c;
1411                                 chan_incref(cnew);
1412                         }
1413
1414                         /*
1415                          * We need our own copy of the Chan because we're about
1416                          * to send a create, which will move it.  Once we have
1417                          * our own copy, we can fix the name, which might be
1418                          * wrong if findmount gave us a new Chan.
1419                          */
1420                         cnew = cunique(cnew);
1421                         cnameclose(cnew->name);
1422                         cnew->name = c->name;
1423                         kref_get(&cnew->name->ref, 1);
1424
1425                         cnew->flag |= omode & CEXTERNAL_FLAGS;
1426                         devtab[cnew->type].create(cnew,
1427                                                   e.elems[e.ARRAY_SIZEs - 1],
1428                                                   omode & ~(O_EXCL | O_CLOEXEC),
1429                                                   perm, ext);
1430                         poperror();
1431
1432                         if (m)
1433                                 putmhead(m);
1434                         cclose(c);
1435                         c = cnew;
1436                         c->name = addelem(c->name, e.elems[e.ARRAY_SIZEs - 1]);
1437                         break;
1438                 }
1439
1440                 /* create failed */
1441                 cclose(cnew);
1442                 if (m)
1443                         putmhead(m);
1444                 if (omode & O_EXCL)
1445                         nexterror();    /* safe since we're in a waserror() */
1446                 poperror();     /* matching the if(!waserror) */
1447
1448                 /* save error, so walk doesn't clobber our existing errstr */
1449                 strlcpy(tmperrbuf, current_errstr(), sizeof(tmperrbuf));
1450                 saved_errno = get_errno();
1451                 /* note: we depend that walk does not error */
1452                 if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, wh, NULL) < 0) {
1453                         set_errno(saved_errno);
1454                         /* Report the error we had originally */
1455                         error(EFAIL, tmperrbuf);
1456                 }
1457                 strlcpy(current_errstr(), tmperrbuf, MAX_ERRSTR_LEN);
1458                 omode |= O_TRUNC;
1459                 goto Open;
1460
1461         default:
1462                 panic("unknown namec access %d\n", amode);
1463         }
1464
1465         poperror();
1466
1467         if (e.ARRAY_SIZEs > 0)
1468                 strlcpy(get_cur_genbuf(), e.elems[e.ARRAY_SIZEs - 1],
1469                         GENBUF_SZ);
1470         else
1471                 strlcpy(get_cur_genbuf(), ".", GENBUF_SZ);
1472
1473         kfree(e.name);
1474         kfree(e.elems);
1475         kfree(e.off);
1476
1477         return c;
1478 }
1479
1480 struct chan *namec(char *name, int amode, int omode, uint32_t perm, void *ext)
1481 {
1482         struct walk_helper wh = {.can_mount = true};
1483         struct chan *c;
1484         char *devname, *devspec;
1485         int n, devtype;
1486
1487         if (name[0] == '\0')
1488                 error(EFAIL, "empty file name");
1489         validname(name, 1);
1490         /*
1491          * Find the starting off point (the current slash, the root of
1492          * a device tree, or the current dot) as well as the name to
1493          * evaluate starting there.
1494          */
1495         switch (name[0]) {
1496         case '/':
1497                 if (current)
1498                         c = current->slash;
1499                 else
1500                         c = kern_slash;
1501                 chan_incref(c);
1502                 break;
1503
1504         case '#':
1505                 wh.can_mount = false;
1506                 devname = get_cur_genbuf();
1507                 devname[0] = '\0';
1508                 n = 0;
1509                 name++; /* drop the # */
1510                 while ((*name != '\0') && (*name != '/')) {
1511                         if (n >= GENBUF_SZ - 1)
1512                                 error(ENAMETOOLONG, ERROR_FIXME);
1513                         devname[n++] = *name++;
1514                 }
1515                 devname[n] = '\0';
1516                 /* for a name #foo.spec, devname = foo\0, devspec = spec\0.
1517                  * genbuf contains foo\0spec\0.  for no spec, devspec = \0 */
1518                 devspec = strchr(devname, '.');
1519                 if (devspec) {
1520                         *devspec = '\0';
1521                         devspec++;
1522                 } else {
1523                         devspec = &devname[n];
1524                 }
1525                 /* These devices have special attach functions that treat the
1526                  * char * as a blob pointer */
1527                 if (!strcmp(devname, "mnt"))
1528                         error(EINVAL, "can't namec-attach #mnt");
1529                 if (!strcmp(devname, "gtfs"))
1530                         error(EINVAL, "can't namec-attach #gtfs");
1531                 /* TODO: deal with this "nodevs" business. */
1532                 #if 0
1533                 /*
1534                  *  the nodevs exceptions are
1535                  *  |  it only gives access to pipes you create
1536                  *  e  this process's environment
1537                  *  s  private file2chan creation space
1538                  *  D private secure sockets name space
1539                  *  a private TLS name space
1540                  */
1541                 if (current->pgrp->nodevs &&
1542                         //          (utfrune("|esDa", r) == NULL
1543                         ((strchr("|esDa", get_cur_genbuf()[1]) == NULL)
1544                          || (get_cur_genbuf()[1] == 's' // || r == 's'
1545                                  && get_cur_genbuf()[n] != '\0')))
1546                         error(EINVAL, ERROR_FIXME);
1547                 #endif
1548                 devtype = devno(devname, 1);
1549                 if (devtype == -1)
1550                         error(EFAIL, "Unknown #device %s (spec %s)", devname,
1551                               devspec);
1552                 c = devtab[devtype].attach(devspec);
1553                 break;
1554         default:
1555                 /* this case also covers \0 */
1556                 c = current->dot;
1557                 if (!c)
1558                         panic("no dot!");
1559                 chan_incref(c);
1560                 break;
1561         }
1562         return __namec_from(c, name, amode, omode, perm, &wh, ext);
1563 }
1564
1565 struct chan *namec_from(struct chan *c, char *name, int amode, int omode,
1566                         uint32_t perm, void *ext)
1567 {
1568         struct walk_helper wh = {.can_mount = true};
1569
1570         if (name[0] == '\0') {
1571                 /* Our responsibility to cclose 'c' on our error */
1572                 cclose(c);
1573                 error(EFAIL, "empty file name");
1574         }
1575         validname(name, 1);
1576         return __namec_from(c, name, amode, omode, perm, &wh, ext);
1577 }
1578
1579 /*
1580  * name is valid. skip leading / and ./ as much as possible
1581  */
1582 char *skipslash(char *name)
1583 {
1584         while (name[0] == '/'
1585                    || (name[0] == '.' && (name[1] == 0 || name[1] == '/')))
1586                 name++;
1587         return name;
1588 }
1589
1590 char isfrog[256] = {
1591          /*NUL*/ 1, 1, 1, 1, 1, 1, 1, 1,
1592          /*BKS*/ 1, 1, 1, 1, 1, 1, 1, 1,
1593          /*DLE*/ 1, 1, 1, 1, 1, 1, 1, 1,
1594          /*CAN*/ 1, 1, 1, 1, 1, 1, 1, 1,
1595         ['/'] 1,
1596         [0x7f] 1,
1597 };
1598
1599 /*
1600  * Check that the name
1601  *  a) is in valid memory.
1602  *  b) is shorter than 2^16 bytes, so it can fit in a 9P string field.
1603  *  c) contains no frogs.
1604  * The first byte is known to be addressible by the requester, so the
1605  * routine works for kernel and user memory both.
1606  * The parameter slashok flags whether a slash character is an error
1607  * or a valid character.
1608  */
1609 void validname(char *aname, int slashok)
1610 {
1611         char *ename, *name;
1612         int c;
1613
1614         name = aname;
1615         ename = memchr(name, 0, (1 << 16));
1616
1617         if (ename == NULL || ename - name >= (1 << 16))
1618                 error(EINVAL, "Name too long");
1619
1620         while (*name) {
1621                 /* all characters above '~' are ok */
1622                 c = *(uint8_t *) name;
1623 #if 0
1624                 if (c >= Runeself)
1625                         name += chartorune(&r, name);
1626 #endif
1627                 if (c >= 0x7f) {
1628                         error(EFAIL, "Akaros doesn't do UTF-8");
1629                 } else {
1630                         if (isfrog[c])
1631                                 if (!slashok || c != '/') {
1632                                         error(EINVAL, "%s (%p), at char %c",
1633                                               aname, aname, c);
1634                                 }
1635                         name++;
1636                 }
1637         }
1638 }
1639
1640 void isdir(struct chan *c)
1641 {
1642         if (c->qid.type & QTDIR)
1643                 return;
1644         error(ENOTDIR, ERROR_FIXME);
1645 }
1646
1647 /*
1648  * This is necessary because there are many
1649  * pointers to the top of a given mount list:
1650  *
1651  *      - the mhead in the namespace hash table
1652  *      - the mhead in chans returned from findmount:
1653  *        used in namec and then by unionread.
1654  *      - the mhead in chans returned from createdir:
1655  *        used in the open/create race protect, which is gone.
1656  *
1657  * The RWlock in the Mhead protects the mount list it contains.
1658  * The mount list is deleted when we cunmount.
1659  * The RWlock ensures that nothing is using the mount list at that time.
1660  *
1661  * It is okay to replace c->mh with whatever you want as
1662  * long as you are sure you have a unique reference to it.
1663  *
1664  * This comment might belong somewhere else.
1665  */
1666 void putmhead(struct mhead *m)
1667 {
1668         if (m)
1669                 kref_put(&m->ref);
1670 }
1671
1672 /* Given s, make a copy of a string with padding bytes in front.  Returns a
1673  * pointer to the start of the string and the memory to free in str_store.
1674  *
1675  * Free str_store with kfree. */
1676 static char *pad_and_strdup(char *s, int padding, char **str_store)
1677 {
1678         char *store = kzmalloc(strlen(s) + 1 + padding, MEM_WAIT);
1679
1680         strlcpy(store + padding, s, strlen(s) + 1);
1681         *str_store = store;
1682         return store + padding;
1683 }
1684
1685 /* Walks a symlink c.  Returns the target chan, which could be the symlink
1686  * itself, if we're NO_FOLLOW.  On success, we'll decref the symlink and give
1687  * you a ref counted result.
1688  *
1689  * Returns NULL on error, and does not close the symlink.  Like regular walk, it
1690  * is all or nothing. */
1691 static struct chan *walk_symlink(struct chan *symlink, struct walk_helper *wh,
1692                                  unsigned int nr_names_left)
1693 {
1694         struct dir *dir;
1695         char *link_name, *link_store;
1696         struct chan *from;
1697         bool old_nofollow;
1698         Elemlist e = {0};
1699
1700         /* mildly expensive: need to rlock the namespace */
1701         if (is_mount_point(symlink))
1702                 return symlink;
1703         if (!nr_names_left && wh->no_follow)
1704                 return symlink;
1705         if (wh->nr_loops >= WALK_MAX_NR_LOOPS) {
1706                 set_error(ELOOP, "too many nested symlinks in walk");
1707                 return NULL;
1708         }
1709         dir = chandirstat(symlink);
1710         if (!dir) {
1711                 /* Should propagate the error from dev.stat() */
1712                 return NULL;
1713         }
1714         if (!(dir->mode & DMSYMLINK)) {
1715                 set_error(ELOOP, "symlink isn't a symlink!");
1716                 kfree(dir);
1717                 return NULL;
1718         }
1719         link_name = pad_and_strdup(dir->ext, 3, &link_store);
1720         kfree(dir);
1721
1722         if (link_name[0] == '/') {
1723                 if (current)
1724                         from = current->slash;
1725                 else
1726                         from = kern_slash;
1727         } else {
1728                 from = symlink;
1729                 link_name -= 3;
1730                 strncpy(link_name, "../", 3);
1731                 if (!from->name)
1732                         from->name = newcname("");
1733         }
1734         /* we close this ref on failure or it gets walked to the result. */
1735         chan_incref(from);
1736
1737         parsename(link_name, &e);
1738         kfree(link_store);
1739
1740         wh->nr_loops++;
1741         /* no_follow applies to the outermost walk, i.e. the one that the
1742          * original namec performs.  At this point, we've decided that we're
1743          * going to try and follow a symlink: even if its no_follow, that only
1744          * applies to the last link in the original path.  Our sub-walks are not
1745          * no_follow.
1746          *
1747          * Note the other wh vars need to stay with the walk: nr_loops,
1748          * since its our method of detecting symlink loops, and can_mount, which
1749          * is a property of the overall namec() call. */
1750         old_nofollow = wh->no_follow;
1751         wh->no_follow = false;
1752         if (walk(&from, e.elems, e.ARRAY_SIZEs, wh, NULL) < 0) {
1753                 cclose(from);
1754                 from = NULL;
1755         } else {
1756                 /* We can still have a successful walk and have the new 'from'
1757                  * be a symlink.  We'd need walk_symlink to return a symlink
1758                  * chan, which happens if the symlink is a mount point. */
1759                 cclose(symlink);
1760         }
1761         wh->no_follow = old_nofollow;
1762         wh->nr_loops--;
1763
1764         kfree(e.name);
1765         kfree(e.elems);
1766         kfree(e.off);
1767         return from;
1768 }