Add a bulk interface to sem_down()
[akaros.git] / kern / src / ns / chan.c
1 /* Copyright © 1994-1999 Lucent Technologies Inc.  All rights reserved.
2  * Portions Copyright © 1997-1999 Vita Nuova Limited
3  * Portions Copyright © 2000-2007 Vita Nuova Holdings Limited
4  *                                (www.vitanuova.com)
5  * Revisions Copyright © 2000-2007 Lucent Technologies Inc. and others
6  *
7  * Modified for the Akaros operating system:
8  * Copyright (c) 2013-2014 The Regents of the University of California
9  * Copyright (c) 2013-2015 Google Inc.
10  *
11  * Permission is hereby granted, free of charge, to any person obtaining a copy
12  * of this software and associated documentation files (the "Software"), to deal
13  * in the Software without restriction, including without limitation the rights
14  * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
15  * copies of the Software, and to permit persons to whom the Software is
16  * furnished to do so, subject to the following conditions:
17  *
18  * The above copyright notice and this permission notice shall be included in
19  * all copies or substantial portions of the Software.
20  *
21  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
22  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
23  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL THE
24  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
25  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
26  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
27  * SOFTWARE. */
28
29 #include <slab.h>
30 #include <kmalloc.h>
31 #include <kref.h>
32 #include <string.h>
33 #include <stdio.h>
34 #include <assert.h>
35 #include <error.h>
36 #include <cpio.h>
37 #include <pmap.h>
38 #include <smp.h>
39 #include <syscall.h>
40
41 struct chan *kern_slash;
42
43 char *channame(struct chan *c)
44 {       /* DEBUGGING */
45         if (c == NULL)
46                 return "<NULL chan>";
47         if (c->name == NULL)
48                 return "<NULL name>";
49         if (c->name->s == NULL)
50                 return "<NULL name.s>";
51         return c->name->s;
52 }
53
54 enum {
55         CNAMESLOP = 20
56 };
57
58 struct {
59         spinlock_t lock;
60         int fid;
61         struct chan *free;
62         struct chan *list;
63 } chanalloc;
64
65 typedef struct Elemlist Elemlist;
66
67 struct Elemlist {
68         char *name;                                     /* copy of name, so '/' can be overwritten */
69         int ARRAY_SIZEs;
70         char **elems;
71         int *off;
72         int mustbedir;
73 };
74
75 struct walk_helper {
76         bool can_mount;
77         bool no_follow;
78         unsigned int nr_loops;
79 };
80 #define WALK_MAX_NR_LOOPS 8
81
82 static struct chan *walk_symlink(struct chan *symlink, struct walk_helper *wh,
83                                  unsigned int nr_names_left);
84
85 #define SEP(c) ((c) == 0 || (c) == '/')
86 void cleancname(struct cname *);
87
88 int isdotdot(char *p)
89 {
90         return p[0] == '.' && p[1] == '.' && p[2] == '\0';
91 }
92
93 int emptystr(char *s)
94 {
95         if (s == NULL)
96                 return 1;
97         if (s[0] == '\0')
98                 return 1;
99         return 0;
100 }
101
102 /*
103  * Atomically replace *p with copy of s
104  */
105 void kstrdup(char **p, char *s)
106 {
107         int n;
108         char *t, *prev;
109
110         n = strlen(s) + 1;
111         /* if it's a user, we can wait for memory; if not, something's very wrong */
112         if (current) {
113                 t = kzmalloc(n, 0);
114         } else {
115                 t = kzmalloc(n, 0);
116                 if (t == NULL)
117                         panic("kstrdup: no memory");
118         }
119         memmove(t, s, n);
120         prev = *p;
121         *p = t;
122         kfree(prev);
123 }
124
125 void chandevreset(void)
126 {
127         int i;
128
129         for (i = 0; &devtab[i] < __devtabend; i++) {
130                 if (devtab[i].reset)
131                         devtab[i].reset();
132         }
133 }
134
135 void chandevinit(void)
136 {
137         int i;
138
139         for (i = 0; &devtab[i] < __devtabend; i++) {
140                 if (devtab[i].init)
141                         devtab[i].init();
142         }
143 }
144
145 void chandevshutdown(void)
146 {
147         int i;
148
149         /* shutdown in reverse order */
150         for (i = 0; &devtab[i] < __devtabend; i++) ;
151         for (i--; i >= 0; i--) {
152                 if (devtab[i].shutdown)
153                         devtab[i].shutdown();
154         }
155 }
156
157 static void chan_release(struct kref *kref)
158 {
159         struct chan *c = container_of(kref, struct chan, ref);
160         ERRSTACK(1);
161         /* this style discards the error from close().  picture it as
162          * if (waserror()) { } else { close(); } chanfree_no_matter_what();  */
163         if (!waserror()) {
164                 printd("releasing chan %p, type %d\n", c, c->type);
165                 /* -1 means there is no dev yet.  wants a noop for close() */
166                 if (c->type != -1)
167                         devtab[c->type].close(c);
168         }
169         /* need to poperror regardless of whether we error'd or not */
170         poperror();
171         /* and chan free no matter what */
172         chanfree(c);
173 }
174
175 struct chan *newchan(void)
176 {
177         struct chan *c;
178
179         spin_lock(&(&chanalloc)->lock);
180         c = chanalloc.free;
181         if (c != 0)
182                 chanalloc.free = c->next;
183         spin_unlock(&(&chanalloc)->lock);
184
185         if (c == NULL) {
186                 c = kzmalloc(sizeof(struct chan), 0);
187                 spin_lock(&(&chanalloc)->lock);
188                 c->fid = ++chanalloc.fid;
189                 c->link = chanalloc.list;
190                 chanalloc.list = c;
191                 spin_unlock(&(&chanalloc)->lock);
192                 spinlock_init(&c->lock);
193                 qlock_init(&c->umqlock);
194         }
195
196         /* if you get an error before associating with a dev, cclose skips calling
197          * the dev's close */
198         c->type = -1;
199         c->flag = 0;
200         kref_init(&c->ref, chan_release, 1);
201         c->dev = 0;
202         c->offset = 0;
203         c->iounit = 0;
204         c->umh = 0;
205         c->uri = 0;
206         c->dri = 0;
207         c->aux = 0;
208         c->mchan = 0;
209         c->mcp = 0;
210         c->mux = 0;
211         c->mqid.path = 0;
212         c->mqid.vers = 0;
213         c->mqid.type = 0;
214         c->name = 0;
215         c->buf = NULL;
216         c->mountpoint = NULL;
217         return c;
218 }
219
220 static void __cname_release(struct kref *kref)
221 {
222         struct cname *n = container_of(kref, struct cname, ref);
223         kfree(n->s);
224         kfree(n);
225 }
226
227 struct cname *newcname(char *s)
228 {
229         struct cname *n;
230         int i;
231
232         n = kzmalloc(sizeof(*n), 0);
233         i = strlen(s);
234         n->len = i;
235         n->alen = i + CNAMESLOP;
236         n->s = kzmalloc(n->alen, 0);
237         memmove(n->s, s, i + 1);
238         kref_init(&n->ref, __cname_release, 1);
239         return n;
240 }
241
242 void cnameclose(struct cname *n)
243 {
244         if (n == NULL)
245                 return;
246         kref_put(&n->ref);
247 }
248
249 struct cname *addelem(struct cname *n, char *s)
250 {
251         int i, a;
252         char *t;
253         struct cname *new;
254
255         if (s[0] == '.' && s[1] == '\0')
256                 return n;
257
258         if (kref_refcnt(&n->ref) > 1) {
259                 /* copy on write */
260                 new = newcname(n->s);
261                 cnameclose(n);
262                 n = new;
263         }
264
265         i = strlen(s);
266         if (n->len + 1 + i + 1 > n->alen) {
267                 a = n->len + 1 + i + 1 + CNAMESLOP;
268                 t = kzmalloc(a, 0);
269                 memmove(t, n->s, n->len + 1);
270                 kfree(n->s);
271                 n->s = t;
272                 n->alen = a;
273         }
274         if (n->len > 0 && n->s[n->len - 1] != '/' && s[0] != '/')       /* don't insert extra slash if one is present */
275                 n->s[n->len++] = '/';
276         memmove(n->s + n->len, s, i + 1);
277         n->len += i;
278         if (isdotdot(s))
279                 cleancname(n);
280         return n;
281 }
282
283 void chanfree(struct chan *c)
284 {
285         c->flag = CFREE;
286
287         if (c->umh != NULL) {
288                 putmhead(c->umh);
289                 c->umh = NULL;
290         }
291         if (c->umc != NULL) {
292                 cclose(c->umc);
293                 c->umc = NULL;
294         }
295         if (c->mux != NULL) {
296                 //
297                 muxclose(c->mux);
298                 c->mux = NULL;
299         }
300         if (c->mchan != NULL) {
301                 cclose(c->mchan);
302                 c->mchan = NULL;
303         }
304
305         cnameclose(c->name);
306         if (c->buf)
307                 kfree(c->buf);
308         c->buf = NULL;
309         c->bufused = 0;
310         c->ateof = 0;
311
312         spin_lock(&(&chanalloc)->lock);
313         c->next = chanalloc.free;
314         chanalloc.free = c;
315         spin_unlock(&(&chanalloc)->lock);
316 }
317
318 void cclose(struct chan *c)
319 {
320         if (c == 0)
321                 return;
322
323         if (c->flag & CFREE)
324                 panic("cclose %p", getcallerpc(&c));
325
326         kref_put(&c->ref);
327 }
328
329 /* convenience wrapper for interposition.  if you do use this, don't forget
330  * about the kref_get_not_zero in plan9setup() */
331 void chan_incref(struct chan *c)
332 {
333         kref_get(&c->ref, 1);
334 }
335
336 /*
337  * Make sure we have the only copy of c.  (Copy on write.)
338  */
339 struct chan *cunique(struct chan *c)
340 {
341         struct chan *nc;
342
343         if (kref_refcnt(&c->ref) != 1) {
344                 nc = cclone(c);
345                 cclose(c);
346                 c = nc;
347         }
348
349         return c;
350 }
351
352 int eqqid(struct qid a, struct qid b)
353 {
354         return a.path == b.path && a.vers == b.vers;
355 }
356
357 int eqchan(struct chan *a, struct chan *b, int pathonly)
358 {
359         if (a->qid.path != b->qid.path)
360                 return 0;
361         if (!pathonly && a->qid.vers != b->qid.vers)
362                 return 0;
363         if (a->type != b->type)
364                 return 0;
365         if (a->dev != b->dev)
366                 return 0;
367         return 1;
368 }
369
370 int eqchantdqid(struct chan *a, int type, int dev, struct qid qid, int pathonly)
371 {
372         if (a->qid.path != qid.path)
373                 return 0;
374         if (!pathonly && a->qid.vers != qid.vers)
375                 return 0;
376         if (a->type != type)
377                 return 0;
378         if (a->dev != dev)
379                 return 0;
380         return 1;
381 }
382
383 static void mh_release(struct kref *kref)
384 {
385         struct mhead *mh = container_of(kref, struct mhead, ref);
386         mh->mount = (struct mount *)0xCafeBeef;
387         kfree(mh);
388 }
389
390 struct mhead *newmhead(struct chan *from)
391 {
392         struct mhead *mh;
393
394         mh = kzmalloc(sizeof(struct mhead), 0);
395         kref_init(&mh->ref, mh_release, 1);
396         rwinit(&mh->lock);
397         mh->from = from;
398         chan_incref(from);
399
400 /*
401         n = from->name->len;
402         if(n >= sizeof(mh->fromname))
403                 n = sizeof(mh->fromname)-1;
404         memmove(mh->fromname, from->name->s, n);
405         mh->fromname[n] = 0;
406 */
407         return mh;
408 }
409
410 int cmount(struct chan *new, struct chan *old, int flag, char *spec)
411 {
412         ERRSTACK(1);
413         struct pgrp *pg;
414         int order, flg;
415         struct mhead *m, **l, *mh;
416         struct mount *nm, *f, *um, **h;
417
418         /* Can bind anything onto a symlink's name.  Otherwise, both the old and the
419          * new must agree on whether or not it is a directory. */
420         if (!(old->qid.type & QTSYMLINK) &&
421             (QTDIR & (old->qid.type ^ new->qid.type)))
422                 error(EINVAL, ERROR_FIXME);
423
424         if (old->umh)
425                 printd("cmount old extra umh\n");
426
427         order = flag & MORDER;
428
429         if ((old->qid.type & QTDIR) == 0 && order != MREPL)
430                 error(EINVAL, ERROR_FIXME);
431
432         mh = new->umh;
433
434         /*
435          * Not allowed to bind when the old directory
436          * is itself a union.  (Maybe it should be allowed, but I don't see
437          * what the semantics would be.)
438          *
439          * We need to check mh->mount->next to tell unions apart from
440          * simple mount points, so that things like
441          *  mount -c fd /root
442          *  bind -c /root /
443          * work.  The check of mount->mflag catches things like
444          *  mount fd /root
445          *  bind -c /root /
446          *
447          * This is far more complicated than it should be, but I don't
448          * see an easier way at the moment.     -rsc
449          */
450         if ((flag & MCREATE) && mh && mh->mount
451                 && (mh->mount->next || !(mh->mount->mflag & MCREATE)))
452                 error(EEXIST, ERROR_FIXME);
453
454         pg = current->pgrp;
455         wlock(&pg->ns);
456
457         l = &MOUNTH(pg, old->qid);
458         for (m = *l; m; m = m->hash) {
459                 if (eqchan(m->from, old, 1))
460                         break;
461                 l = &m->hash;
462         }
463
464         if (m == NULL) {
465                 /*
466                  *  nothing mounted here yet.  create a mount
467                  *  head and add to the hash table.
468                  */
469                 m = newmhead(old);
470                 *l = m;
471
472                 /*
473                  *  if this is a union mount, add the old
474                  *  node to the mount chain.
475                  */
476                 if (order != MREPL)
477                         m->mount = newmount(m, old, 0, 0);
478         }
479         wlock(&m->lock);
480         if (waserror()) {
481                 wunlock(&m->lock);
482                 nexterror();
483         }
484         wunlock(&pg->ns);
485
486         nm = newmount(m, new, flag, spec);
487         if (mh != NULL && mh->mount != NULL) {
488                 /*
489                  *  copy a union when binding it onto a directory
490                  */
491                 flg = order;
492                 if (order == MREPL)
493                         flg = MAFTER;
494                 h = &nm->next;
495                 um = mh->mount;
496                 for (um = um->next; um; um = um->next) {
497                         f = newmount(m, um->to, flg, um->spec);
498                         *h = f;
499                         h = &f->next;
500                 }
501         }
502
503         if (m->mount && order == MREPL) {
504                 mountfree(m->mount);
505                 m->mount = 0;
506         }
507
508         if (flag & MCREATE)
509                 nm->mflag |= MCREATE;
510
511         if (m->mount && order == MAFTER) {
512                 for (f = m->mount; f->next; f = f->next) ;
513                 f->next = nm;
514         } else {
515                 for (f = nm; f->next; f = f->next) ;
516                 f->next = m->mount;
517                 m->mount = nm;
518         }
519
520         wunlock(&m->lock);
521         poperror();
522         return nm->mountid;
523 }
524
525 void cunmount(struct chan *mnt, struct chan *mounted)
526 {
527         struct pgrp *pg;
528         struct mhead *m, **l;
529         struct mount *f, **p;
530
531         if (mnt->umh)   /* should not happen */
532                 printd("cunmount newp extra umh %p has %p\n", mnt, mnt->umh);
533
534         /*
535          * It _can_ happen that mounted->umh is non-NULL,
536          * because mounted is the result of namec(Aopen)
537          * (see sysfile.c:/^sysunmount).
538          * If we open a union directory, it will have a umh.
539          * Although surprising, this is okay, since the
540          * cclose will take care of freeing the umh.
541          */
542
543         pg = current->pgrp;
544         wlock(&pg->ns);
545
546         l = &MOUNTH(pg, mnt->qid);
547         for (m = *l; m; m = m->hash) {
548                 if (eqchan(m->from, mnt, 1))
549                         break;
550                 l = &m->hash;
551         }
552
553         if (m == 0) {
554                 wunlock(&pg->ns);
555                 error(ENOENT, ERROR_FIXME);
556         }
557
558         wlock(&m->lock);
559         if (mounted == 0) {
560                 *l = m->hash;
561                 wunlock(&pg->ns);
562                 mountfree(m->mount);
563                 m->mount = NULL;
564                 cclose(m->from);
565                 wunlock(&m->lock);
566                 putmhead(m);
567                 return;
568         }
569
570         p = &m->mount;
571         for (f = *p; f; f = f->next) {
572                 /* BUG: Needs to be 2 pass */
573                 if (eqchan(f->to, mounted, 1) ||
574                         (f->to->mchan && eqchan(f->to->mchan, mounted, 1))) {
575                         *p = f->next;
576                         f->next = 0;
577                         mountfree(f);
578                         if (m->mount == NULL) {
579                                 *l = m->hash;
580                                 cclose(m->from);
581                                 wunlock(&m->lock);
582                                 wunlock(&pg->ns);
583                                 putmhead(m);
584                                 return;
585                         }
586                         wunlock(&m->lock);
587                         wunlock(&pg->ns);
588                         return;
589                 }
590                 p = &f->next;
591         }
592         wunlock(&m->lock);
593         wunlock(&pg->ns);
594         error(ENOENT, ERROR_FIXME);
595 }
596
597 struct chan *cclone(struct chan *c)
598 {
599         struct chan *nc;
600         struct walkqid *wq;
601
602         wq = devtab[c->type].walk(c, NULL, NULL, 0);
603         if (wq == NULL)
604                 error(EFAIL, "clone failed");
605         nc = wq->clone;
606         kfree(wq);
607         nc->name = c->name;
608         if (c->name)
609                 kref_get(&c->name->ref, 1);
610         return nc;
611 }
612
613 /* Helper: is something mounted on the chan? */
614 static bool is_mount_point(struct chan *c)
615 {
616         struct pgrp *pg;
617         struct mhead *m;
618         int type = c->type;
619         int dev = c->dev;
620         struct qid qid = c->qid;
621
622         if (!current)
623                 return false;
624         pg = current->pgrp;
625         rlock(&pg->ns);
626         for (m = MOUNTH(pg, qid); m; m = m->hash) {
627                 rlock(&m->lock);
628                 if (!m->from) {
629                         runlock(&m->lock);
630                         continue;
631                 }
632                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
633                         runlock(&m->lock);
634                         runlock(&pg->ns);
635                         return true;
636                 }
637                 runlock(&m->lock);
638         }
639         runlock(&pg->ns);
640         return false;
641 }
642
643 int
644 findmount(struct chan **cp,
645                   struct mhead **mp, int type, int dev, struct qid qid)
646 {
647         struct pgrp *pg;
648         struct mhead *m;
649
650         if (!current)
651                 return 0;
652         pg = current->pgrp;
653         rlock(&pg->ns);
654         for (m = MOUNTH(pg, qid); m; m = m->hash) {
655                 rlock(&m->lock);
656                 if (m->from == NULL) {
657                         printd("m %p m->from 0\n", m);
658                         runlock(&m->lock);
659                         continue;
660                 }
661                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
662                         runlock(&pg->ns);
663                         if (mp != NULL) {
664                                 kref_get(&m->ref, 1);
665                                 if (*mp != NULL)
666                                         putmhead(*mp);
667                                 *mp = m;
668                         }
669                         if (*cp != NULL)
670                                 cclose(*cp);
671                         chan_incref(m->mount->to);
672                         *cp = m->mount->to;
673                         runlock(&m->lock);
674                         return 1;
675                 }
676                 runlock(&m->lock);
677         }
678
679         runlock(&pg->ns);
680         return 0;
681 }
682
683 int domount(struct chan **cp, struct mhead **mp)
684 {
685         return findmount(cp, mp, (*cp)->type, (*cp)->dev, (*cp)->qid);
686 }
687
688 struct chan *undomount(struct chan *c, struct cname *name)
689 {
690         ERRSTACK(1);
691         struct chan *nc;
692         struct pgrp *pg;
693         struct mount *t;
694         struct mhead **h, **he, *f;
695
696         if (!current)
697                 return c;
698         pg = current->pgrp;
699         rlock(&pg->ns);
700         if (waserror()) {
701                 runlock(&pg->ns);
702                 nexterror();
703         }
704
705         he = &pg->mnthash[MNTHASH];
706         for (h = pg->mnthash; h < he; h++) {
707                 for (f = *h; f; f = f->hash) {
708                         if (strcmp(f->from->name->s, name->s) != 0)
709                                 continue;
710                         for (t = f->mount; t; t = t->next) {
711                                 if (eqchan(c, t->to, 1)) {
712                                         /*
713                                          * We want to come out on the left hand side of the mount
714                                          * point using the element of the union that we entered on.
715                                          * To do this, find the element that has a from name of
716                                          * c->name->s.
717                                          */
718                                         if (strcmp(t->head->from->name->s, name->s) != 0)
719                                                 continue;
720                                         nc = t->head->from;
721                                         chan_incref(nc);
722                                         cclose(c);
723                                         c = nc;
724                                         break;
725                                 }
726                         }
727                 }
728         }
729         poperror();
730         runlock(&pg->ns);
731         return c;
732 }
733
734 /*
735  * Either walks all the way or not at all.  No partial results in *cp.
736  * *nerror is the number of names to display in an error message.
737  */
738 int walk(struct chan **cp, char **names, int nnames, struct walk_helper *wh,
739          int *nerror)
740 {
741         int dev, dotdot, i, n, nhave, ntry, type;
742         struct chan *c, *nc, *lastmountpoint = NULL;
743         struct cname *cname;
744         struct mount *f;
745         struct mhead *mh, *nmh;
746         struct walkqid *wq;
747
748         c = *cp;
749         chan_incref(c);
750         cname = c->name;
751         kref_get(&cname->ref, 1);
752         mh = NULL;
753
754         /*
755          * While we haven't gotten all the way down the path:
756          *    1. step through a mount point, if any
757          *    2. send a walk request for initial dotdot or initial prefix without dotdot
758          *    3. move to the first mountpoint along the way.
759          *    4. repeat.
760          *
761          * An invariant is that each time through the loop, c is on the undomount
762          * side of the mount point, and c's name is cname.
763          */
764         for (nhave = 0; nhave < nnames; nhave += n) {
765                 /* We only allow symlink when they are first and it's .. (see below) */
766                 if ((c->qid.type & (QTDIR | QTSYMLINK)) == 0) {
767                         if (nerror)
768                                 *nerror = nhave;
769                         cnameclose(cname);
770                         cclose(c);
771                         set_error(ENOTDIR, ERROR_FIXME);
772                         if (mh != NULL)
773                                 putmhead(mh);
774                         return -1;
775                 }
776                 ntry = nnames - nhave;
777                 if (ntry > MAXWELEM)
778                         ntry = MAXWELEM;
779                 dotdot = 0;
780                 for (i = 0; i < ntry; i++) {
781                         if (isdotdot(names[nhave + i])) {
782                                 if (i == 0) {
783                                         dotdot = 1;
784                                         ntry = 1;
785                                 } else
786                                         ntry = i;
787                                 break;
788                         }
789                 }
790
791                 if (!dotdot && wh->can_mount)
792                         domount(&c, &mh);
793                 /* Bug - the only time we walk from a symlink should be during
794                  * walk_symlink, which should have given us a dotdot. */
795                 if ((c->qid.type & QTSYMLINK) && !dotdot)
796                         panic("Got a walk from a symlink that wasn't ..!");
797
798                 type = c->type;
799                 dev = c->dev;
800
801                 if ((wq = devtab[type].walk(c, NULL, names + nhave, ntry)) == NULL) {
802                         /* try a union mount, if any */
803                         if (mh && wh->can_mount) {
804                                 /*
805                                  * mh->mount == c, so start at mh->mount->next
806                                  */
807                                 rlock(&mh->lock);
808                                 for (f = mh->mount->next; f; f = f->next)
809                                         if ((wq =
810                                                  devtab[f->to->type].walk(f->to, NULL, names + nhave,
811                                                                                                   ntry)) != NULL)
812                                                 break;
813                                 runlock(&mh->lock);
814                                 if (f != NULL) {
815                                         type = f->to->type;
816                                         dev = f->to->dev;
817                                 }
818                         }
819                         if (wq == NULL) {
820                                 cclose(c);
821                                 cnameclose(cname);
822                                 if (nerror)
823                                         *nerror = nhave + 1;
824                                 if (mh != NULL)
825                                         putmhead(mh);
826                                 return -1;
827                         }
828                 }
829
830                 nmh = NULL;
831                 if (dotdot) {
832                         assert(wq->nqid == 1);
833                         assert(wq->clone != NULL);
834
835                         cname = addelem(cname, "..");
836                         nc = undomount(wq->clone, cname);
837                         n = 1;
838                 } else {
839                         nc = NULL;
840                         if (wh->can_mount)
841                                 for (i = 0; i < wq->nqid && i < ntry - 1; i++)
842                                         if (findmount(&nc, &nmh, type, dev, wq->qid[i]))
843                                                 break;
844                         if (nc == NULL) {       /* no mount points along path */
845                                 if (wq->clone == NULL) {
846                                         cclose(c);
847                                         cnameclose(cname);
848                                         if (wq->nqid == 0 || (wq->qid[wq->nqid - 1].type & QTDIR)) {
849                                                 if (nerror)
850                                                         *nerror = nhave + wq->nqid + 1;
851                                                 set_error(ENOENT, "walk failed");
852                                         } else {
853                                                 if (nerror)
854                                                         *nerror = nhave + wq->nqid;
855                                                 set_error(ENOTDIR, "walk failed");
856                                         }
857                                         kfree(wq);
858                                         if (mh != NULL)
859                                                 putmhead(mh);
860                                         return -1;
861                                 }
862                                 n = wq->nqid;
863                                 if (wq->clone->qid.type & QTSYMLINK) {
864                                         nc = walk_symlink(wq->clone, wh, nnames - nhave - n);
865                                         if (!nc) {
866                                                 /* walk_symlink() set error.  This seems to be the
867                                                  * standard walk() error-cleanup. */
868                                                 if (nerror)
869                                                         *nerror = nhave + wq->nqid;
870                                                 cclose(c);
871                                                 cclose(wq->clone);
872                                                 cnameclose(cname);
873                                                 kfree(wq);
874                                                 if (mh != NULL)
875                                                         putmhead(mh);
876                                                 return -1;
877                                         }
878                                 } else {
879                                         nc = wq->clone;
880                                 }
881                         } else {        /* stopped early, at a mount point */
882                                 if (wq->clone != NULL) {
883                                         cclose(wq->clone);
884                                         wq->clone = NULL;
885                                 }
886                                 lastmountpoint = nc;
887                                 n = i + 1;
888                         }
889                         for (i = 0; i < n; i++)
890                                 cname = addelem(cname, names[nhave + i]);
891                 }
892                 cclose(c);
893                 c = nc;
894                 putmhead(mh);
895                 mh = nmh;
896                 kfree(wq);
897         }
898
899         putmhead(mh);
900
901         c = cunique(c);
902
903         if (c->umh != NULL) {   //BUG
904                 printd("walk umh\n");
905                 putmhead(c->umh);
906                 c->umh = NULL;
907         }
908
909         cnameclose(c->name);
910         c->name = cname;
911         c->mountpoint = lastmountpoint;
912
913         cclose(*cp);
914         *cp = c;
915         if (nerror)
916                 *nerror = 0;
917         return 0;
918 }
919
920 /*
921  * c is a mounted non-creatable directory.  find a creatable one.
922  */
923 struct chan *createdir(struct chan *c, struct mhead *m)
924 {
925         ERRSTACK(1);
926         struct chan *nc;
927         struct mount *f;
928
929         rlock(&m->lock);
930         if (waserror()) {
931                 runlock(&m->lock);
932                 nexterror();
933         }
934         for (f = m->mount; f; f = f->next) {
935                 if (f->mflag & MCREATE) {
936                         nc = cclone(f->to);
937                         runlock(&m->lock);
938                         poperror();
939                         cclose(c);
940                         return nc;
941                 }
942         }
943         error(EPERM, ERROR_FIXME);
944         poperror();
945         return 0;
946 }
947
948 /*
949  * In place, rewrite name to compress multiple /, eliminate ., and process ..
950  */
951 void cleancname(struct cname *n)
952 {
953         char *p;
954
955         if (n->s[0] == '#') {
956                 p = strchr(n->s, '/');
957                 if (p == NULL)
958                         return;
959                 cleanname(p);
960
961                 /*
962                  * The correct name is #i rather than #i/,
963                  * but the correct name of #/ is #/.
964                  */
965                 if (strcmp(p, "/") == 0 && n->s[1] != '/')
966                         *p = '\0';
967         } else
968                 cleanname(n->s);
969         n->len = strlen(n->s);
970 }
971
972 static void growparse(Elemlist * e)
973 {
974         char **new;
975         int *inew;
976         enum { Delta = 8 };
977
978         if (e->ARRAY_SIZEs % Delta == 0) {
979                 new = kzmalloc((e->ARRAY_SIZEs + Delta) * sizeof(char *), 0);
980                 memmove(new, e->elems, e->ARRAY_SIZEs * sizeof(char *));
981                 kfree(e->elems);
982                 e->elems = new;
983                 inew = kzmalloc((e->ARRAY_SIZEs + Delta + 1) * sizeof(int), 0);
984                 memmove(inew, e->off, e->ARRAY_SIZEs * sizeof(int));
985                 kfree(e->off);
986                 e->off = inew;
987         }
988 }
989
990 /*
991  * The name is known to be valid.
992  * Copy the name so slashes can be overwritten.
993  * An empty string will set ARRAY_SIZE=0.
994  * A path ending in / or /. or /.//./ etc. will have
995  * e.mustbedir = 1, so that we correctly
996  * reject, e.g., "/adm/users/." when /adm/users is a file
997  * rather than a directory.
998  */
999 static void parsename(char *name, Elemlist * e)
1000 {
1001         char *slash;
1002
1003         kstrdup(&e->name, name);
1004         name = e->name;
1005         e->ARRAY_SIZEs = 0;
1006         e->elems = NULL;
1007         e->off = kzmalloc(sizeof(int), 0);
1008         e->off[0] = skipslash(name) - name;
1009         for (;;) {
1010                 name = skipslash(name);
1011                 if (*name == '\0') {
1012                         e->mustbedir = 1;
1013                         break;
1014                 }
1015                 growparse(e);
1016
1017                 e->elems[e->ARRAY_SIZEs++] = name;
1018                 /* we may want to do this again some day
1019                    slash = utfrune(name, '/');
1020                  */
1021                 slash = strchr(name, '/');
1022                 if (slash == NULL) {
1023                         e->off[e->ARRAY_SIZEs] = name + strlen(name) - e->name;
1024                         e->mustbedir = 0;
1025                         break;
1026                 }
1027                 e->off[e->ARRAY_SIZEs] = slash - e->name;
1028                 *slash++ = '\0';
1029                 name = slash;
1030         }
1031 }
1032
1033 void *memrchr(void *va, int c, long n)
1034 {
1035         uint8_t *a, *e;
1036
1037         a = va;
1038         for (e = a + n - 1; e > a; e--)
1039                 if (*e == c)
1040                         return e;
1041         return NULL;
1042 }
1043
1044 /*
1045  * Turn a name into a channel.
1046  * &name[0] is known to be a valid address.  It may be a kernel address.
1047  *
1048  * Opening with amode Aopen, Acreate, or Aremove guarantees
1049  * that the result will be the only reference to that particular fid.
1050  * This is necessary since we might pass the result to
1051  * devtab[].remove().
1052  *
1053  * Opening Atodir, Amount, or Aaccess does not guarantee this.
1054  *
1055  * Opening Aaccess can, under certain conditions, return a
1056  * correct Chan* but with an incorrect struct cname attached.
1057  * Since the functions that open Aaccess (sysstat, syswstat, sys_stat)
1058  * do not use the struct cname*, this avoids an unnecessary clone.
1059  *
1060  * The classic namec() is broken into a front end to get the starting point and
1061  * a __namec_from, which does the guts of the lookup.  */
1062 static struct chan *__namec_from(struct chan *c, char *aname, int amode,
1063                                  int omode, uint32_t perm,
1064                                  struct walk_helper *wh, void *ext)
1065 {
1066         ERRSTACK(2);
1067         int len, npath;
1068         struct chan *cnew, *renamee;
1069         struct cname *cname;
1070         Elemlist e;
1071         struct mhead *m;
1072         char tmperrbuf[ERRMAX];
1073         int saved_errno;
1074         // Rune r;
1075
1076         static_assert(!(CINTERNAL_FLAGS & CEXTERNAL_FLAGS));
1077
1078         e.name = NULL;
1079         e.elems = NULL;
1080         e.off = NULL;
1081         e.ARRAY_SIZEs = 0;
1082         if (waserror()) {
1083                 cclose(c);
1084                 kfree(e.name);
1085                 kfree(e.elems);
1086                 kfree(e.off);
1087                 //dumpmount();
1088                 nexterror();
1089         }
1090
1091         /*
1092          * Build a list of elements in the path.
1093          */
1094         parsename(aname, &e);
1095
1096         if (e.mustbedir)
1097                 omode &= ~O_NOFOLLOW;
1098
1099         switch (amode) {
1100         case Acreate:
1101                 /* perm must have DMDIR if last element is / or /. */
1102                 if (e.mustbedir && !(perm & DMDIR)) {
1103                         npath = e.ARRAY_SIZEs;
1104                         error(EINVAL, "create without DMDIR");
1105                 }
1106                 /* don't try to walk the last path element just yet. */
1107                 if (e.ARRAY_SIZEs == 0)
1108                         error(EEXIST, ERROR_FIXME);
1109                 e.ARRAY_SIZEs--;
1110                 /* We're dropping the last element, which O_NOFOLLOW applied to.  Not
1111                  * sure if there are any legit reasons to have O_NOFOLLOW with create.*/
1112                 omode &= ~O_NOFOLLOW;
1113                 break;
1114         case Arename:
1115                 if (e.ARRAY_SIZEs == 0)
1116                         error(EINVAL, "rename needs at least one name");
1117                 e.ARRAY_SIZEs--;
1118                 omode &= ~O_NOFOLLOW;
1119                 break;
1120         /* the difference for stat and lstat (Aaccess) are handled in sysfile.c */
1121         case Abind:
1122         case Amount:
1123         case Aremove:
1124                 omode |= O_NOFOLLOW;
1125                 break;
1126         }
1127
1128         if (omode & O_NOFOLLOW)
1129                 wh->no_follow = true;
1130
1131         if (walk(&c, e.elems, e.ARRAY_SIZEs, wh, &npath) < 0) {
1132                 if (npath < 0 || npath > e.ARRAY_SIZEs) {
1133                         printd("namec %s walk error npath=%d\n", aname, npath);
1134                         error(EFAIL, "walk failed");
1135                 }
1136                 /* Old plan 9 errors would jump here for the magic error parsing. */
1137 NameError:
1138                 if (current_errstr()[0]) {
1139                         /* errstr is set, we'll just stick with it and error out */
1140                         error_jmp();
1141                 } else {
1142                         error(EFAIL, "Name to chan lookup failed");
1143                 }
1144                 /* brho: skipping the namec custom error string business, since it hides
1145                  * the underlying failure.  implement this if you want the old stuff. */
1146 #if 0
1147                 strlcpy(tmperrbuf, current->errstr, sizeof(tmperrbuf));
1148                 len = prefix + e.off[npath]; // prefix was name - aname, the start pt
1149                 if (len < ERRMAX / 3 || (name = memrchr(aname, '/', len)) == NULL
1150                         || name == aname)
1151                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "%.*s", len,
1152                                          aname);
1153                 else
1154                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "...%.*s",
1155                                          (int)(len - (name - aname)), name);
1156                 snprintf(current->errstr, ERRMAX, "%#q %s", get_cur_genbuf(),
1157                                  tmperrbuf);
1158 #endif
1159         }
1160
1161         if (e.mustbedir && !(c->qid.type & QTDIR)) {
1162                 npath = e.ARRAY_SIZEs;
1163                 error(ENOTDIR, "not a dir, but mustbedir.  trailing slash?");
1164         }
1165
1166         if ((amode == Aopen) && (omode & O_EXEC) && (c->qid.type & QTDIR)) {
1167                 npath = e.ARRAY_SIZEs;
1168                 error(EFAIL, "cannot exec directory");
1169         }
1170
1171         switch (amode) {
1172                 case Aaccess:
1173                         if (wh->can_mount)
1174                                 domount(&c, NULL);
1175                         break;
1176
1177                 case Abind:
1178                         m = NULL;
1179                         if (wh->can_mount)
1180                                 domount(&c, &m);
1181                         if (c->umh != NULL)
1182                                 putmhead(c->umh);
1183                         c->umh = m;
1184                         break;
1185
1186                 case Aremove:
1187                 case Aopen:
1188 Open:
1189                         /* save the name; domount might change c */
1190                         cname = c->name;
1191                         kref_get(&cname->ref, 1);
1192                         m = NULL;
1193                         if (wh->can_mount)
1194                                 domount(&c, &m);
1195
1196                         /* our own copy to open or remove */
1197                         c = cunique(c);
1198
1199                         /* now it's our copy anyway, we can put the name back */
1200                         cnameclose(c->name);
1201                         c->name = cname;
1202
1203                         switch (amode) {
1204                                 case Aremove:
1205                                         putmhead(m);
1206                                         break;
1207
1208                                 case Aopen:
1209                                 case Acreate:
1210                                         if (c->umh != NULL) {
1211                                                 printd("cunique umh\n");
1212                                                 putmhead(c->umh);
1213                                                 c->umh = NULL;
1214                                         }
1215
1216                                         /* only save the mount head if it's a multiple element union */
1217                                         if (m && m->mount && m->mount->next)
1218                                                 c->umh = m;
1219                                         else
1220                                                 putmhead(m);
1221                                         /* here is where convert omode/vfs flags to c->flags.
1222                                          * careful, O_CLOEXEC and O_REMCLO are in there.  might need
1223                                          * to change that. */
1224                                         c->flag |= omode & CEXTERNAL_FLAGS;
1225                                         c = devtab[c->type].open(c,
1226                                                                  omode & ~O_CLOEXEC);
1227                                         /* if you get this from a dev, in the dev's open, you are
1228                                          * probably saving mode directly, without passing it through
1229                                          * openmode. */
1230                                         if (c->mode & O_TRUNC)
1231                                                 error(EFAIL, "Device %s open failed to clear O_TRUNC",
1232                                                       devtab[c->type].name);
1233                                         break;
1234                         }
1235                         break;
1236
1237                 case Atodir:
1238                         /*
1239                          * Directories (e.g. for cd) are left before the mount point,
1240                          * so one may mount on / or . and see the effect.
1241                          */
1242                         if (!(c->qid.type & QTDIR))
1243                                 error(ENOTDIR, ERROR_FIXME);
1244                         break;
1245
1246                 case Amount:
1247                         /*
1248                          * When mounting on an already mounted upon directory,
1249                          * one wants subsequent mounts to be attached to the
1250                          * original directory, not the replacement.  Don't domount.
1251                          */
1252                         break;
1253
1254                 case Arename:
1255                         /* We already walked to the parent of new_path, which is in c.
1256                          * We're a lot like create here - need to find mounts, etc.  On the
1257                          * way out, we putmhead if we have an m, and clean up our chans.  On
1258                          * success, c becomes cnew (thus close the old c).  On failure, we
1259                          * just close cnew. */
1260                         e.ARRAY_SIZEs++;
1261                         m = NULL;
1262                         cnew = NULL;
1263                         if (waserror()) {
1264                                 /* rename or createdir failed */
1265                                 cclose(cnew);
1266                                 if (m)
1267                                         putmhead(m);
1268                                 nexterror();    /* safe since we're in a waserror() */
1269                         }
1270                         if (wh->can_mount && findmount(&cnew, &m, c->type, c->dev,
1271                                                        c->qid)) {
1272                                 cnew = createdir(cnew, m);
1273                         } else {
1274                                 cnew = c;
1275                                 chan_incref(cnew);
1276                         }
1277                         cnew = cunique(cnew);
1278                         cnameclose(cnew->name);
1279                         cnew->name = c->name;
1280                         kref_get(&cnew->name->ref, 1);
1281                         /* At this point, we have our new_path parent chan (cnew) and the
1282                          * renamee chan */
1283                         renamee = ext;
1284                         if (cnew->type != renamee->type)
1285                                 error(EXDEV, "can't rename across device types");
1286
1287                         devtab[cnew->type].rename(renamee, cnew,
1288                                                   e.elems[e.ARRAY_SIZEs - 1], 0);
1289                         poperror();
1290
1291                         if (m)
1292                                 putmhead(m);
1293                         cclose(c);
1294                         c = cnew;
1295                         c->name = addelem(c->name, e.elems[e.ARRAY_SIZEs - 1]);
1296                         break;
1297
1298                 case Acreate:
1299                         /*
1300                          * We've already walked all but the last element.
1301                          * If the last exists, try to open it OTRUNC.
1302                          * If omode&OEXCL is set, just give up.
1303                          */
1304                         e.ARRAY_SIZEs++;
1305                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, wh, NULL) == 0) {
1306                                 if (omode & O_EXCL)
1307                                         error(EEXIST, ERROR_FIXME);
1308                                 omode |= O_TRUNC;
1309                                 goto Open;
1310                         }
1311
1312                         /*
1313                          * The semantics of the create(2) system call are that if the
1314                          * file exists and can be written, it is to be opened with truncation.
1315                          * On the other hand, the create(5) message fails if the file exists.
1316                          * If we get two create(2) calls happening simultaneously,
1317                          * they might both get here and send create(5) messages, but only
1318                          * one of the messages will succeed.  To provide the expected create(2)
1319                          * semantics, the call with the failed message needs to try the above
1320                          * walk again, opening for truncation.  This correctly solves the
1321                          * create/create race, in the sense that any observable outcome can
1322                          * be explained as one happening before the other.
1323                          * The create/create race is quite common.  For example, it happens
1324                          * when two rc subshells simultaneously update the same
1325                          * environment variable.
1326                          *
1327                          * The implementation still admits a create/create/remove race:
1328                          * (A) walk to file, fails
1329                          * (B) walk to file, fails
1330                          * (A) create file, succeeds, returns
1331                          * (B) create file, fails
1332                          * (A) remove file, succeeds, returns
1333                          * (B) walk to file, return failure.
1334                          *
1335                          * This is hardly as common as the create/create race, and is really
1336                          * not too much worse than what might happen if (B) got a hold of a
1337                          * file descriptor and then the file was removed -- either way (B) can't do
1338                          * anything with the result of the create call.  So we don't care about this race.
1339                          *
1340                          * Applications that care about more fine-grained decision of the races
1341                          * can use the OEXCL flag to get at the underlying create(5) semantics;
1342                          * by default we provide the common case.
1343                          *
1344                          * We need to stay behind the mount point in case we
1345                          * need to do the first walk again (should the create fail).
1346                          *
1347                          * We also need to cross the mount point and find the directory
1348                          * in the union in which we should be creating.
1349                          *
1350                          * The channel staying behind is c, the one moving forward is cnew.
1351                          */
1352                         m = NULL;
1353                         cnew = NULL;    /* is this assignment necessary? */
1354                         /* discard error */
1355                         if (!waserror()) {      /* try create */
1356                                 if (wh->can_mount && findmount(&cnew, &m, c->type, c->dev,
1357                                                                c->qid))
1358                                         cnew = createdir(cnew, m);
1359                                 else {
1360                                         cnew = c;
1361                                         chan_incref(cnew);
1362                                 }
1363
1364                                 /*
1365                                  * We need our own copy of the Chan because we're
1366                                  * about to send a create, which will move it.  Once we have
1367                                  * our own copy, we can fix the name, which might be wrong
1368                                  * if findmount gave us a new Chan.
1369                                  */
1370                                 cnew = cunique(cnew);
1371                                 cnameclose(cnew->name);
1372                                 cnew->name = c->name;
1373                                 kref_get(&cnew->name->ref, 1);
1374
1375                                 cnew->flag |= omode & CEXTERNAL_FLAGS;
1376                                 devtab[cnew->type].create(cnew, e.elems[e.ARRAY_SIZEs - 1],
1377                                                                                   omode & ~(O_EXCL | O_CLOEXEC),
1378                                                                                   perm, ext);
1379                                 poperror();
1380
1381                                 if (m)
1382                                         putmhead(m);
1383                                 cclose(c);
1384                                 c = cnew;
1385                                 c->name = addelem(c->name, e.elems[e.ARRAY_SIZEs - 1]);
1386                                 break;
1387                         }
1388
1389                         /* create failed */
1390                         cclose(cnew);
1391                         if (m)
1392                                 putmhead(m);
1393                         if (omode & O_EXCL)
1394                                 nexterror();    /* safe since we're in a waserror() */
1395                         poperror();     /* matching the if(!waserror) */
1396
1397                         /* save error, so walk doesn't clobber our existing errstr */
1398                         strlcpy(tmperrbuf, current_errstr(), sizeof(tmperrbuf));
1399                         saved_errno = get_errno();
1400                         /* note: we depend that walk does not error */
1401                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, wh, NULL) < 0) {
1402                                 set_errno(saved_errno);
1403                                 /* Report the error we had originally */
1404                                 error(EFAIL, tmperrbuf);
1405                         }
1406                         strlcpy(current_errstr(), tmperrbuf, MAX_ERRSTR_LEN);
1407                         omode |= O_TRUNC;
1408                         goto Open;
1409
1410                 default:
1411                         panic("unknown namec access %d\n", amode);
1412         }
1413
1414         poperror();
1415
1416         if (e.ARRAY_SIZEs > 0)
1417                 strlcpy(get_cur_genbuf(), e.elems[e.ARRAY_SIZEs - 1], GENBUF_SZ);
1418         else
1419                 strlcpy(get_cur_genbuf(), ".", GENBUF_SZ);
1420
1421         kfree(e.name);
1422         kfree(e.elems);
1423         kfree(e.off);
1424
1425         return c;
1426 }
1427
1428 struct chan *namec(char *name, int amode, int omode, uint32_t perm, void *ext)
1429 {
1430         struct walk_helper wh = {.can_mount = true};
1431         struct chan *c;
1432         char *devname, *devspec;
1433         int n, devtype;
1434
1435         if (name[0] == '\0')
1436                 error(EFAIL, "empty file name");
1437         validname(name, 1);
1438         /*
1439          * Find the starting off point (the current slash, the root of
1440          * a device tree, or the current dot) as well as the name to
1441          * evaluate starting there.
1442          */
1443         switch (name[0]) {
1444                 case '/':
1445                         if (current)
1446                                 c = current->slash;
1447                         else
1448                                 c = kern_slash;
1449                         chan_incref(c);
1450                         break;
1451
1452                 case '#':
1453                         wh.can_mount = false;
1454                         devname = get_cur_genbuf();
1455                         devname[0] = '\0';
1456                         n = 0;
1457                         name++; /* drop the # */
1458                         while ((*name != '\0') && (*name != '/')) {
1459                                 if (n >= GENBUF_SZ - 1)
1460                                         error(ENAMETOOLONG, ERROR_FIXME);
1461                                 devname[n++] = *name++;
1462                         }
1463                         devname[n] = '\0';
1464                         /* for a name #foo.spec, devname = foo\0, devspec = spec\0.
1465                          * genbuf contains foo\0spec\0.  for no spec, devspec = \0 */
1466                         devspec = strchr(devname, '.');
1467                         if (devspec) {
1468                                 *devspec = '\0';
1469                                 devspec++;
1470                         } else {
1471                                 devspec = &devname[n];
1472                         }
1473                         /* These devices have special attach functions that treat the char *
1474                          * as a blob pointer */
1475                         if (!strcmp(devname, "mnt"))
1476                                 error(EINVAL, "can't namec-attach #mnt");
1477                         if (!strcmp(devname, "gtfs"))
1478                                 error(EINVAL, "can't namec-attach #gtfs");
1479                         /* TODO: deal with this "nodevs" business. */
1480                         #if 0
1481                         /*
1482                          *  the nodevs exceptions are
1483                          *  |  it only gives access to pipes you create
1484                          *  e  this process's environment
1485                          *  s  private file2chan creation space
1486                          *  D private secure sockets name space
1487                          *  a private TLS name space
1488                          */
1489                         if (current->pgrp->nodevs &&
1490                                 //          (utfrune("|esDa", r) == NULL
1491                                 ((strchr("|esDa", get_cur_genbuf()[1]) == NULL)
1492                                  || (get_cur_genbuf()[1] == 's' // || r == 's'
1493                                          && get_cur_genbuf()[n] != '\0')))
1494                                 error(EINVAL, ERROR_FIXME);
1495                         #endif
1496                         devtype = devno(devname, 1);
1497                         if (devtype == -1)
1498                                 error(EFAIL, "Unknown #device %s (spec %s)", devname, devspec);
1499                         c = devtab[devtype].attach(devspec);
1500                         break;
1501                 default:
1502                         /* this case also covers \0 */
1503                         c = current->dot;
1504                         if (!c)
1505                                 panic("no dot!");
1506                         chan_incref(c);
1507                         break;
1508         }
1509         return __namec_from(c, name, amode, omode, perm, &wh, ext);
1510 }
1511
1512 struct chan *namec_from(struct chan *c, char *name, int amode, int omode,
1513                         uint32_t perm, void *ext)
1514 {
1515         struct walk_helper wh = {.can_mount = true};
1516
1517         if (name[0] == '\0') {
1518                 /* Our responsibility to cclose 'c' on our error */
1519                 cclose(c);
1520                 error(EFAIL, "empty file name");
1521         }
1522         validname(name, 1);
1523         return __namec_from(c, name, amode, omode, perm, &wh, ext);
1524 }
1525
1526 /*
1527  * name is valid. skip leading / and ./ as much as possible
1528  */
1529 char *skipslash(char *name)
1530 {
1531         while (name[0] == '/'
1532                    || (name[0] == '.' && (name[1] == 0 || name[1] == '/')))
1533                 name++;
1534         return name;
1535 }
1536
1537 char isfrog[256] = {
1538          /*NUL*/ 1, 1, 1, 1, 1, 1, 1, 1,
1539          /*BKS*/ 1, 1, 1, 1, 1, 1, 1, 1,
1540          /*DLE*/ 1, 1, 1, 1, 1, 1, 1, 1,
1541          /*CAN*/ 1, 1, 1, 1, 1, 1, 1, 1,
1542         ['/'] 1,
1543         [0x7f] 1,
1544 };
1545
1546 /*
1547  * Check that the name
1548  *  a) is in valid memory.
1549  *  b) is shorter than 2^16 bytes, so it can fit in a 9P string field.
1550  *  c) contains no frogs.
1551  * The first byte is known to be addressible by the requester, so the
1552  * routine works for kernel and user memory both.
1553  * The parameter slashok flags whether a slash character is an error
1554  * or a valid character.
1555  */
1556 void validname(char *aname, int slashok)
1557 {
1558         char *ename, *name;
1559         int c;
1560
1561         name = aname;
1562         ename = memchr(name, 0, (1 << 16));
1563
1564         if (ename == NULL || ename - name >= (1 << 16))
1565                 error(EINVAL, "Name too long");
1566
1567         while (*name) {
1568                 /* all characters above '~' are ok */
1569                 c = *(uint8_t *) name;
1570 #if 0
1571                 if (c >= Runeself)
1572                         name += chartorune(&r, name);
1573 #endif
1574                 if (c >= 0x7f) {
1575                         error(EFAIL, "Akaros doesn't do UTF-8");
1576                 } else {
1577                         if (isfrog[c])
1578                                 if (!slashok || c != '/') {
1579                                         error(EINVAL, "%s (%p), at char %c", aname, aname, c);
1580                                 }
1581                         name++;
1582                 }
1583         }
1584 }
1585
1586 void isdir(struct chan *c)
1587 {
1588         if (c->qid.type & QTDIR)
1589                 return;
1590         error(ENOTDIR, ERROR_FIXME);
1591 }
1592
1593 /*
1594  * This is necessary because there are many
1595  * pointers to the top of a given mount list:
1596  *
1597  *      - the mhead in the namespace hash table
1598  *      - the mhead in chans returned from findmount:
1599  *        used in namec and then by unionread.
1600  *      - the mhead in chans returned from createdir:
1601  *        used in the open/create race protect, which is gone.
1602  *
1603  * The RWlock in the Mhead protects the mount list it contains.
1604  * The mount list is deleted when we cunmount.
1605  * The RWlock ensures that nothing is using the mount list at that time.
1606  *
1607  * It is okay to replace c->mh with whatever you want as
1608  * long as you are sure you have a unique reference to it.
1609  *
1610  * This comment might belong somewhere else.
1611  */
1612 void putmhead(struct mhead *m)
1613 {
1614         if (m)
1615                 kref_put(&m->ref);
1616 }
1617
1618 /* Given s, make a copy of a string with padding bytes in front.  Returns a
1619  * pointer to the start of the string and the memory to free in str_store.
1620  *
1621  * Free str_store with kfree. */
1622 static char *pad_and_strdup(char *s, int padding, char **str_store)
1623 {
1624         char *store = kzmalloc(strlen(s) + 1 + padding, MEM_WAIT);
1625
1626         strlcpy(store + padding, s, strlen(s) + 1);
1627         *str_store = store;
1628         return store + padding;
1629 }
1630
1631 /* Walks a symlink c.  Returns the target chan, which could be the symlink
1632  * itself, if we're NO_FOLLOW.  On success, we'll decref the symlink and give
1633  * you a ref counted result.
1634  *
1635  * Returns NULL on error, and does not close the symlink.  Like regular walk, it
1636  * is all or nothing. */
1637 static struct chan *walk_symlink(struct chan *symlink, struct walk_helper *wh,
1638                                  unsigned int nr_names_left)
1639 {
1640         struct dir *dir;
1641         char *link_name, *link_store;
1642         struct chan *from;
1643         Elemlist e = {0};
1644
1645         /* mildly expensive: need to rlock the namespace */
1646         if (is_mount_point(symlink))
1647                 return symlink;
1648         if (!nr_names_left && wh->no_follow)
1649                 return symlink;
1650         if (wh->nr_loops >= WALK_MAX_NR_LOOPS) {
1651                 set_error(ELOOP, "too many nested symlinks in walk");
1652                 return NULL;
1653         }
1654         dir = chandirstat(symlink);
1655         if (!dir) {
1656                 /* Should propagate the error from dev.stat() */
1657                 return NULL;
1658         }
1659         if (!(dir->mode & DMSYMLINK)) {
1660                 set_error(ELOOP, "symlink isn't a symlink!");
1661                 kfree(dir);
1662                 return NULL;
1663         }
1664         link_name = pad_and_strdup(dir->ext, 3, &link_store);
1665         kfree(dir);
1666
1667         if (link_name[0] == '/') {
1668                 if (current)
1669                         from = current->slash;
1670                 else
1671                         from = kern_slash;
1672         } else {
1673                 from = symlink;
1674                 link_name -= 3;
1675                 strncpy(link_name, "../", 3);
1676                 if (!from->name)
1677                         from->name = newcname("");
1678         }
1679         /* we close this ref on failure or it gets walked to the result. */
1680         chan_incref(from);
1681
1682         parsename(link_name, &e);
1683         kfree(link_store);
1684
1685         wh->nr_loops++;
1686         if (walk(&from, e.elems, e.ARRAY_SIZEs, wh, NULL) < 0) {
1687                 cclose(from);
1688                 from = NULL;
1689         } else {
1690                 cclose(symlink);
1691                 if (from->qid.type & QTSYMLINK) {
1692                         symlink = from;
1693                         from = walk_symlink(symlink, wh, nr_names_left);
1694                         if (!from)
1695                                 cclose(symlink);
1696                 }
1697         }
1698         wh->nr_loops--;
1699
1700         kfree(e.name);
1701         kfree(e.elems);
1702         kfree(e.off);
1703         return from;
1704 }