199c061891778a59dd9afa59dcecd3ac87ab3d41
[akaros.git] / kern / src / ns / chan.c
1 // INFERNO
2 #include <vfs.h>
3 #include <kfs.h>
4 #include <slab.h>
5 #include <kmalloc.h>
6 #include <kref.h>
7 #include <string.h>
8 #include <stdio.h>
9 #include <assert.h>
10 #include <error.h>
11 #include <cpio.h>
12 #include <pmap.h>
13 #include <smp.h>
14 #include <syscall.h>
15
16 char *channame(struct chan *c)
17 {       /* DEBUGGING */
18         if (c == NULL)
19                 return "<NULL chan>";
20         if (c->name == NULL)
21                 return "<NULL name>";
22         if (c->name->s == NULL)
23                 return "<NULL name.s>";
24         return c->name->s;
25 }
26
27 enum {
28         CNAMESLOP = 20
29 };
30
31 struct {
32         spinlock_t lock;
33         int fid;
34         struct chan *free;
35         struct chan *list;
36 } chanalloc;
37
38 typedef struct Elemlist Elemlist;
39
40 struct Elemlist {
41         char *name;                                     /* copy of name, so '/' can be overwritten */
42         int ARRAY_SIZEs;
43         char **elems;
44         int *off;
45         int mustbedir;
46 };
47
48 #define SEP(c) ((c) == 0 || (c) == '/')
49 void cleancname(struct cname *);
50
51 int isdotdot(char *p)
52 {
53         return p[0] == '.' && p[1] == '.' && p[2] == '\0';
54 }
55
56 int emptystr(char *s)
57 {
58         if (s == NULL)
59                 return 1;
60         if (s[0] == '\0')
61                 return 1;
62         return 0;
63 }
64
65 /*
66  * Atomically replace *p with copy of s
67  */
68 void kstrdup(char **p, char *s)
69 {
70         int n;
71         char *t, *prev;
72
73         n = strlen(s) + 1;
74         /* if it's a user, we can wait for memory; if not, something's very wrong */
75         if (current) {
76                 t = kzmalloc(n, 0);
77         } else {
78                 t = kzmalloc(n, 0);
79                 if (t == NULL)
80                         panic("kstrdup: no memory");
81         }
82         memmove(t, s, n);
83         prev = *p;
84         *p = t;
85         kfree(prev);
86 }
87
88 void chandevreset(void)
89 {
90         int i;
91
92         for (i = 0; &devtab[i] < __devtabend; i++)
93                 devtab[i].reset();
94 }
95
96 void chandevinit(void)
97 {
98         int i;
99
100         for (i = 0; &devtab[i] < __devtabend; i++)
101                 devtab[i].init();
102 }
103
104 void chandevshutdown(void)
105 {
106         int i;
107
108         /* shutdown in reverse order */
109         for (i = 0; &devtab[i] < __devtabend; i++) ;
110         for (i--; i >= 0; i--)
111                 devtab[i].shutdown();
112 }
113
114 static void chan_release(struct kref *kref)
115 {
116         struct chan *c = container_of(kref, struct chan, ref);
117         ERRSTACK(1);
118         /* this style discards the error from close().  picture it as
119          * if (waserror()) { } else { close(); } chanfree_no_matter_what();  */
120         if (!waserror()) {
121                 printd("releasing chan %p, type %d\n", c, c->type);
122                 /* -1 means there is no dev yet.  wants a noop for close() */
123                 if (c->type != -1)
124                         devtab[c->type].close(c);
125         }
126         /* need to poperror regardless of whether we error'd or not */
127         poperror();
128         /* and chan free no matter what */
129         chanfree(c);
130 }
131
132 struct chan *newchan(void)
133 {
134         struct chan *c;
135
136         spin_lock(&(&chanalloc)->lock);
137         c = chanalloc.free;
138         if (c != 0)
139                 chanalloc.free = c->next;
140         spin_unlock(&(&chanalloc)->lock);
141
142         if (c == NULL) {
143                 c = kzmalloc(sizeof(struct chan), 0);
144                 spin_lock(&(&chanalloc)->lock);
145                 c->fid = ++chanalloc.fid;
146                 c->link = chanalloc.list;
147                 chanalloc.list = c;
148                 spin_unlock(&(&chanalloc)->lock);
149                 spinlock_init(&c->lock);
150                 qlock_init(&c->umqlock);
151         }
152
153         /* if you get an error before associating with a dev, cclose skips calling
154          * the dev's close */
155         c->type = -1;
156         c->flag = 0;
157         kref_init(&c->ref, chan_release, 1);
158         c->dev = 0;
159         c->offset = 0;
160         c->iounit = 0;
161         c->umh = 0;
162         c->uri = 0;
163         c->dri = 0;
164         c->aux = 0;
165         c->mchan = 0;
166         c->mcp = 0;
167         c->mux = 0;
168         c->mqid.path = 0;
169         c->mqid.vers = 0;
170         c->mqid.type = 0;
171         c->name = 0;
172         c->buf = NULL;
173         c->mountpoint = NULL;
174         return c;
175 }
176
177 static void __cname_release(struct kref *kref)
178 {
179         struct cname *n = container_of(kref, struct cname, ref);
180         kfree(n->s);
181         kfree(n);
182 }
183
184 struct cname *newcname(char *s)
185 {
186         struct cname *n;
187         int i;
188
189         n = kzmalloc(sizeof(*n), 0);
190         i = strlen(s);
191         n->len = i;
192         n->alen = i + CNAMESLOP;
193         n->s = kzmalloc(n->alen, 0);
194         memmove(n->s, s, i + 1);
195         kref_init(&n->ref, __cname_release, 1);
196         return n;
197 }
198
199 void cnameclose(struct cname *n)
200 {
201         if (n == NULL)
202                 return;
203         kref_put(&n->ref);
204 }
205
206 struct cname *addelem(struct cname *n, char *s)
207 {
208         int i, a;
209         char *t;
210         struct cname *new;
211
212         if (s[0] == '.' && s[1] == '\0')
213                 return n;
214
215         if (kref_refcnt(&n->ref) > 1) {
216                 /* copy on write */
217                 new = newcname(n->s);
218                 cnameclose(n);
219                 n = new;
220         }
221
222         i = strlen(s);
223         if (n->len + 1 + i + 1 > n->alen) {
224                 a = n->len + 1 + i + 1 + CNAMESLOP;
225                 t = kzmalloc(a, 0);
226                 memmove(t, n->s, n->len + 1);
227                 kfree(n->s);
228                 n->s = t;
229                 n->alen = a;
230         }
231         if (n->len > 0 && n->s[n->len - 1] != '/' && s[0] != '/')       /* don't insert extra slash if one is present */
232                 n->s[n->len++] = '/';
233         memmove(n->s + n->len, s, i + 1);
234         n->len += i;
235         if (isdotdot(s))
236                 cleancname(n);
237         return n;
238 }
239
240 void chanfree(struct chan *c)
241 {
242         c->flag = CFREE;
243
244         if (c->umh != NULL) {
245                 putmhead(c->umh);
246                 c->umh = NULL;
247         }
248         if (c->umc != NULL) {
249                 cclose(c->umc);
250                 c->umc = NULL;
251         }
252         if (c->mux != NULL) {
253                 //
254                 muxclose(c->mux);
255                 c->mux = NULL;
256         }
257         if (c->mchan != NULL) {
258                 cclose(c->mchan);
259                 c->mchan = NULL;
260         }
261
262         cnameclose(c->name);
263         if (c->buf)
264                 kfree(c->buf);
265         c->buf = NULL;
266         c->bufused = 0;
267         c->ateof = 0;
268
269         spin_lock(&(&chanalloc)->lock);
270         c->next = chanalloc.free;
271         chanalloc.free = c;
272         spin_unlock(&(&chanalloc)->lock);
273 }
274
275 void cclose(struct chan *c)
276 {
277         if (c == 0)
278                 return;
279
280         if (c->flag & CFREE)
281                 panic("cclose %p", getcallerpc(&c));
282
283         kref_put(&c->ref);
284 }
285
286 /* convenience wrapper for interposition.  if you do use this, don't forget
287  * about the kref_get_not_zero in plan9setup() */
288 void chan_incref(struct chan *c)
289 {
290         kref_get(&c->ref, 1);
291 }
292
293 /*
294  * Make sure we have the only copy of c.  (Copy on write.)
295  */
296 struct chan *cunique(struct chan *c)
297 {
298         struct chan *nc;
299
300         if (kref_refcnt(&c->ref) != 1) {
301                 nc = cclone(c);
302                 cclose(c);
303                 c = nc;
304         }
305
306         return c;
307 }
308
309 int eqqid(struct qid a, struct qid b)
310 {
311         return a.path == b.path && a.vers == b.vers;
312 }
313
314 int eqchan(struct chan *a, struct chan *b, int pathonly)
315 {
316         if (a->qid.path != b->qid.path)
317                 return 0;
318         if (!pathonly && a->qid.vers != b->qid.vers)
319                 return 0;
320         if (a->type != b->type)
321                 return 0;
322         if (a->dev != b->dev)
323                 return 0;
324         return 1;
325 }
326
327 int eqchantdqid(struct chan *a, int type, int dev, struct qid qid, int pathonly)
328 {
329         if (a->qid.path != qid.path)
330                 return 0;
331         if (!pathonly && a->qid.vers != qid.vers)
332                 return 0;
333         if (a->type != type)
334                 return 0;
335         if (a->dev != dev)
336                 return 0;
337         return 1;
338 }
339
340 static void mh_release(struct kref *kref)
341 {
342         struct mhead *mh = container_of(kref, struct mhead, ref);
343         mh->mount = (struct mount *)0xCafeBeef;
344         kfree(mh);
345 }
346
347 struct mhead *newmhead(struct chan *from)
348 {
349         struct mhead *mh;
350
351         mh = kzmalloc(sizeof(struct mhead), 0);
352         kref_init(&mh->ref, mh_release, 1);
353         rwinit(&mh->lock);
354         mh->from = from;
355         chan_incref(from);
356
357 /*
358         n = from->name->len;
359         if(n >= sizeof(mh->fromname))
360                 n = sizeof(mh->fromname)-1;
361         memmove(mh->fromname, from->name->s, n);
362         mh->fromname[n] = 0;
363 */
364         return mh;
365 }
366
367 int cmount(struct chan *new, struct chan *old, int flag, char *spec)
368 {
369         ERRSTACK(1);
370         struct pgrp *pg;
371         int order, flg;
372         struct mhead *m, **l, *mh;
373         struct mount *nm, *f, *um, **h;
374
375         if (QTDIR & (old->qid.type ^ new->qid.type))
376                 error(Emount);
377
378         if (old->umh)
379                 printd("cmount old extra umh\n");
380
381         order = flag & MORDER;
382
383         if ((old->qid.type & QTDIR) == 0 && order != MREPL)
384                 error(Emount);
385
386         mh = new->umh;
387
388         /*
389          * Not allowed to bind when the old directory
390          * is itself a union.  (Maybe it should be allowed, but I don't see
391          * what the semantics would be.)
392          *
393          * We need to check mh->mount->next to tell unions apart from
394          * simple mount points, so that things like
395          *  mount -c fd /root
396          *  bind -c /root /
397          * work.  The check of mount->mflag catches things like
398          *  mount fd /root
399          *  bind -c /root /
400          *
401          * This is far more complicated than it should be, but I don't
402          * see an easier way at the moment.     -rsc
403          */
404         if ((flag & MCREATE) && mh && mh->mount
405                 && (mh->mount->next || !(mh->mount->mflag & MCREATE)))
406                 error(Emount);
407
408         pg = current->pgrp;
409         wlock(&pg->ns);
410
411         l = &MOUNTH(pg, old->qid);
412         for (m = *l; m; m = m->hash) {
413                 if (eqchan(m->from, old, 1))
414                         break;
415                 l = &m->hash;
416         }
417
418         if (m == NULL) {
419                 /*
420                  *  nothing mounted here yet.  create a mount
421                  *  head and add to the hash table.
422                  */
423                 m = newmhead(old);
424                 *l = m;
425
426                 /*
427                  *  if this is a union mount, add the old
428                  *  node to the mount chain.
429                  */
430                 if (order != MREPL)
431                         m->mount = newmount(m, old, 0, 0);
432         }
433         wlock(&m->lock);
434         if (waserror()) {
435                 wunlock(&m->lock);
436                 nexterror();
437         }
438         wunlock(&pg->ns);
439
440         nm = newmount(m, new, flag, spec);
441         if (mh != NULL && mh->mount != NULL) {
442                 /*
443                  *  copy a union when binding it onto a directory
444                  */
445                 flg = order;
446                 if (order == MREPL)
447                         flg = MAFTER;
448                 h = &nm->next;
449                 um = mh->mount;
450                 for (um = um->next; um; um = um->next) {
451                         f = newmount(m, um->to, flg, um->spec);
452                         *h = f;
453                         h = &f->next;
454                 }
455         }
456
457         if (m->mount && order == MREPL) {
458                 mountfree(m->mount);
459                 m->mount = 0;
460         }
461
462         if (flag & MCREATE)
463                 nm->mflag |= MCREATE;
464
465         if (m->mount && order == MAFTER) {
466                 for (f = m->mount; f->next; f = f->next) ;
467                 f->next = nm;
468         } else {
469                 for (f = nm; f->next; f = f->next) ;
470                 f->next = m->mount;
471                 m->mount = nm;
472         }
473
474         wunlock(&m->lock);
475         poperror();
476         return nm->mountid;
477 }
478
479 void cunmount(struct chan *mnt, struct chan *mounted)
480 {
481         struct pgrp *pg;
482         struct mhead *m, **l;
483         struct mount *f, **p;
484
485         if (mnt->umh)   /* should not happen */
486                 printd("cunmount newp extra umh %p has %p\n", mnt, mnt->umh);
487
488         /*
489          * It _can_ happen that mounted->umh is non-NULL,
490          * because mounted is the result of namec(Aopen)
491          * (see sysfile.c:/^sysunmount).
492          * If we open a union directory, it will have a umh.
493          * Although surprising, this is okay, since the
494          * cclose will take care of freeing the umh.
495          */
496
497         pg = current->pgrp;
498         wlock(&pg->ns);
499
500         l = &MOUNTH(pg, mnt->qid);
501         for (m = *l; m; m = m->hash) {
502                 if (eqchan(m->from, mnt, 1))
503                         break;
504                 l = &m->hash;
505         }
506
507         if (m == 0) {
508                 wunlock(&pg->ns);
509                 error(Eunmount);
510         }
511
512         wlock(&m->lock);
513         if (mounted == 0) {
514                 *l = m->hash;
515                 wunlock(&pg->ns);
516                 mountfree(m->mount);
517                 m->mount = NULL;
518                 cclose(m->from);
519                 wunlock(&m->lock);
520                 putmhead(m);
521                 return;
522         }
523
524         p = &m->mount;
525         for (f = *p; f; f = f->next) {
526                 /* BUG: Needs to be 2 pass */
527                 if (eqchan(f->to, mounted, 1) ||
528                         (f->to->mchan && eqchan(f->to->mchan, mounted, 1))) {
529                         *p = f->next;
530                         f->next = 0;
531                         mountfree(f);
532                         if (m->mount == NULL) {
533                                 *l = m->hash;
534                                 cclose(m->from);
535                                 wunlock(&m->lock);
536                                 wunlock(&pg->ns);
537                                 putmhead(m);
538                                 return;
539                         }
540                         wunlock(&m->lock);
541                         wunlock(&pg->ns);
542                         return;
543                 }
544                 p = &f->next;
545         }
546         wunlock(&m->lock);
547         wunlock(&pg->ns);
548         error(Eunion);
549 }
550
551 struct chan *cclone(struct chan *c)
552 {
553         struct chan *nc;
554         struct walkqid *wq;
555
556         wq = devtab[c->type].walk(c, NULL, NULL, 0);
557         if (wq == NULL)
558                 error("clone failed");
559         nc = wq->clone;
560         kfree(wq);
561         nc->name = c->name;
562         if (c->name)
563                 kref_get(&c->name->ref, 1);
564         return nc;
565 }
566
567 int
568 findmount(struct chan **cp,
569                   struct mhead **mp, int type, int dev, struct qid qid)
570 {
571         struct pgrp *pg;
572         struct mhead *m;
573
574         pg = current->pgrp;
575         rlock(&pg->ns);
576         for (m = MOUNTH(pg, qid); m; m = m->hash) {
577                 rlock(&m->lock);
578                 if (m->from == NULL) {
579                         printd("m %p m->from 0\n", m);
580                         runlock(&m->lock);
581                         continue;
582                 }
583                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
584                         runlock(&pg->ns);
585                         if (mp != NULL) {
586                                 kref_get(&m->ref, 1);
587                                 if (*mp != NULL)
588                                         putmhead(*mp);
589                                 *mp = m;
590                         }
591                         if (*cp != NULL)
592                                 cclose(*cp);
593                         chan_incref(m->mount->to);
594                         *cp = m->mount->to;
595                         runlock(&m->lock);
596                         return 1;
597                 }
598                 runlock(&m->lock);
599         }
600
601         runlock(&pg->ns);
602         return 0;
603 }
604
605 int domount(struct chan **cp, struct mhead **mp)
606 {
607         return findmount(cp, mp, (*cp)->type, (*cp)->dev, (*cp)->qid);
608 }
609
610 struct chan *undomount(struct chan *c, struct cname *name)
611 {
612         ERRSTACK(1);
613         struct chan *nc;
614         struct pgrp *pg;
615         struct mount *t;
616         struct mhead **h, **he, *f;
617
618         pg = current->pgrp;
619         rlock(&pg->ns);
620         if (waserror()) {
621                 runlock(&pg->ns);
622                 nexterror();
623         }
624
625         he = &pg->mnthash[MNTHASH];
626         for (h = pg->mnthash; h < he; h++) {
627                 for (f = *h; f; f = f->hash) {
628                         if (strcmp(f->from->name->s, name->s) != 0)
629                                 continue;
630                         for (t = f->mount; t; t = t->next) {
631                                 if (eqchan(c, t->to, 1)) {
632                                         /*
633                                          * We want to come out on the left hand side of the mount
634                                          * point using the element of the union that we entered on.
635                                          * To do this, find the element that has a from name of
636                                          * c->name->s.
637                                          */
638                                         if (strcmp(t->head->from->name->s, name->s) != 0)
639                                                 continue;
640                                         nc = t->head->from;
641                                         chan_incref(nc);
642                                         cclose(c);
643                                         c = nc;
644                                         break;
645                                 }
646                         }
647                 }
648         }
649         poperror();
650         runlock(&pg->ns);
651         return c;
652 }
653
654 /*
655  * Either walks all the way or not at all.  No partial results in *cp.
656  * *nerror is the number of names to display in an error message.
657  */
658 static char Edoesnotexist[] = "does not exist";
659 int walk(struct chan **cp, char **names, int nnames, bool can_mount, int *nerror)
660 {
661         int dev, dotdot, i, n, nhave, ntry, type;
662         struct chan *c, *nc, *lastmountpoint = NULL;
663         struct cname *cname;
664         struct mount *f;
665         struct mhead *mh, *nmh;
666         struct walkqid *wq;
667
668         c = *cp;
669         chan_incref(c);
670         cname = c->name;
671         kref_get(&cname->ref, 1);
672         mh = NULL;
673
674         /*
675          * While we haven't gotten all the way down the path:
676          *    1. step through a mount point, if any
677          *    2. send a walk request for initial dotdot or initial prefix without dotdot
678          *    3. move to the first mountpoint along the way.
679          *    4. repeat.
680          *
681          * An invariant is that each time through the loop, c is on the undomount
682          * side of the mount point, and c's name is cname.
683          */
684         for (nhave = 0; nhave < nnames; nhave += n) {
685                 if ((c->qid.type & QTDIR) == 0) {
686                         if (nerror)
687                                 *nerror = nhave;
688                         cnameclose(cname);
689                         cclose(c);
690                         set_errstr(Enotdir);
691                         if (mh != NULL)
692                                 putmhead(mh);
693                         return -1;
694                 }
695                 ntry = nnames - nhave;
696                 if (ntry > MAXWELEM)
697                         ntry = MAXWELEM;
698                 dotdot = 0;
699                 for (i = 0; i < ntry; i++) {
700                         if (isdotdot(names[nhave + i])) {
701                                 if (i == 0) {
702                                         dotdot = 1;
703                                         ntry = 1;
704                                 } else
705                                         ntry = i;
706                                 break;
707                         }
708                 }
709
710                 if (!dotdot && can_mount)
711                         domount(&c, &mh);
712
713                 type = c->type;
714                 dev = c->dev;
715
716                 if ((wq = devtab[type].walk(c, NULL, names + nhave, ntry)) == NULL) {
717                         /* try a union mount, if any */
718                         if (mh && can_mount) {
719                                 /*
720                                  * mh->mount == c, so start at mh->mount->next
721                                  */
722                                 rlock(&mh->lock);
723                                 for (f = mh->mount->next; f; f = f->next)
724                                         if ((wq =
725                                                  devtab[f->to->type].walk(f->to, NULL, names + nhave,
726                                                                                                   ntry)) != NULL)
727                                                 break;
728                                 runlock(&mh->lock);
729                                 if (f != NULL) {
730                                         type = f->to->type;
731                                         dev = f->to->dev;
732                                 }
733                         }
734                         if (wq == NULL) {
735                                 cclose(c);
736                                 cnameclose(cname);
737                                 if (nerror)
738                                         *nerror = nhave + 1;
739                                 if (mh != NULL)
740                                         putmhead(mh);
741                                 return -1;
742                         }
743                 }
744
745                 nmh = NULL;
746                 if (dotdot) {
747                         assert(wq->nqid == 1);
748                         assert(wq->clone != NULL);
749
750                         cname = addelem(cname, "..");
751                         nc = undomount(wq->clone, cname);
752                         n = 1;
753                 } else {
754                         nc = NULL;
755                         if (can_mount)
756                                 for (i = 0; i < wq->nqid && i < ntry - 1; i++)
757                                         if (findmount(&nc, &nmh, type, dev, wq->qid[i]))
758                                                 break;
759                         if (nc == NULL) {       /* no mount points along path */
760                                 if (wq->clone == NULL) {
761                                         cclose(c);
762                                         cnameclose(cname);
763                                         if (wq->nqid == 0 || (wq->qid[wq->nqid - 1].type & QTDIR)) {
764                                                 if (nerror)
765                                                         *nerror = nhave + wq->nqid + 1;
766                                                 set_errstr(Edoesnotexist);
767                                         } else {
768                                                 if (nerror)
769                                                         *nerror = nhave + wq->nqid;
770                                                 set_errstr(Enotdir);
771                                         }
772                                         kfree(wq);
773                                         if (mh != NULL)
774                                                 putmhead(mh);
775                                         return -1;
776                                 }
777                                 n = wq->nqid;
778                                 nc = wq->clone;
779                         } else {        /* stopped early, at a mount point */
780                                 if (wq->clone != NULL) {
781                                         cclose(wq->clone);
782                                         wq->clone = NULL;
783                                 }
784                                 lastmountpoint = nc;
785                                 n = i + 1;
786                         }
787                         for (i = 0; i < n; i++)
788                                 cname = addelem(cname, names[nhave + i]);
789                 }
790                 cclose(c);
791                 c = nc;
792                 putmhead(mh);
793                 mh = nmh;
794                 kfree(wq);
795         }
796
797         putmhead(mh);
798
799         c = cunique(c);
800
801         if (c->umh != NULL) {   //BUG
802                 printd("walk umh\n");
803                 putmhead(c->umh);
804                 c->umh = NULL;
805         }
806
807         cnameclose(c->name);
808         c->name = cname;
809         c->mountpoint = lastmountpoint;
810
811         cclose(*cp);
812         *cp = c;
813         if (nerror)
814                 *nerror = 0;
815         return 0;
816 }
817
818 /*
819  * c is a mounted non-creatable directory.  find a creatable one.
820  */
821 struct chan *createdir(struct chan *c, struct mhead *m)
822 {
823         ERRSTACK(1);
824         struct chan *nc;
825         struct mount *f;
826
827         rlock(&m->lock);
828         if (waserror()) {
829                 runlock(&m->lock);
830                 nexterror();
831         }
832         for (f = m->mount; f; f = f->next) {
833                 if (f->mflag & MCREATE) {
834                         nc = cclone(f->to);
835                         runlock(&m->lock);
836                         poperror();
837                         cclose(c);
838                         return nc;
839                 }
840         }
841         error(Enocreate);
842         poperror();
843         return 0;
844 }
845
846 /*
847  * In place, rewrite name to compress multiple /, eliminate ., and process ..
848  */
849 void cleancname(struct cname *n)
850 {
851         char *p;
852
853         if (n->s[0] == '#') {
854                 p = strchr(n->s, '/');
855                 if (p == NULL)
856                         return;
857                 cleanname(p);
858
859                 /*
860                  * The correct name is #i rather than #i/,
861                  * but the correct name of #/ is #/.
862                  */
863                 if (strcmp(p, "/") == 0 && n->s[1] != '/')
864                         *p = '\0';
865         } else
866                 cleanname(n->s);
867         n->len = strlen(n->s);
868 }
869
870 static void growparse(Elemlist * e)
871 {
872         char **new;
873         int *inew;
874         enum { Delta = 8 };
875
876         if (e->ARRAY_SIZEs % Delta == 0) {
877                 new = kzmalloc((e->ARRAY_SIZEs + Delta) * sizeof(char *), 0);
878                 memmove(new, e->elems, e->ARRAY_SIZEs * sizeof(char *));
879                 kfree(e->elems);
880                 e->elems = new;
881                 inew = kzmalloc((e->ARRAY_SIZEs + Delta + 1) * sizeof(int), 0);
882                 memmove(inew, e->off, e->ARRAY_SIZEs * sizeof(int));
883                 kfree(e->off);
884                 e->off = inew;
885         }
886 }
887
888 /*
889  * The name is known to be valid.
890  * Copy the name so slashes can be overwritten.
891  * An empty string will set ARRAY_SIZE=0.
892  * A path ending in / or /. or /.//./ etc. will have
893  * e.mustbedir = 1, so that we correctly
894  * reject, e.g., "/adm/users/." when /adm/users is a file
895  * rather than a directory.
896  */
897 static void parsename(char *name, Elemlist * e)
898 {
899         char *slash;
900
901         kstrdup(&e->name, name);
902         name = e->name;
903         e->ARRAY_SIZEs = 0;
904         e->elems = NULL;
905         e->off = kzmalloc(sizeof(int), 0);
906         e->off[0] = skipslash(name) - name;
907         for (;;) {
908                 name = skipslash(name);
909                 if (*name == '\0') {
910                         e->mustbedir = 1;
911                         break;
912                 }
913                 growparse(e);
914
915                 e->elems[e->ARRAY_SIZEs++] = name;
916                 /* we may want to do this again some day
917                    slash = utfrune(name, '/');
918                  */
919                 slash = strchr(name, '/');
920                 if (slash == NULL) {
921                         e->off[e->ARRAY_SIZEs] = name + strlen(name) - e->name;
922                         e->mustbedir = 0;
923                         break;
924                 }
925                 e->off[e->ARRAY_SIZEs] = slash - e->name;
926                 *slash++ = '\0';
927                 name = slash;
928         }
929 }
930
931 void *memrchr(void *va, int c, long n)
932 {
933         uint8_t *a, *e;
934
935         a = va;
936         for (e = a + n - 1; e > a; e--)
937                 if (*e == c)
938                         return e;
939         return NULL;
940 }
941
942 /*
943  * Turn a name into a channel.
944  * &name[0] is known to be a valid address.  It may be a kernel address.
945  *
946  * Opening with amode Aopen, Acreate, or Aremove guarantees
947  * that the result will be the only reference to that particular fid.
948  * This is necessary since we might pass the result to
949  * devtab[].remove().
950  *
951  * Opening Atodir, Amount, or Aaccess does not guarantee this.
952  *
953  * Opening Aaccess can, under certain conditions, return a
954  * correct Chan* but with an incorrect struct cname attached.
955  * Since the functions that open Aaccess (sysstat, syswstat, sys_stat)
956  * do not use the struct cname*, this avoids an unnecessary clone.
957  *
958  * Acreatechan will never open. It will do all the tests and return a chan
959  * for the directory where an open will succeed.
960  *
961  * The classic namec() is broken into a front end to get the starting point and
962  * a __namec_from, which does the guts of the lookup.  */
963 static struct chan *__namec_from(struct chan *c, char *aname, int amode,
964                                  int omode, uint32_t perm, bool can_mount)
965 {
966         ERRSTACK(2);
967         int len, npath;
968         struct chan *cnew;
969         struct cname *cname;
970         Elemlist e;
971         struct mhead *m;
972         char tmperrbuf[ERRMAX];
973         int saved_errno;
974         // Rune r;
975
976         static_assert(!(CINTERNAL_FLAGS & CEXTERNAL_FLAGS));
977
978         e.name = NULL;
979         e.elems = NULL;
980         e.off = NULL;
981         e.ARRAY_SIZEs = 0;
982         if (waserror()) {
983                 cclose(c);
984                 kfree(e.name);
985                 kfree(e.elems);
986                 kfree(e.off);
987 //dumpmount();
988                 nexterror();
989         }
990
991         /*
992          * Build a list of elements in the path.
993          */
994         parsename(aname, &e);
995
996         /*
997          * On create, ....
998          */
999         if ((amode == Acreate) || (amode == Acreatechan)) {
1000                 /* perm must have DMDIR if last element is / or /. */
1001                 if (e.mustbedir && !(perm & DMDIR)) {
1002                         npath = e.ARRAY_SIZEs;
1003                         strncpy(tmperrbuf, "create without DMDIR", sizeof(tmperrbuf));
1004                         goto NameError;
1005                 }
1006
1007                 /* don't try to walk the last path element just yet. */
1008                 if (e.ARRAY_SIZEs == 0)
1009                         error(Eexist);
1010                 e.ARRAY_SIZEs--;
1011         }
1012
1013         if (walk(&c, e.elems, e.ARRAY_SIZEs, can_mount, &npath) < 0) {
1014                 if (npath < 0 || npath > e.ARRAY_SIZEs) {
1015                         printd("namec %s walk error npath=%d\n", aname, npath);
1016                         error("walk failed");
1017                 }
1018 NameError:
1019                 if (current_errstr()[0]) {
1020                         /* errstr is set, we'll just stick with it and error out */
1021                         longjmp(&get_cur_errbuf()->jmpbuf, 1);
1022                 } else {
1023                         error("Name to chan lookup failed");
1024                 }
1025                 /* brho: skipping the namec custom error string business, since it hides
1026                  * the underlying failure.  implement this if you want the old stuff. */
1027 #if 0
1028                 strncpy(tmperrbuf, current->errstr, sizeof(tmperrbuf));
1029                 len = prefix + e.off[npath]; // prefix was name - aname, the start pt
1030                 if (len < ERRMAX / 3 || (name = memrchr(aname, '/', len)) == NULL
1031                         || name == aname)
1032                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "%.*s", len,
1033                                          aname);
1034                 else
1035                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "...%.*s",
1036                                          (int)(len - (name - aname)), name);
1037                 snprintf(current->errstr, ERRMAX, "%#q %s", get_cur_genbuf(),
1038                                  tmperrbuf);
1039 #endif
1040         }
1041
1042         if (e.mustbedir && !(c->qid.type & QTDIR)) {
1043                 npath = e.ARRAY_SIZEs;
1044                 strncpy(tmperrbuf, "not a directory", sizeof(tmperrbuf));
1045                 goto NameError;
1046         }
1047
1048         if ((amode == Aopen) && (omode & O_EXEC) && (c->qid.type & QTDIR)) {
1049                 npath = e.ARRAY_SIZEs;
1050                 error("cannot exec directory");
1051         }
1052
1053         switch (amode) {
1054                 case Aaccess:
1055                         if (can_mount)
1056                                 domount(&c, NULL);
1057                         break;
1058
1059                 case Abind:
1060                         m = NULL;
1061                         if (can_mount)
1062                                 domount(&c, &m);
1063                         if (c->umh != NULL)
1064                                 putmhead(c->umh);
1065                         c->umh = m;
1066                         break;
1067
1068                 case Aremove:
1069                 case Aopen:
1070 Open:
1071                         /* save the name; domount might change c */
1072                         cname = c->name;
1073                         kref_get(&cname->ref, 1);
1074                         m = NULL;
1075                         if (can_mount)
1076                                 domount(&c, &m);
1077
1078                         /* our own copy to open or remove */
1079                         c = cunique(c);
1080
1081                         /* now it's our copy anyway, we can put the name back */
1082                         cnameclose(c->name);
1083                         c->name = cname;
1084
1085                         switch (amode) {
1086                                 case Aremove:
1087                                         putmhead(m);
1088                                         break;
1089
1090                                 case Aopen:
1091                                 case Acreate:
1092                                         if (c->umh != NULL) {
1093                                                 printd("cunique umh\n");
1094                                                 putmhead(c->umh);
1095                                                 c->umh = NULL;
1096                                         }
1097
1098                                         /* only save the mount head if it's a multiple element union */
1099                                         if (m && m->mount && m->mount->next)
1100                                                 c->umh = m;
1101                                         else
1102                                                 putmhead(m);
1103                                         if (omode == O_EXEC)
1104                                                 c->flag &= ~CCACHE;
1105                                         /* here is where convert omode/vfs flags to c->flags.
1106                                          * careful, O_CLOEXEC and O_REMCLO are in there.  might need
1107                                          * to change that. */
1108                                         c->flag |= omode & CEXTERNAL_FLAGS;
1109                                         c = devtab[c->type].open(c,
1110                                                                  omode & ~O_CLOEXEC);
1111                                         /* if you get this from a dev, in the dev's open, you are
1112                                          * probably saving mode directly, without passing it through
1113                                          * openmode. */
1114                                         if (c->mode & O_TRUNC)
1115                                                 error("Device %s open failed to clear O_TRUNC",
1116                                                       devtab[c->type].name);
1117                                         break;
1118                         }
1119                         break;
1120
1121                 case Atodir:
1122                         /*
1123                          * Directories (e.g. for cd) are left before the mount point,
1124                          * so one may mount on / or . and see the effect.
1125                          */
1126                         if (!(c->qid.type & QTDIR))
1127                                 error(Enotdir);
1128                         break;
1129
1130                 case Amount:
1131                         /*
1132                          * When mounting on an already mounted upon directory,
1133                          * one wants subsequent mounts to be attached to the
1134                          * original directory, not the replacement.  Don't domount.
1135                          */
1136                         break;
1137
1138                 case Acreatechan:
1139                         /*
1140                          * We've walked to the place where it *could* be created.
1141                          * Return that chan.
1142                          */
1143                         break;
1144
1145                 case Acreate:
1146                         /*
1147                          * We've already walked all but the last element.
1148                          * If the last exists, try to open it OTRUNC.
1149                          * If omode&OEXCL is set, just give up.
1150                          */
1151                         e.ARRAY_SIZEs++;
1152                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, can_mount, NULL) == 0) {
1153                                 if (omode & O_EXCL)
1154                                         error(Eexist);
1155                                 omode |= O_TRUNC;
1156                                 goto Open;
1157                         }
1158
1159                         /*
1160                          * The semantics of the create(2) system call are that if the
1161                          * file exists and can be written, it is to be opened with truncation.
1162                          * On the other hand, the create(5) message fails if the file exists.
1163                          * If we get two create(2) calls happening simultaneously,
1164                          * they might both get here and send create(5) messages, but only
1165                          * one of the messages will succeed.  To provide the expected create(2)
1166                          * semantics, the call with the failed message needs to try the above
1167                          * walk again, opening for truncation.  This correctly solves the
1168                          * create/create race, in the sense that any observable outcome can
1169                          * be explained as one happening before the other.
1170                          * The create/create race is quite common.  For example, it happens
1171                          * when two rc subshells simultaneously update the same
1172                          * environment variable.
1173                          *
1174                          * The implementation still admits a create/create/remove race:
1175                          * (A) walk to file, fails
1176                          * (B) walk to file, fails
1177                          * (A) create file, succeeds, returns
1178                          * (B) create file, fails
1179                          * (A) remove file, succeeds, returns
1180                          * (B) walk to file, return failure.
1181                          *
1182                          * This is hardly as common as the create/create race, and is really
1183                          * not too much worse than what might happen if (B) got a hold of a
1184                          * file descriptor and then the file was removed -- either way (B) can't do
1185                          * anything with the result of the create call.  So we don't care about this race.
1186                          *
1187                          * Applications that care about more fine-grained decision of the races
1188                          * can use the OEXCL flag to get at the underlying create(5) semantics;
1189                          * by default we provide the common case.
1190                          *
1191                          * We need to stay behind the mount point in case we
1192                          * need to do the first walk again (should the create fail).
1193                          *
1194                          * We also need to cross the mount point and find the directory
1195                          * in the union in which we should be creating.
1196                          *
1197                          * The channel staying behind is c, the one moving forward is cnew.
1198                          */
1199                         m = NULL;
1200                         cnew = NULL;    /* is this assignment necessary? */
1201                         /* discard error */
1202                         if (!waserror()) {      /* try create */
1203                                 if (can_mount && findmount(&cnew, &m, c->type, c->dev, c->qid))
1204                                         cnew = createdir(cnew, m);
1205                                 else {
1206                                         cnew = c;
1207                                         chan_incref(cnew);
1208                                 }
1209
1210                                 /*
1211                                  * We need our own copy of the Chan because we're
1212                                  * about to send a create, which will move it.  Once we have
1213                                  * our own copy, we can fix the name, which might be wrong
1214                                  * if findmount gave us a new Chan.
1215                                  */
1216                                 cnew = cunique(cnew);
1217                                 cnameclose(cnew->name);
1218                                 cnew->name = c->name;
1219                                 kref_get(&cnew->name->ref, 1);
1220
1221                                 devtab[cnew->type].create(cnew, e.elems[e.ARRAY_SIZEs - 1],
1222                                                                                   omode & ~(O_EXCL | O_CLOEXEC),
1223                                                           perm);
1224                                 poperror();
1225                                 if (omode & O_APPEND)
1226                                         cnew->flag |= O_APPEND;
1227                                 if (omode & O_CLOEXEC)
1228                                         cnew->flag |= O_CLOEXEC;
1229                                 if (omode & O_REMCLO)
1230                                         cnew->flag |= O_REMCLO;
1231                                 if (m)
1232                                         putmhead(m);
1233                                 cclose(c);
1234                                 c = cnew;
1235                                 c->name = addelem(c->name, e.elems[e.ARRAY_SIZEs - 1]);
1236                                 break;
1237                         }
1238
1239                         /* create failed */
1240                         cclose(cnew);
1241                         if (m)
1242                                 putmhead(m);
1243                         if (omode & O_EXCL)
1244                                 nexterror();    /* safe since we're in a waserror() */
1245                         poperror();     /* matching the if(!waserror) */
1246
1247                         /* save error, so walk doesn't clobber our existing errstr */
1248                         strncpy(tmperrbuf, current_errstr(), MAX_ERRSTR_LEN);
1249                         saved_errno = get_errno();
1250                         /* note: we depend that walk does not error */
1251                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, can_mount, NULL) < 0) {
1252                                 set_errno(saved_errno);
1253                                 error(tmperrbuf);       /* report the error we had originally */
1254                         }
1255                         strncpy(current_errstr(), tmperrbuf, MAX_ERRSTR_LEN);
1256                         omode |= O_TRUNC;
1257                         goto Open;
1258
1259                 default:
1260                         panic("unknown namec access %d\n", amode);
1261         }
1262
1263         poperror();
1264
1265         if (e.ARRAY_SIZEs > 0)
1266                 strncpy(get_cur_genbuf(), e.elems[e.ARRAY_SIZEs - 1], GENBUF_SZ);
1267         else
1268                 strncpy(get_cur_genbuf(), ".", GENBUF_SZ);
1269
1270         kfree(e.name);
1271         kfree(e.elems);
1272         kfree(e.off);
1273
1274         return c;
1275 }
1276
1277 struct chan *namec(char *name, int amode, int omode, uint32_t perm)
1278 {
1279         bool can_mount = TRUE;
1280         struct chan *c;
1281         char *devname, *devspec;
1282         int n, devtype;
1283
1284         if (name[0] == '\0')
1285                 error("empty file name");
1286         validname(name, 1);
1287         /*
1288          * Find the starting off point (the current slash, the root of
1289          * a device tree, or the current dot) as well as the name to
1290          * evaluate starting there.
1291          */
1292         switch (name[0]) {
1293                 case '/':
1294                         c = current->slash;
1295                         if (!c)
1296                                 panic("no slash!");
1297                         chan_incref(c);
1298                         break;
1299
1300                 case '#':
1301                         can_mount = FALSE;
1302                         devname = get_cur_genbuf();
1303                         devname[0] = '\0';
1304                         n = 0;
1305                         name++; /* drop the # */
1306                         while ((*name != '\0') && (*name != '/')) {
1307                                 if (n >= GENBUF_SZ - 1)
1308                                         error(Efilename);
1309                                 devname[n++] = *name++;
1310                         }
1311                         devname[n] = '\0';
1312                         /* for a name #foo.spec, devname = foo\0, devspec = spec\0.
1313                          * genbuf contains foo\0spec\0.  for no spec, devspec = \0 */
1314                         devspec = strchr(devname, '.');
1315                         if (devspec) {
1316                                 *devspec = '\0';
1317                                 devspec++;
1318                         } else {
1319                                 devspec = &devname[n];
1320                         }
1321                         if (!strcmp(devname, "mnt"))
1322                                 error(Enoattach);
1323                         /* TODO: deal with this "nodevs" business. */
1324                         #if 0
1325                         /*
1326                          *  the nodevs exceptions are
1327                          *  |  it only gives access to pipes you create
1328                          *  e  this process's environment
1329                          *  s  private file2chan creation space
1330                          *  D private secure sockets name space
1331                          *  a private TLS name space
1332                          */
1333                         if (current->pgrp->nodevs &&
1334                                 //          (utfrune("|esDa", r) == NULL
1335                                 ((strchr("|esDa", get_cur_genbuf()[1]) == NULL)
1336                                  || (get_cur_genbuf()[1] == 's' // || r == 's'
1337                                          && get_cur_genbuf()[n] != '\0')))
1338                                 error(Enoattach);
1339                         #endif
1340                         devtype = devno(devname, 1);
1341                         if (devtype == -1)
1342                                 error("Unknown #device %s (spec %s)", devname, devspec);
1343                         c = devtab[devtype].attach(devspec);
1344                         break;
1345                 default:
1346                         /* this case also covers \0 */
1347                         c = current->dot;
1348                         if (!c)
1349                                 panic("no dot!");
1350                         chan_incref(c);
1351                         break;
1352         }
1353         return __namec_from(c, name, amode, omode, perm, can_mount);
1354 }
1355
1356 struct chan *namec_from(struct chan *c, char *name, int amode, int omode,
1357                         uint32_t perm)
1358 {
1359         if (name[0] == '\0') {
1360                 /* Our responsibility to cclose 'c' on our error */
1361                 cclose(c);
1362                 error("empty file name");
1363         }
1364         validname(name, 1);
1365         return __namec_from(c, name, amode, omode, perm, TRUE);
1366 }
1367
1368 /*
1369  * name is valid. skip leading / and ./ as much as possible
1370  */
1371 char *skipslash(char *name)
1372 {
1373         while (name[0] == '/'
1374                    || (name[0] == '.' && (name[1] == 0 || name[1] == '/')))
1375                 name++;
1376         return name;
1377 }
1378
1379 char isfrog[256] = {
1380          /*NUL*/ 1, 1, 1, 1, 1, 1, 1, 1,
1381          /*BKS*/ 1, 1, 1, 1, 1, 1, 1, 1,
1382          /*DLE*/ 1, 1, 1, 1, 1, 1, 1, 1,
1383          /*CAN*/ 1, 1, 1, 1, 1, 1, 1, 1,
1384         ['/'] 1,
1385         [0x7f] 1,
1386 };
1387
1388 /*
1389  * Check that the name
1390  *  a) is in valid memory.
1391  *  b) is shorter than 2^16 bytes, so it can fit in a 9P string field.
1392  *  c) contains no frogs.
1393  * The first byte is known to be addressible by the requester, so the
1394  * routine works for kernel and user memory both.
1395  * The parameter slashok flags whether a slash character is an error
1396  * or a valid character.
1397  */
1398 void validname(char *aname, int slashok)
1399 {
1400         char *ename, *name;
1401         int c;
1402
1403         name = aname;
1404         ename = memchr(name, 0, (1 << 16));
1405
1406         if (ename == NULL || ename - name >= (1 << 16))
1407                 error("name too long");
1408
1409         while (*name) {
1410                 /* all characters above '~' are ok */
1411                 c = *(uint8_t *) name;
1412 #if 0
1413                 if (c >= Runeself)
1414                         name += chartorune(&r, name);
1415 #endif
1416                 if (c >= 0x7f) {
1417                         error("Akaros doesn't do UTF-8");
1418                 } else {
1419                         if (isfrog[c])
1420                                 if (!slashok || c != '/') {
1421                                         error("%s: %s (%p), at char %c", Ebadchar, aname, aname, c);
1422                                 }
1423                         name++;
1424                 }
1425         }
1426 }
1427
1428 void isdir(struct chan *c)
1429 {
1430         if (c->qid.type & QTDIR)
1431                 return;
1432         error(Enotdir);
1433 }
1434
1435 /*
1436  * This is necessary because there are many
1437  * pointers to the top of a given mount list:
1438  *
1439  *      - the mhead in the namespace hash table
1440  *      - the mhead in chans returned from findmount:
1441  *        used in namec and then by unionread.
1442  *      - the mhead in chans returned from createdir:
1443  *        used in the open/create race protect, which is gone.
1444  *
1445  * The RWlock in the Mhead protects the mount list it contains.
1446  * The mount list is deleted when we cunmount.
1447  * The RWlock ensures that nothing is using the mount list at that time.
1448  *
1449  * It is okay to replace c->mh with whatever you want as
1450  * long as you are sure you have a unique reference to it.
1451  *
1452  * This comment might belong somewhere else.
1453  */
1454 void putmhead(struct mhead *m)
1455 {
1456         if (m)
1457                 kref_put(&m->ref);
1458 }