d55919b6cebc12684d9936b9f6cb5dbe81908eb9
[akaros.git] / kern / src / ns / chan.c
1 // INFERNO
2 #include <vfs.h>
3 #include <kfs.h>
4 #include <slab.h>
5 #include <kmalloc.h>
6 #include <kref.h>
7 #include <string.h>
8 #include <stdio.h>
9 #include <assert.h>
10 #include <error.h>
11 #include <cpio.h>
12 #include <pmap.h>
13 #include <smp.h>
14 #include <syscall.h>
15
16 char *channame(struct chan *c)
17 {       /* DEBUGGING */
18         if (c == NULL)
19                 return "<NULL chan>";
20         if (c->name == NULL)
21                 return "<NULL name>";
22         if (c->name->s == NULL)
23                 return "<NULL name.s>";
24         return c->name->s;
25 }
26
27 enum {
28         CNAMESLOP = 20
29 };
30
31 struct {
32         spinlock_t lock;
33         int fid;
34         struct chan *free;
35         struct chan *list;
36 } chanalloc;
37
38 typedef struct Elemlist Elemlist;
39
40 struct Elemlist {
41         char *name;                                     /* copy of name, so '/' can be overwritten */
42         int ARRAY_SIZEs;
43         char **elems;
44         int *off;
45         int mustbedir;
46 };
47
48 #define SEP(c) ((c) == 0 || (c) == '/')
49 void cleancname(struct cname *);
50
51 int isdotdot(char *p)
52 {
53         return p[0] == '.' && p[1] == '.' && p[2] == '\0';
54 }
55
56 int emptystr(char *s)
57 {
58         if (s == NULL)
59                 return 1;
60         if (s[0] == '\0')
61                 return 1;
62         return 0;
63 }
64
65 /*
66  * Atomically replace *p with copy of s
67  */
68 void kstrdup(char **p, char *s)
69 {
70         int n;
71         char *t, *prev;
72
73         n = strlen(s) + 1;
74         /* if it's a user, we can wait for memory; if not, something's very wrong */
75         if (current) {
76                 t = kzmalloc(n, 0);
77         } else {
78                 t = kzmalloc(n, 0);
79                 if (t == NULL)
80                         panic("kstrdup: no memory");
81         }
82         memmove(t, s, n);
83         prev = *p;
84         *p = t;
85         kfree(prev);
86 }
87
88 void chandevreset(void)
89 {
90         int i;
91
92         for (i = 0; &devtab[i] < __devtabend; i++)
93                 devtab[i].reset();
94 }
95
96 void chandevinit(void)
97 {
98         int i;
99
100         for (i = 0; &devtab[i] < __devtabend; i++)
101                 devtab[i].init();
102 }
103
104 void chandevshutdown(void)
105 {
106         int i;
107
108         /* shutdown in reverse order */
109         for (i = 0; &devtab[i] < __devtabend; i++) ;
110         for (i--; i >= 0; i--)
111                 devtab[i].shutdown();
112 }
113
114 static void chan_release(struct kref *kref)
115 {
116         struct chan *c = container_of(kref, struct chan, ref);
117         ERRSTACK(1);
118         /* this style discards the error from close().  picture it as
119          * if (waserror()) { } else { close(); } chanfree_no_matter_what();  */
120         if (!waserror()) {
121                 printd("releasing chan %p, type %d\n", c, c->type);
122                 /* -1 means there is no dev yet.  wants a noop for close() */
123                 if (c->type != -1)
124                         devtab[c->type].close(c);
125         }
126         /* need to poperror regardless of whether we error'd or not */
127         poperror();
128         /* and chan free no matter what */
129         chanfree(c);
130 }
131
132 struct chan *newchan(void)
133 {
134         struct chan *c;
135
136         spin_lock(&(&chanalloc)->lock);
137         c = chanalloc.free;
138         if (c != 0)
139                 chanalloc.free = c->next;
140         spin_unlock(&(&chanalloc)->lock);
141
142         if (c == NULL) {
143                 c = kzmalloc(sizeof(struct chan), 0);
144                 spin_lock(&(&chanalloc)->lock);
145                 c->fid = ++chanalloc.fid;
146                 c->link = chanalloc.list;
147                 chanalloc.list = c;
148                 spin_unlock(&(&chanalloc)->lock);
149                 spinlock_init(&c->lock);
150                 qlock_init(&c->umqlock);
151         }
152
153         /* if you get an error before associating with a dev, cclose skips calling
154          * the dev's close */
155         c->type = -1;
156         c->flag = 0;
157         kref_init(&c->ref, chan_release, 1);
158         c->dev = 0;
159         c->offset = 0;
160         c->iounit = 0;
161         c->umh = 0;
162         c->uri = 0;
163         c->dri = 0;
164         c->aux = 0;
165         c->mchan = 0;
166         c->mcp = 0;
167         c->mux = 0;
168         c->mqid.path = 0;
169         c->mqid.vers = 0;
170         c->mqid.type = 0;
171         c->name = 0;
172         c->buf = NULL;
173         return c;
174 }
175
176 static void __cname_release(struct kref *kref)
177 {
178         struct cname *n = container_of(kref, struct cname, ref);
179         kfree(n->s);
180         kfree(n);
181 }
182
183 struct cname *newcname(char *s)
184 {
185         struct cname *n;
186         int i;
187
188         n = kzmalloc(sizeof(*n), 0);
189         i = strlen(s);
190         n->len = i;
191         n->alen = i + CNAMESLOP;
192         n->s = kzmalloc(n->alen, 0);
193         memmove(n->s, s, i + 1);
194         kref_init(&n->ref, __cname_release, 1);
195         return n;
196 }
197
198 void cnameclose(struct cname *n)
199 {
200         if (n == NULL)
201                 return;
202         kref_put(&n->ref);
203 }
204
205 struct cname *addelem(struct cname *n, char *s)
206 {
207         int i, a;
208         char *t;
209         struct cname *new;
210
211         if (s[0] == '.' && s[1] == '\0')
212                 return n;
213
214         if (kref_refcnt(&n->ref) > 1) {
215                 /* copy on write */
216                 new = newcname(n->s);
217                 cnameclose(n);
218                 n = new;
219         }
220
221         i = strlen(s);
222         if (n->len + 1 + i + 1 > n->alen) {
223                 a = n->len + 1 + i + 1 + CNAMESLOP;
224                 t = kzmalloc(a, 0);
225                 memmove(t, n->s, n->len + 1);
226                 kfree(n->s);
227                 n->s = t;
228                 n->alen = a;
229         }
230         if (n->len > 0 && n->s[n->len - 1] != '/' && s[0] != '/')       /* don't insert extra slash if one is present */
231                 n->s[n->len++] = '/';
232         memmove(n->s + n->len, s, i + 1);
233         n->len += i;
234         if (isdotdot(s))
235                 cleancname(n);
236         return n;
237 }
238
239 void chanfree(struct chan *c)
240 {
241         c->flag = CFREE;
242
243         if (c->umh != NULL) {
244                 putmhead(c->umh);
245                 c->umh = NULL;
246         }
247         if (c->umc != NULL) {
248                 cclose(c->umc);
249                 c->umc = NULL;
250         }
251         if (c->mux != NULL) {
252                 //
253                 muxclose(c->mux);
254                 c->mux = NULL;
255         }
256         if (c->mchan != NULL) {
257                 cclose(c->mchan);
258                 c->mchan = NULL;
259         }
260
261         cnameclose(c->name);
262         if (c->buf)
263                 kfree(c->buf);
264         c->buf = NULL;
265         c->bufused = 0;
266         c->ateof = 0;
267
268         spin_lock(&(&chanalloc)->lock);
269         c->next = chanalloc.free;
270         chanalloc.free = c;
271         spin_unlock(&(&chanalloc)->lock);
272 }
273
274 void cclose(struct chan *c)
275 {
276         if (c == 0)
277                 return;
278
279         if (c->flag & CFREE)
280                 panic("cclose %p", getcallerpc(&c));
281
282         kref_put(&c->ref);
283 }
284
285 /* convenience wrapper for interposition.  if you do use this, don't forget
286  * about the kref_get_not_zero in plan9setup() */
287 void chan_incref(struct chan *c)
288 {
289         kref_get(&c->ref, 1);
290 }
291
292 /*
293  * Make sure we have the only copy of c.  (Copy on write.)
294  */
295 struct chan *cunique(struct chan *c)
296 {
297         struct chan *nc;
298
299         if (kref_refcnt(&c->ref) != 1) {
300                 nc = cclone(c);
301                 cclose(c);
302                 c = nc;
303         }
304
305         return c;
306 }
307
308 int eqqid(struct qid a, struct qid b)
309 {
310         return a.path == b.path && a.vers == b.vers;
311 }
312
313 int eqchan(struct chan *a, struct chan *b, int pathonly)
314 {
315         if (a->qid.path != b->qid.path)
316                 return 0;
317         if (!pathonly && a->qid.vers != b->qid.vers)
318                 return 0;
319         if (a->type != b->type)
320                 return 0;
321         if (a->dev != b->dev)
322                 return 0;
323         return 1;
324 }
325
326 int eqchantdqid(struct chan *a, int type, int dev, struct qid qid, int pathonly)
327 {
328         if (a->qid.path != qid.path)
329                 return 0;
330         if (!pathonly && a->qid.vers != qid.vers)
331                 return 0;
332         if (a->type != type)
333                 return 0;
334         if (a->dev != dev)
335                 return 0;
336         return 1;
337 }
338
339 static void mh_release(struct kref *kref)
340 {
341         struct mhead *mh = container_of(kref, struct mhead, ref);
342         mh->mount = (struct mount *)0xCafeBeef;
343         kfree(mh);
344 }
345
346 struct mhead *newmhead(struct chan *from)
347 {
348         struct mhead *mh;
349
350         mh = kzmalloc(sizeof(struct mhead), 0);
351         kref_init(&mh->ref, mh_release, 1);
352         mh->from = from;
353         chan_incref(from);
354
355 /*
356         n = from->name->len;
357         if(n >= sizeof(mh->fromname))
358                 n = sizeof(mh->fromname)-1;
359         memmove(mh->fromname, from->name->s, n);
360         mh->fromname[n] = 0;
361 */
362         return mh;
363 }
364
365 int cmount(struct chan *new, struct chan *old, int flag, char *spec)
366 {
367         ERRSTACK(1);
368         struct pgrp *pg;
369         int order, flg;
370         struct mhead *m, **l, *mh;
371         struct mount *nm, *f, *um, **h;
372
373         if (QTDIR & (old->qid.type ^ new->qid.type))
374                 error(Emount);
375
376         if (old->umh)
377                 printd("cmount old extra umh\n");
378
379         order = flag & MORDER;
380
381         if ((old->qid.type & QTDIR) == 0 && order != MREPL)
382                 error(Emount);
383
384         mh = new->umh;
385
386         /*
387          * Not allowed to bind when the old directory
388          * is itself a union.  (Maybe it should be allowed, but I don't see
389          * what the semantics would be.)
390          *
391          * We need to check mh->mount->next to tell unions apart from
392          * simple mount points, so that things like
393          *  mount -c fd /root
394          *  bind -c /root /
395          * work.  The check of mount->mflag catches things like
396          *  mount fd /root
397          *  bind -c /root /
398          * 
399          * This is far more complicated than it should be, but I don't
400          * see an easier way at the moment.     -rsc
401          */
402         if ((flag & MCREATE) && mh && mh->mount
403                 && (mh->mount->next || !(mh->mount->mflag & MCREATE)))
404                 error(Emount);
405
406         pg = current->pgrp;
407         wlock(&pg->ns);
408
409         l = &MOUNTH(pg, old->qid);
410         for (m = *l; m; m = m->hash) {
411                 if (eqchan(m->from, old, 1))
412                         break;
413                 l = &m->hash;
414         }
415
416         if (m == NULL) {
417                 /*
418                  *  nothing mounted here yet.  create a mount
419                  *  head and add to the hash table.
420                  */
421                 m = newmhead(old);
422                 *l = m;
423
424                 /*
425                  *  if this is a union mount, add the old
426                  *  node to the mount chain.
427                  */
428                 if (order != MREPL)
429                         m->mount = newmount(m, old, 0, 0);
430         }
431         wlock(&m->lock);
432         if (waserror()) {
433                 wunlock(&m->lock);
434                 nexterror();
435         }
436         wunlock(&pg->ns);
437
438         nm = newmount(m, new, flag, spec);
439         if (mh != NULL && mh->mount != NULL) {
440                 /*
441                  *  copy a union when binding it onto a directory
442                  */
443                 flg = order;
444                 if (order == MREPL)
445                         flg = MAFTER;
446                 h = &nm->next;
447                 um = mh->mount;
448                 for (um = um->next; um; um = um->next) {
449                         f = newmount(m, um->to, flg, um->spec);
450                         *h = f;
451                         h = &f->next;
452                 }
453         }
454
455         if (m->mount && order == MREPL) {
456                 mountfree(m->mount);
457                 m->mount = 0;
458         }
459
460         if (flag & MCREATE)
461                 nm->mflag |= MCREATE;
462
463         if (m->mount && order == MAFTER) {
464                 for (f = m->mount; f->next; f = f->next) ;
465                 f->next = nm;
466         } else {
467                 for (f = nm; f->next; f = f->next) ;
468                 f->next = m->mount;
469                 m->mount = nm;
470         }
471
472         wunlock(&m->lock);
473         poperror();
474         return nm->mountid;
475 }
476
477 void cunmount(struct chan *mnt, struct chan *mounted)
478 {
479         struct pgrp *pg;
480         struct mhead *m, **l;
481         struct mount *f, **p;
482
483         if (mnt->umh)   /* should not happen */
484                 printd("cunmount newp extra umh %p has %p\n", mnt, mnt->umh);
485
486         /*
487          * It _can_ happen that mounted->umh is non-NULL, 
488          * because mounted is the result of namec(Aopen)
489          * (see sysfile.c:/^sysunmount).
490          * If we open a union directory, it will have a umh.
491          * Although surprising, this is okay, since the
492          * cclose will take care of freeing the umh.
493          */
494
495         pg = current->pgrp;
496         wlock(&pg->ns);
497
498         l = &MOUNTH(pg, mnt->qid);
499         for (m = *l; m; m = m->hash) {
500                 if (eqchan(m->from, mnt, 1))
501                         break;
502                 l = &m->hash;
503         }
504
505         if (m == 0) {
506                 wunlock(&pg->ns);
507                 error(Eunmount);
508         }
509
510         wlock(&m->lock);
511         if (mounted == 0) {
512                 *l = m->hash;
513                 wunlock(&pg->ns);
514                 mountfree(m->mount);
515                 m->mount = NULL;
516                 cclose(m->from);
517                 wunlock(&m->lock);
518                 putmhead(m);
519                 return;
520         }
521
522         p = &m->mount;
523         for (f = *p; f; f = f->next) {
524                 /* BUG: Needs to be 2 pass */
525                 if (eqchan(f->to, mounted, 1) ||
526                         (f->to->mchan && eqchan(f->to->mchan, mounted, 1))) {
527                         *p = f->next;
528                         f->next = 0;
529                         mountfree(f);
530                         if (m->mount == NULL) {
531                                 *l = m->hash;
532                                 cclose(m->from);
533                                 wunlock(&m->lock);
534                                 wunlock(&pg->ns);
535                                 putmhead(m);
536                                 return;
537                         }
538                         wunlock(&m->lock);
539                         wunlock(&pg->ns);
540                         return;
541                 }
542                 p = &f->next;
543         }
544         wunlock(&m->lock);
545         wunlock(&pg->ns);
546         error(Eunion);
547 }
548
549 struct chan *cclone(struct chan *c)
550 {
551         struct chan *nc;
552         struct walkqid *wq;
553
554         wq = devtab[c->type].walk(c, NULL, NULL, 0);
555         if (wq == NULL)
556                 error("clone failed");
557         nc = wq->clone;
558         kfree(wq);
559         nc->name = c->name;
560         if (c->name)
561                 kref_get(&c->name->ref, 1);
562         return nc;
563 }
564
565 int
566 findmount(struct chan **cp,
567                   struct mhead **mp, int type, int dev, struct qid qid)
568 {
569         struct pgrp *pg;
570         struct mhead *m;
571
572         pg = current->pgrp;
573         rlock(&pg->ns);
574         for (m = MOUNTH(pg, qid); m; m = m->hash) {
575                 rlock(&m->lock);
576                 if (m->from == NULL) {
577                         printd("m %p m->from 0\n", m);
578                         runlock(&m->lock);
579                         continue;
580                 }
581                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
582                         runlock(&pg->ns);
583                         if (mp != NULL) {
584                                 kref_get(&m->ref, 1);
585                                 if (*mp != NULL)
586                                         putmhead(*mp);
587                                 *mp = m;
588                         }
589                         if (*cp != NULL)
590                                 cclose(*cp);
591                         chan_incref(m->mount->to);
592                         *cp = m->mount->to;
593                         runlock(&m->lock);
594                         return 1;
595                 }
596                 runlock(&m->lock);
597         }
598
599         runlock(&pg->ns);
600         return 0;
601 }
602
603 int domount(struct chan **cp, struct mhead **mp)
604 {
605         return findmount(cp, mp, (*cp)->type, (*cp)->dev, (*cp)->qid);
606 }
607
608 struct chan *undomount(struct chan *c, struct cname *name)
609 {
610         ERRSTACK(1);
611         struct chan *nc;
612         struct pgrp *pg;
613         struct mount *t;
614         struct mhead **h, **he, *f;
615
616         pg = current->pgrp;
617         rlock(&pg->ns);
618         if (waserror()) {
619                 runlock(&pg->ns);
620                 nexterror();
621         }
622
623         he = &pg->mnthash[MNTHASH];
624         for (h = pg->mnthash; h < he; h++) {
625                 for (f = *h; f; f = f->hash) {
626                         if (strcmp(f->from->name->s, name->s) != 0)
627                                 continue;
628                         for (t = f->mount; t; t = t->next) {
629                                 if (eqchan(c, t->to, 1)) {
630                                         /*
631                                          * We want to come out on the left hand side of the mount
632                                          * point using the element of the union that we entered on.
633                                          * To do this, find the element that has a from name of
634                                          * c->name->s.
635                                          */
636                                         if (strcmp(t->head->from->name->s, name->s) != 0)
637                                                 continue;
638                                         nc = t->head->from;
639                                         chan_incref(nc);
640                                         cclose(c);
641                                         c = nc;
642                                         break;
643                                 }
644                         }
645                 }
646         }
647         poperror();
648         runlock(&pg->ns);
649         return c;
650 }
651
652 /*
653  * Either walks all the way or not at all.  No partial results in *cp.
654  * *nerror is the number of names to display in an error message.
655  */
656 static char Edoesnotexist[] = "does not exist";
657 int walk(struct chan **cp, char **names, int nnames, int nomount, int *nerror)
658 {
659         int dev, dotdot, i, n, nhave, ntry, type;
660         struct chan *c, *nc;
661         struct cname *cname;
662         struct mount *f;
663         struct mhead *mh, *nmh;
664         struct walkqid *wq;
665
666         c = *cp;
667         chan_incref(c);
668         cname = c->name;
669         kref_get(&cname->ref, 1);
670         mh = NULL;
671
672         /*
673          * While we haven't gotten all the way down the path:
674          *    1. step through a mount po int unused_int, if any
675          *    2. send a walk request for initial dotdot or initial prefix without dotdot
676          *    3. move to the first mountpoint along the way.
677          *    4. repeat.
678          *
679          * An invariant is that each time through the loop, c is on the undomount
680          * side of the mount po int unused_int, and c's name is cname.
681          */
682         for (nhave = 0; nhave < nnames; nhave += n) {
683                 if ((c->qid.type & QTDIR) == 0) {
684                         if (nerror)
685                                 *nerror = nhave;
686                         cnameclose(cname);
687                         cclose(c);
688                         set_errstr(Enotdir);
689                         if (mh != NULL)
690                                 putmhead(mh);
691                         return -1;
692                 }
693                 ntry = nnames - nhave;
694                 if (ntry > MAXWELEM)
695                         ntry = MAXWELEM;
696                 dotdot = 0;
697                 for (i = 0; i < ntry; i++) {
698                         if (isdotdot(names[nhave + i])) {
699                                 if (i == 0) {
700                                         dotdot = 1;
701                                         ntry = 1;
702                                 } else
703                                         ntry = i;
704                                 break;
705                         }
706                 }
707
708                 if (!dotdot && !nomount)
709                         domount(&c, &mh);
710
711                 type = c->type;
712                 dev = c->dev;
713
714                 if ((wq = devtab[type].walk(c, NULL, names + nhave, ntry)) == NULL) {
715                         /* try a union mount, if any */
716                         if (mh && !nomount) {
717                                 /*
718                                  * mh->mount == c, so start at mh->mount->next
719                                  */
720                                 rlock(&mh->lock);
721                                 for (f = mh->mount->next; f; f = f->next)
722                                         if ((wq =
723                                                  devtab[f->to->type].walk(f->to, NULL, names + nhave,
724                                                                                                   ntry)) != NULL)
725                                                 break;
726                                 runlock(&mh->lock);
727                                 if (f != NULL) {
728                                         type = f->to->type;
729                                         dev = f->to->dev;
730                                 }
731                         }
732                         if (wq == NULL) {
733                                 cclose(c);
734                                 cnameclose(cname);
735                                 if (nerror)
736                                         *nerror = nhave + 1;
737                                 if (mh != NULL)
738                                         putmhead(mh);
739                                 return -1;
740                         }
741                 }
742
743                 nmh = NULL;
744                 if (dotdot) {
745                         assert(wq->nqid == 1);
746                         assert(wq->clone != NULL);
747
748                         cname = addelem(cname, "..");
749                         nc = undomount(wq->clone, cname);
750                         n = 1;
751                 } else {
752                         nc = NULL;
753                         if (!nomount)
754                                 for (i = 0; i < wq->nqid && i < ntry - 1; i++)
755                                         if (findmount(&nc, &nmh, type, dev, wq->qid[i]))
756                                                 break;
757                         if (nc == NULL) {       /* no mount points along path */
758                                 if (wq->clone == NULL) {
759                                         cclose(c);
760                                         cnameclose(cname);
761                                         if (wq->nqid == 0 || (wq->qid[wq->nqid - 1].type & QTDIR)) {
762                                                 if (nerror)
763                                                         *nerror = nhave + wq->nqid + 1;
764                                                 set_errstr(Edoesnotexist);
765                                         } else {
766                                                 if (nerror)
767                                                         *nerror = nhave + wq->nqid;
768                                                 set_errstr(Enotdir);
769                                         }
770                                         kfree(wq);
771                                         if (mh != NULL)
772                                                 putmhead(mh);
773                                         return -1;
774                                 }
775                                 n = wq->nqid;
776                                 nc = wq->clone;
777                         } else {        /* stopped early, at a mount point */
778                                 if (wq->clone != NULL) {
779                                         cclose(wq->clone);
780                                         wq->clone = NULL;
781                                 }
782                                 n = i + 1;
783                         }
784                         for (i = 0; i < n; i++)
785                                 cname = addelem(cname, names[nhave + i]);
786                 }
787                 cclose(c);
788                 c = nc;
789                 putmhead(mh);
790                 mh = nmh;
791                 kfree(wq);
792         }
793
794         putmhead(mh);
795
796         c = cunique(c);
797
798         if (c->umh != NULL) {   //BUG
799                 printd("walk umh\n");
800                 putmhead(c->umh);
801                 c->umh = NULL;
802         }
803
804         cnameclose(c->name);
805         c->name = cname;
806
807         cclose(*cp);
808         *cp = c;
809         if (nerror)
810                 *nerror = 0;
811         return 0;
812 }
813
814 /*
815  * c is a mounted non-creatable directory.  find a creatable one.
816  */
817 struct chan *createdir(struct chan *c, struct mhead *m)
818 {
819         ERRSTACK(1);
820         struct chan *nc;
821         struct mount *f;
822
823         rlock(&m->lock);
824         if (waserror()) {
825                 runlock(&m->lock);
826                 nexterror();
827         }
828         for (f = m->mount; f; f = f->next) {
829                 if (f->mflag & MCREATE) {
830                         nc = cclone(f->to);
831                         runlock(&m->lock);
832                         poperror();
833                         cclose(c);
834                         return nc;
835                 }
836         }
837         error(Enocreate);
838         poperror();
839         return 0;
840 }
841
842 /*
843  * In place, rewrite name to compress multiple /, eliminate ., and process ..
844  */
845 void cleancname(struct cname *n)
846 {
847         char *p;
848
849         if (n->s[0] == '#') {
850                 p = strchr(n->s, '/');
851                 if (p == NULL)
852                         return;
853                 cleanname(p);
854
855                 /*
856                  * The correct name is #i rather than #i/,
857                  * but the correct name of #/ is #/.
858                  */
859                 if (strcmp(p, "/") == 0 && n->s[1] != '/')
860                         *p = '\0';
861         } else
862                 cleanname(n->s);
863         n->len = strlen(n->s);
864 }
865
866 static void growparse(Elemlist * e)
867 {
868         char **new;
869         int *inew;
870         enum { Delta = 8 };
871
872         if (e->ARRAY_SIZEs % Delta == 0) {
873                 new = kzmalloc((e->ARRAY_SIZEs + Delta) * sizeof(char *), 0);
874                 memmove(new, e->elems, e->ARRAY_SIZEs * sizeof(char *));
875                 kfree(e->elems);
876                 e->elems = new;
877                 inew = kzmalloc((e->ARRAY_SIZEs + Delta + 1) * sizeof(int), 0);
878                 memmove(inew, e->off, e->ARRAY_SIZEs * sizeof(int));
879                 kfree(e->off);
880                 e->off = inew;
881         }
882 }
883
884 /*
885  * The name is known to be valid.
886  * Copy the name so slashes can be overwritten.
887  * An empty string will set ARRAY_SIZE=0.
888  * A path ending in / or /. or /.//./ etc. will have
889  * e.mustbedir = 1, so that we correctly
890  * reject, e.g., "/adm/users/." when /adm/users is a file
891  * rather than a directory.
892  */
893 static void parsename(char *name, Elemlist * e)
894 {
895         char *slash;
896
897         kstrdup(&e->name, name);
898         name = e->name;
899         e->ARRAY_SIZEs = 0;
900         e->elems = NULL;
901         e->off = kzmalloc(sizeof(int), 0);
902         e->off[0] = skipslash(name) - name;
903         for (;;) {
904                 name = skipslash(name);
905                 if (*name == '\0') {
906                         e->mustbedir = 1;
907                         break;
908                 }
909                 growparse(e);
910
911                 e->elems[e->ARRAY_SIZEs++] = name;
912                 /* we may want to do this again some day
913                    slash = utfrune(name, '/');
914                  */
915                 slash = strchr(name, '/');
916                 if (slash == NULL) {
917                         e->off[e->ARRAY_SIZEs] = name + strlen(name) - e->name;
918                         e->mustbedir = 0;
919                         break;
920                 }
921                 e->off[e->ARRAY_SIZEs] = slash - e->name;
922                 *slash++ = '\0';
923                 name = slash;
924         }
925 }
926
927 void *memrchr(void *va, int c, long n)
928 {
929         uint8_t *a, *e;
930
931         a = va;
932         for (e = a + n - 1; e > a; e--)
933                 if (*e == c)
934                         return e;
935         return NULL;
936 }
937
938 /*
939  * Turn a name into a channel.
940  * &name[0] is known to be a valid address.  It may be a kernel address.
941  *
942  * Opening with amode Aopen, Acreate, or Aremove guarantees
943  * that the result will be the only reference to that particular fid.
944  * This is necessary since we might pass the result to
945  * devtab[].remove().
946  *
947  * Opening Atodir, Amount, or Aaccess does not guarantee this.
948  *
949  * Opening Aaccess can, under certain conditions, return a
950  * correct Chan* but with an incorrect struct cname attached.
951  * Since the functions that open Aaccess (sysstat, syswstat, sys_stat)
952  * do not use the struct cname*, this avoids an unnecessary clone.
953  */
954 struct chan *namec(char *aname, int amode, int omode, uint32_t perm)
955 {
956         ERRSTACK(2);
957         int n, prefix, len, t, nomount, npath;
958         struct chan *c, *cnew;
959         struct cname *cname;
960         Elemlist e;
961         struct mhead *m;
962         char tmperrbuf[ERRMAX];
963         int saved_errno;
964         char *name;
965         // Rune r;
966
967         name = aname;
968         if (name[0] == '\0')
969                 error("empty file name");
970         validname(name, 1);
971
972         /*
973          * Find the starting off point (the current slash, the root of
974          * a device tree, or the current dot) as well as the name to
975          * evaluate starting there.
976          */
977         nomount = 0;
978         switch (name[0]) {
979                 case '/':
980                         c = current->slash;
981                         if (!c)
982                                 panic("no slash!");
983                         chan_incref(c);
984                         break;
985
986                 case '#':
987                         nomount = 1;
988                         get_cur_genbuf()[0] = '\0';
989                         n = 0;
990                         while (*name != '\0' && (*name != '/' || n < 2)) {
991                                 if (n >= sizeof(get_cur_genbuf()) - 1)
992                                         error(Efilename);
993                                 get_cur_genbuf()[n++] = *name++;
994                         }
995                         get_cur_genbuf()[n] = '\0';
996 #if 0
997                         n = chartorune(&r, get_cur_genbuf() + 1) + 1;
998                         if (r == 'M')
999                                 error(Enoattach);
1000 #endif
1001                         if (get_cur_genbuf()[1] == 'M')
1002                                 error(Enoattach);
1003                         /*
1004                          *  the nodevs exceptions are
1005                          *  |  it only gives access to pipes you create
1006                          *  e  this process's environment
1007                          *  s  private file2chan creation space
1008                          *  D private secure sockets name space
1009                          *  a private TLS name space
1010                          */
1011                         if (current->pgrp->nodevs &&
1012                                 //          (utfrune("|esDa", r) == NULL
1013                                 ((strchr("|esDa", get_cur_genbuf()[1]) == NULL)
1014                                  || (get_cur_genbuf()[1] == 's' // || r == 's'
1015                                          && get_cur_genbuf()[n] != '\0')))
1016                                 error(Enoattach);
1017                         t = devno( /*r */ get_cur_genbuf()[1], 1);
1018                         if (t == -1)
1019                                 error(Ebadsharp);
1020                         /* genbuf + 2: skips the # and X, just the spec left */
1021                         c = devtab[t].attach(get_cur_genbuf() + 2);
1022                         break;
1023
1024                 default:
1025                         c = current->dot;
1026                         if (!c)
1027                                 panic("no dot!");
1028                         chan_incref(c);
1029                         break;
1030         }
1031         prefix = name - aname;
1032
1033         e.name = NULL;
1034         e.elems = NULL;
1035         e.off = NULL;
1036         e.ARRAY_SIZEs = 0;
1037         if (waserror()) {
1038                 cclose(c);
1039                 kfree(e.name);
1040                 kfree(e.elems);
1041                 kfree(e.off);
1042 //dumpmount();
1043                 nexterror();
1044         }
1045
1046         /*
1047          * Build a list of elements in the path.
1048          */
1049         parsename(name, &e);
1050
1051         /*
1052          * On create, ....
1053          */
1054         if (amode == Acreate) {
1055                 /* perm must have DMDIR if last element is / or /. */
1056                 if (e.mustbedir && !(perm & DMDIR)) {
1057                         npath = e.ARRAY_SIZEs;
1058                         strncpy(tmperrbuf, "create without DMDIR", sizeof(tmperrbuf));
1059                         goto NameError;
1060                 }
1061
1062                 /* don't try to walk the last path element just yet. */
1063                 if (e.ARRAY_SIZEs == 0)
1064                         error(Eexist);
1065                 e.ARRAY_SIZEs--;
1066         }
1067
1068         if (walk(&c, e.elems, e.ARRAY_SIZEs, nomount, &npath) < 0) {
1069                 if (npath < 0 || npath > e.ARRAY_SIZEs) {
1070                         printd("namec %s walk error npath=%d\n", aname, npath);
1071                         error("walk failed");
1072                 }
1073 NameError:
1074                 if (current_errstr()[0]) {
1075                         /* errstr is set, we'll just stick with it and error out */
1076                         longjmp(&get_cur_errbuf()->jmpbuf, 1);
1077                 } else {
1078                         error("Name to chan lookup failed");
1079                 }
1080                 /* brho: skipping the namec custom error string business, since it hides
1081                  * the underlying failure.  implement this if you want the old stuff. */
1082 #if 0
1083                 strncpy(tmperrbuf, current->errstr, sizeof(tmperrbuf));
1084                 len = prefix + e.off[npath];
1085                 if (len < ERRMAX / 3 || (name = memrchr(aname, '/', len)) == NULL
1086                         || name == aname)
1087                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "%.*s", len,
1088                                          aname);
1089                 else
1090                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "...%.*s",
1091                                          (int)(len - (name - aname)), name);
1092                 snprintf(current->errstr, ERRMAX, "%#q %s", get_cur_genbuf(),
1093                                  tmperrbuf);
1094 #endif
1095         }
1096
1097         if (e.mustbedir && !(c->qid.type & QTDIR)) {
1098                 npath = e.ARRAY_SIZEs;
1099                 strncpy(tmperrbuf, "not a directory", sizeof(tmperrbuf));
1100                 goto NameError;
1101         }
1102
1103         if (amode == Aopen && (omode & 3) == OEXEC && (c->qid.type & QTDIR)) {
1104                 npath = e.ARRAY_SIZEs;
1105                 error("cannot exec directory");
1106         }
1107
1108         switch (amode) {
1109                 case Aaccess:
1110                         if (!nomount)
1111                                 domount(&c, NULL);
1112                         break;
1113
1114                 case Abind:
1115                         m = NULL;
1116                         if (!nomount)
1117                                 domount(&c, &m);
1118                         if (c->umh != NULL)
1119                                 putmhead(c->umh);
1120                         c->umh = m;
1121                         break;
1122
1123                 case Aremove:
1124                 case Aopen:
1125 Open:
1126                         /* save the name; domount might change c */
1127                         cname = c->name;
1128                         kref_get(&cname->ref, 1);
1129                         m = NULL;
1130                         if (!nomount)
1131                                 domount(&c, &m);
1132
1133                         /* our own copy to open or remove */
1134                         c = cunique(c);
1135
1136                         /* now it's our copy anyway, we can put the name back */
1137                         cnameclose(c->name);
1138                         c->name = cname;
1139
1140                         switch (amode) {
1141                                 case Aremove:
1142                                         putmhead(m);
1143                                         break;
1144
1145                                 case Aopen:
1146                                 case Acreate:
1147                                         if (c->umh != NULL) {
1148                                                 printd("cunique umh\n");
1149                                                 putmhead(c->umh);
1150                                                 c->umh = NULL;
1151                                         }
1152
1153                                         /* only save the mount head if it's a multiple element union */
1154                                         if (m && m->mount && m->mount->next)
1155                                                 c->umh = m;
1156                                         else
1157                                                 putmhead(m);
1158
1159                                         if (omode == OEXEC)
1160                                                 c->flag &= ~CCACHE;
1161
1162                                         c = devtab[c->type].open(c, omode & ~OCEXEC);
1163                                         /* here is where convert omode/vfs flags to c->flags */
1164                                         if (omode & O_APPEND)
1165                                                 c->flag |= CAPPEND;
1166                                         // CEXEC should be in the FD, not the chan, right?
1167                                         if (omode & OCEXEC)
1168                                                 c->flag |= CCEXEC;
1169                                         if (omode & ORCLOSE)
1170                                                 c->flag |= CRCLOSE;
1171                                         break;
1172                         }
1173                         break;
1174
1175                 case Atodir:
1176                         /*
1177                          * Directories (e.g. for cd) are left before the mount po int unused_int,
1178                          * so one may mount on / or . and see the effect.
1179                          */
1180                         if (!(c->qid.type & QTDIR))
1181                                 error(Enotdir);
1182                         break;
1183
1184                 case Amount:
1185                         /*
1186                          * When mounting on an already mounted upon directory,
1187                          * one wants subsequent mounts to be attached to the
1188                          * original directory, not the replacement.  Don't domount.
1189                          */
1190                         break;
1191
1192                 case Acreate:
1193                         /*
1194                          * We've already walked all but the last element.
1195                          * If the last exists, try to open it OTRUNC.
1196                          * If omode&OEXCL is set, just give up.
1197                          */
1198                         e.ARRAY_SIZEs++;
1199                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, nomount, NULL) == 0) {
1200                                 if (omode & OEXCL)
1201                                         error(Eexist);
1202                                 omode |= OTRUNC;
1203                                 goto Open;
1204                         }
1205
1206                         /*
1207                          * The semantics of the create(2) system call are that if the
1208                          * file exists and can be written, it is to be opened with truncation.
1209                          * On the other hand, the create(5) message fails if the file exists.
1210                          * If we get two create(2) calls happening simultaneously, 
1211                          * they might both get here and send create(5) messages, but only 
1212                          * one of the messages will succeed.  To provide the expected create(2)
1213                          * semantics, the call with the failed message needs to try the above
1214                          * walk again, opening for truncation.  This correctly solves the 
1215                          * create/create race, in the sense that any observable outcome can
1216                          * be explained as one happening before the other.
1217                          * The create/create race is quite common.  For example, it happens
1218                          * when two rc subshells simultaneously update the same
1219                          * environment variable.
1220                          *
1221                          * The implementation still admits a create/create/remove race:
1222                          * (A) walk to file, fails
1223                          * (B) walk to file, fails
1224                          * (A) create file, succeeds, returns 
1225                          * (B) create file, fails
1226                          * (A) remove file, succeeds, returns
1227                          * (B) walk to file, return failure.
1228                          *
1229                          * This is hardly as common as the create/create race, and is really
1230                          * not too much worse than what might happen if (B) got a hold of a
1231                          * file descriptor and then the file was removed -- either way (B) can't do
1232                          * anything with the result of the create call.  So we don't care about this race.
1233                          *
1234                          * Applications that care about more fine-grained decision of the races
1235                          * can use the OEXCL flag to get at the underlying create(5) semantics;
1236                          * by default we provide the common case.
1237                          *
1238                          * We need to stay behind the mount point in case we
1239                          * need to do the first walk again (should the create fail).
1240                          *
1241                          * We also need to cross the mount point and find the directory
1242                          * in the union in which we should be creating.
1243                          *
1244                          * The channel staying behind is c, the one moving forward is cnew.
1245                          */
1246                         m = NULL;
1247                         cnew = NULL;    /* is this assignment necessary? */
1248                         /* discard error */
1249                         if (!waserror()) {      /* try create */
1250                                 if (!nomount && findmount(&cnew, &m, c->type, c->dev, c->qid))
1251                                         cnew = createdir(cnew, m);
1252                                 else {
1253                                         cnew = c;
1254                                         chan_incref(cnew);
1255                                 }
1256
1257                                 /*
1258                                  * We need our own copy of the Chan because we're
1259                                  * about to send a create, which will move it.  Once we have
1260                                  * our own copy, we can fix the name, which might be wrong
1261                                  * if findmount gave us a new Chan.
1262                                  */
1263                                 cnew = cunique(cnew);
1264                                 cnameclose(cnew->name);
1265                                 cnew->name = c->name;
1266                                 kref_get(&cnew->name->ref, 1);
1267
1268                                 devtab[cnew->type].create(cnew, e.elems[e.ARRAY_SIZEs - 1],
1269                                                                                   omode & ~(OEXCL | OCEXEC), perm);
1270                                 poperror();
1271                                 if (omode & O_APPEND)
1272                                         cnew->flag |= CAPPEND;
1273                                 if (omode & OCEXEC)
1274                                         cnew->flag |= CCEXEC;
1275                                 if (omode & ORCLOSE)
1276                                         cnew->flag |= CRCLOSE;
1277                                 if (m)
1278                                         putmhead(m);
1279                                 cclose(c);
1280                                 c = cnew;
1281                                 c->name = addelem(c->name, e.elems[e.ARRAY_SIZEs - 1]);
1282                                 break;
1283                         }
1284
1285                         /* create failed */
1286                         cclose(cnew);
1287                         if (m)
1288                                 putmhead(m);
1289                         if (omode & OEXCL)
1290                                 nexterror();    /* safe since we're in a waserror() */
1291                         poperror();     /* matching the if(!waserror) */
1292
1293                         /* save error, so walk doesn't clobber our existing errstr */
1294                         strncpy(tmperrbuf, current_errstr(), MAX_ERRSTR_LEN);
1295                         saved_errno = get_errno();
1296                         /* note: we depend that walk does not error */
1297                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, nomount, NULL) < 0) {
1298                                 set_errno(saved_errno);
1299                                 error(tmperrbuf);       /* report the error we had originally */
1300                         }
1301                         strncpy(current_errstr(), tmperrbuf, MAX_ERRSTR_LEN);
1302                         omode |= OTRUNC;
1303                         goto Open;
1304
1305                 default:
1306                         panic("unknown namec access %d\n", amode);
1307         }
1308
1309         poperror();
1310
1311         if (e.ARRAY_SIZEs > 0)
1312                 strncpy(get_cur_genbuf(), e.elems[e.ARRAY_SIZEs - 1], GENBUF_SZ);
1313         else
1314                 strncpy(get_cur_genbuf(), ".", GENBUF_SZ);
1315
1316         kfree(e.name);
1317         kfree(e.elems);
1318         kfree(e.off);
1319
1320         return c;
1321 }
1322
1323 /*
1324  * name is valid. skip leading / and ./ as much as possible
1325  */
1326 char *skipslash(char *name)
1327 {
1328         while (name[0] == '/'
1329                    || (name[0] == '.' && (name[1] == 0 || name[1] == '/')))
1330                 name++;
1331         return name;
1332 }
1333
1334 char isfrog[256] = {
1335          /*NUL*/ 1, 1, 1, 1, 1, 1, 1, 1,
1336          /*BKS*/ 1, 1, 1, 1, 1, 1, 1, 1,
1337          /*DLE*/ 1, 1, 1, 1, 1, 1, 1, 1,
1338          /*CAN*/ 1, 1, 1, 1, 1, 1, 1, 1,
1339         ['/'] 1,
1340         [0x7f] 1,
1341 };
1342
1343 /*
1344  * Check that the name
1345  *  a) is in valid memory.
1346  *  b) is shorter than 2^16 bytes, so it can fit in a 9P string field.
1347  *  c) contains no frogs.
1348  * The first byte is known to be addressible by the requester, so the
1349  * routine works for kernel and user memory both.
1350  * The parameter slashok flags whether a slash character is an error
1351  * or a valid character.
1352  */
1353 void validname(char *aname, int slashok)
1354 {
1355         char *ename, *name;
1356         int c;
1357
1358         name = aname;
1359         ename = memchr(name, 0, (1 << 16));
1360
1361         if (ename == NULL || ename - name >= (1 << 16))
1362                 error("name too long");
1363
1364         while (*name) {
1365                 /* all characters above '~' are ok */
1366                 c = *(uint8_t *) name;
1367 #if 0
1368                 if (c >= Runeself)
1369                         name += chartorune(&r, name);
1370 #endif
1371                 if (c >= 0x7f) {
1372                         error("Akaros doesn't do UTF-8");
1373                 } else {
1374                         if (isfrog[c])
1375                                 if (!slashok || c != '/') {
1376                                         error("%s: %q", Ebadchar, aname);
1377                                 }
1378                         name++;
1379                 }
1380         }
1381 }
1382
1383 void isdir(struct chan *c)
1384 {
1385         if (c->qid.type & QTDIR)
1386                 return;
1387         error(Enotdir);
1388 }
1389
1390 /*
1391  * This is necessary because there are many
1392  * pointers to the top of a given mount list:
1393  *
1394  *      - the mhead in the namespace hash table
1395  *      - the mhead in chans returned from findmount:
1396  *        used in namec and then by unionread.
1397  *      - the mhead in chans returned from createdir:
1398  *        used in the open/create race protect, which is gone.
1399  *
1400  * The RWlock in the Mhead protects the mount list it contains.
1401  * The mount list is deleted when we cunmount.
1402  * The RWlock ensures that nothing is using the mount list at that time.
1403  *
1404  * It is okay to replace c->mh with whatever you want as 
1405  * long as you are sure you have a unique reference to it.
1406  *
1407  * This comment might belong somewhere else.
1408  */
1409 void putmhead(struct mhead *m)
1410 {
1411         if (m)
1412                 kref_put(&m->ref);
1413 }