Fix up sys*stat
[akaros.git] / kern / src / ns / chan.c
1 // INFERNO
2 #include <vfs.h>
3 #include <kfs.h>
4 #include <slab.h>
5 #include <kmalloc.h>
6 #include <kref.h>
7 #include <string.h>
8 #include <stdio.h>
9 #include <assert.h>
10 #include <error.h>
11 #include <cpio.h>
12 #include <pmap.h>
13 #include <smp.h>
14 #include <syscall.h>
15
16 char *channame(struct chan *c)
17 {       /* DEBUGGING */
18         if (c == NULL)
19                 return "<NULL chan>";
20         if (c->name == NULL)
21                 return "<NULL name>";
22         if (c->name->s == NULL)
23                 return "<NULL name.s>";
24         return c->name->s;
25 }
26
27 enum {
28         CNAMESLOP = 20
29 };
30
31 struct {
32         spinlock_t lock;
33         int fid;
34         struct chan *free;
35         struct chan *list;
36 } chanalloc;
37
38 typedef struct Elemlist Elemlist;
39
40 struct Elemlist {
41         char *name;                                     /* copy of name, so '/' can be overwritten */
42         int ARRAY_SIZEs;
43         char **elems;
44         int *off;
45         int mustbedir;
46 };
47
48 #define SEP(c) ((c) == 0 || (c) == '/')
49 void cleancname(struct cname *);
50
51 int isdotdot(char *p)
52 {
53         return p[0] == '.' && p[1] == '.' && p[2] == '\0';
54 }
55
56 int emptystr(char *s)
57 {
58         if (s == NULL)
59                 return 1;
60         if (s[0] == '\0')
61                 return 1;
62         return 0;
63 }
64
65 /*
66  * Atomically replace *p with copy of s
67  */
68 void kstrdup(char **p, char *s)
69 {
70         int n;
71         char *t, *prev;
72
73         n = strlen(s) + 1;
74         /* if it's a user, we can wait for memory; if not, something's very wrong */
75         if (current) {
76                 t = kzmalloc(n, 0);
77         } else {
78                 t = kzmalloc(n, 0);
79                 if (t == NULL)
80                         panic("kstrdup: no memory");
81         }
82         memmove(t, s, n);
83         prev = *p;
84         *p = t;
85         kfree(prev);
86 }
87
88 void chandevreset(void)
89 {
90         int i;
91
92         for (i = 0; &devtab[i] < __devtabend; i++)
93                 devtab[i].reset();
94 }
95
96 void chandevinit(void)
97 {
98         int i;
99
100         for (i = 0; &devtab[i] < __devtabend; i++)
101                 devtab[i].init();
102 }
103
104 void chandevshutdown(void)
105 {
106         int i;
107
108         /* shutdown in reverse order */
109         for (i = 0; &devtab[i] < __devtabend; i++) ;
110         for (i--; i >= 0; i--)
111                 devtab[i].shutdown();
112 }
113
114 static void chan_release(struct kref *kref)
115 {
116         struct chan *c = container_of(kref, struct chan, ref);
117         ERRSTACK(1);
118         /* this style discards the error from close().  picture it as
119          * if (waserror()) { } else { close(); } chanfree_no_matter_what();  */
120         if (!waserror()) {
121                 printd("releasing chan %p, type %d\n", c, c->type);
122                 /* -1 means there is no dev yet.  wants a noop for close() */
123                 if (c->type != -1)
124                         devtab[c->type].close(c);
125         }
126         /* need to poperror regardless of whether we error'd or not */
127         poperror();
128         /* and chan free no matter what */
129         chanfree(c);
130 }
131
132 struct chan *newchan(void)
133 {
134         struct chan *c;
135
136         spin_lock(&(&chanalloc)->lock);
137         c = chanalloc.free;
138         if (c != 0)
139                 chanalloc.free = c->next;
140         spin_unlock(&(&chanalloc)->lock);
141
142         if (c == NULL) {
143                 c = kzmalloc(sizeof(struct chan), 0);
144                 spin_lock(&(&chanalloc)->lock);
145                 c->fid = ++chanalloc.fid;
146                 c->link = chanalloc.list;
147                 chanalloc.list = c;
148                 spin_unlock(&(&chanalloc)->lock);
149                 spinlock_init(&c->lock);
150                 qlock_init(&c->umqlock);
151         }
152
153         /* if you get an error before associating with a dev, cclose skips calling
154          * the dev's close */
155         c->type = -1;
156         c->flag = 0;
157         kref_init(&c->ref, chan_release, 1);
158         c->dev = 0;
159         c->offset = 0;
160         c->iounit = 0;
161         c->umh = 0;
162         c->uri = 0;
163         c->dri = 0;
164         c->aux = 0;
165         c->mchan = 0;
166         c->mcp = 0;
167         c->mux = 0;
168         c->mqid.path = 0;
169         c->mqid.vers = 0;
170         c->mqid.type = 0;
171         c->name = 0;
172         return c;
173 }
174
175 static void __cname_release(struct kref *kref)
176 {
177         struct cname *n = container_of(kref, struct cname, ref);
178         kfree(n->s);
179         kfree(n);
180 }
181
182 struct cname *newcname(char *s)
183 {
184         struct cname *n;
185         int i;
186
187         n = kzmalloc(sizeof(*n), 0);
188         i = strlen(s);
189         n->len = i;
190         n->alen = i + CNAMESLOP;
191         n->s = kzmalloc(n->alen, 0);
192         memmove(n->s, s, i + 1);
193         kref_init(&n->ref, __cname_release, 1);
194         return n;
195 }
196
197 void cnameclose(struct cname *n)
198 {
199         if (n == NULL)
200                 return;
201         kref_put(&n->ref);
202 }
203
204 struct cname *addelem(struct cname *n, char *s)
205 {
206         int i, a;
207         char *t;
208         struct cname *new;
209
210         if (s[0] == '.' && s[1] == '\0')
211                 return n;
212
213         if (kref_refcnt(&n->ref) > 1) {
214                 /* copy on write */
215                 new = newcname(n->s);
216                 cnameclose(n);
217                 n = new;
218         }
219
220         i = strlen(s);
221         if (n->len + 1 + i + 1 > n->alen) {
222                 a = n->len + 1 + i + 1 + CNAMESLOP;
223                 t = kzmalloc(a, 0);
224                 memmove(t, n->s, n->len + 1);
225                 kfree(n->s);
226                 n->s = t;
227                 n->alen = a;
228         }
229         if (n->len > 0 && n->s[n->len - 1] != '/' && s[0] != '/')       /* don't insert extra slash if one is present */
230                 n->s[n->len++] = '/';
231         memmove(n->s + n->len, s, i + 1);
232         n->len += i;
233         if (isdotdot(s))
234                 cleancname(n);
235         return n;
236 }
237
238 void chanfree(struct chan *c)
239 {
240         c->flag = CFREE;
241
242         if (c->umh != NULL) {
243                 putmhead(c->umh);
244                 c->umh = NULL;
245         }
246         if (c->umc != NULL) {
247                 cclose(c->umc);
248                 c->umc = NULL;
249         }
250         if (c->mux != NULL) {
251                 //
252                 muxclose(c->mux);
253                 c->mux = NULL;
254         }
255         if (c->mchan != NULL) {
256                 cclose(c->mchan);
257                 c->mchan = NULL;
258         }
259
260         cnameclose(c->name);
261
262         spin_lock(&(&chanalloc)->lock);
263         c->next = chanalloc.free;
264         chanalloc.free = c;
265         spin_unlock(&(&chanalloc)->lock);
266 }
267
268 void cclose(struct chan *c)
269 {
270         if (c == 0)
271                 return;
272
273         if (c->flag & CFREE)
274                 panic("cclose %p", getcallerpc(&c));
275
276         kref_put(&c->ref);
277 }
278
279 /*
280  * Make sure we have the only copy of c.  (Copy on write.)
281  */
282 struct chan *cunique(struct chan *c)
283 {
284         struct chan *nc;
285
286         if (kref_refcnt(&c->ref) != 1) {
287                 nc = cclone(c);
288                 cclose(c);
289                 c = nc;
290         }
291
292         return c;
293 }
294
295 int eqqid(struct qid a, struct qid b)
296 {
297         return a.path == b.path && a.vers == b.vers;
298 }
299
300 int eqchan(struct chan *a, struct chan *b, int pathonly)
301 {
302         if (a->qid.path != b->qid.path)
303                 return 0;
304         if (!pathonly && a->qid.vers != b->qid.vers)
305                 return 0;
306         if (a->type != b->type)
307                 return 0;
308         if (a->dev != b->dev)
309                 return 0;
310         return 1;
311 }
312
313 int eqchantdqid(struct chan *a, int type, int dev, struct qid qid, int pathonly)
314 {
315         if (a->qid.path != qid.path)
316                 return 0;
317         if (!pathonly && a->qid.vers != qid.vers)
318                 return 0;
319         if (a->type != type)
320                 return 0;
321         if (a->dev != dev)
322                 return 0;
323         return 1;
324 }
325
326 static void mh_release(struct kref *kref)
327 {
328         struct mhead *mh = container_of(kref, struct mhead, ref);
329         mh->mount = (struct mount *)0xCafeBeef;
330         kfree(mh);
331 }
332
333 struct mhead *newmhead(struct chan *from)
334 {
335         struct mhead *mh;
336
337         mh = kzmalloc(sizeof(struct mhead), 0);
338         kref_init(&mh->ref, mh_release, 1);
339         mh->from = from;
340         kref_get(&from->ref, 1);
341
342 /*
343         n = from->name->len;
344         if(n >= sizeof(mh->fromname))
345                 n = sizeof(mh->fromname)-1;
346         memmove(mh->fromname, from->name->s, n);
347         mh->fromname[n] = 0;
348 */
349         return mh;
350 }
351
352 int cmount(struct chan *new, struct chan *old, int flag, char *spec)
353 {
354         ERRSTACK(1);
355         struct pgrp *pg;
356         int order, flg;
357         struct mhead *m, **l, *mh;
358         struct mount *nm, *f, *um, **h;
359
360         if (QTDIR & (old->qid.type ^ new->qid.type))
361                 error(Emount);
362
363         if (old->umh)
364                 printd("cmount old extra umh\n");
365
366         order = flag & MORDER;
367
368         if ((old->qid.type & QTDIR) == 0 && order != MREPL)
369                 error(Emount);
370
371         mh = new->umh;
372
373         /*
374          * Not allowed to bind when the old directory
375          * is itself a union.  (Maybe it should be allowed, but I don't see
376          * what the semantics would be.)
377          *
378          * We need to check mh->mount->next to tell unions apart from
379          * simple mount points, so that things like
380          *  mount -c fd /root
381          *  bind -c /root /
382          * work.  The check of mount->mflag catches things like
383          *  mount fd /root
384          *  bind -c /root /
385          * 
386          * This is far more complicated than it should be, but I don't
387          * see an easier way at the moment.     -rsc
388          */
389         if ((flag & MCREATE) && mh && mh->mount
390                 && (mh->mount->next || !(mh->mount->mflag & MCREATE)))
391                 error(Emount);
392
393         pg = current->pgrp;
394         wlock(&pg->ns);
395
396         l = &MOUNTH(pg, old->qid);
397         for (m = *l; m; m = m->hash) {
398                 if (eqchan(m->from, old, 1))
399                         break;
400                 l = &m->hash;
401         }
402
403         if (m == NULL) {
404                 /*
405                  *  nothing mounted here yet.  create a mount
406                  *  head and add to the hash table.
407                  */
408                 m = newmhead(old);
409                 *l = m;
410
411                 /*
412                  *  if this is a union mount, add the old
413                  *  node to the mount chain.
414                  */
415                 if (order != MREPL)
416                         m->mount = newmount(m, old, 0, 0);
417         }
418         wlock(&m->lock);
419         if (waserror()) {
420                 wunlock(&m->lock);
421                 nexterror();
422         }
423         wunlock(&pg->ns);
424
425         nm = newmount(m, new, flag, spec);
426         if (mh != NULL && mh->mount != NULL) {
427                 /*
428                  *  copy a union when binding it onto a directory
429                  */
430                 flg = order;
431                 if (order == MREPL)
432                         flg = MAFTER;
433                 h = &nm->next;
434                 um = mh->mount;
435                 for (um = um->next; um; um = um->next) {
436                         f = newmount(m, um->to, flg, um->spec);
437                         *h = f;
438                         h = &f->next;
439                 }
440         }
441
442         if (m->mount && order == MREPL) {
443                 mountfree(m->mount);
444                 m->mount = 0;
445         }
446
447         if (flag & MCREATE)
448                 nm->mflag |= MCREATE;
449
450         if (m->mount && order == MAFTER) {
451                 for (f = m->mount; f->next; f = f->next) ;
452                 f->next = nm;
453         } else {
454                 for (f = nm; f->next; f = f->next) ;
455                 f->next = m->mount;
456                 m->mount = nm;
457         }
458
459         wunlock(&m->lock);
460         poperror();
461         return nm->mountid;
462 }
463
464 void cunmount(struct chan *mnt, struct chan *mounted)
465 {
466         struct pgrp *pg;
467         struct mhead *m, **l;
468         struct mount *f, **p;
469
470         if (mnt->umh)   /* should not happen */
471                 printd("cunmount newp extra umh %p has %p\n", mnt, mnt->umh);
472
473         /*
474          * It _can_ happen that mounted->umh is non-NULL, 
475          * because mounted is the result of namec(Aopen)
476          * (see sysfile.c:/^sysunmount).
477          * If we open a union directory, it will have a umh.
478          * Although surprising, this is okay, since the
479          * cclose will take care of freeing the umh.
480          */
481
482         pg = current->pgrp;
483         wlock(&pg->ns);
484
485         l = &MOUNTH(pg, mnt->qid);
486         for (m = *l; m; m = m->hash) {
487                 if (eqchan(m->from, mnt, 1))
488                         break;
489                 l = &m->hash;
490         }
491
492         if (m == 0) {
493                 wunlock(&pg->ns);
494                 error(Eunmount);
495         }
496
497         wlock(&m->lock);
498         if (mounted == 0) {
499                 *l = m->hash;
500                 wunlock(&pg->ns);
501                 mountfree(m->mount);
502                 m->mount = NULL;
503                 cclose(m->from);
504                 wunlock(&m->lock);
505                 putmhead(m);
506                 return;
507         }
508
509         p = &m->mount;
510         for (f = *p; f; f = f->next) {
511                 /* BUG: Needs to be 2 pass */
512                 if (eqchan(f->to, mounted, 1) ||
513                         (f->to->mchan && eqchan(f->to->mchan, mounted, 1))) {
514                         *p = f->next;
515                         f->next = 0;
516                         mountfree(f);
517                         if (m->mount == NULL) {
518                                 *l = m->hash;
519                                 cclose(m->from);
520                                 wunlock(&m->lock);
521                                 wunlock(&pg->ns);
522                                 putmhead(m);
523                                 return;
524                         }
525                         wunlock(&m->lock);
526                         wunlock(&pg->ns);
527                         return;
528                 }
529                 p = &f->next;
530         }
531         wunlock(&m->lock);
532         wunlock(&pg->ns);
533         error(Eunion);
534 }
535
536 struct chan *cclone(struct chan *c)
537 {
538         struct chan *nc;
539         struct walkqid *wq;
540
541         wq = devtab[c->type].walk(c, NULL, NULL, 0);
542         if (wq == NULL)
543                 error("clone failed");
544         nc = wq->clone;
545         kfree(wq);
546         nc->name = c->name;
547         if (c->name)
548                 kref_get(&c->name->ref, 1);
549         return nc;
550 }
551
552 int
553 findmount(struct chan **cp,
554                   struct mhead **mp, int type, int dev, struct qid qid)
555 {
556         struct pgrp *pg;
557         struct mhead *m;
558
559         pg = current->pgrp;
560         rlock(&pg->ns);
561         for (m = MOUNTH(pg, qid); m; m = m->hash) {
562                 rlock(&m->lock);
563                 if (m->from == NULL) {
564                         printd("m %p m->from 0\n", m);
565                         runlock(&m->lock);
566                         continue;
567                 }
568                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
569                         runlock(&pg->ns);
570                         if (mp != NULL) {
571                                 kref_get(&m->ref, 1);
572                                 if (*mp != NULL)
573                                         putmhead(*mp);
574                                 *mp = m;
575                         }
576                         if (*cp != NULL)
577                                 cclose(*cp);
578                         kref_get(&m->mount->to->ref, 1);
579                         *cp = m->mount->to;
580                         runlock(&m->lock);
581                         return 1;
582                 }
583                 runlock(&m->lock);
584         }
585
586         runlock(&pg->ns);
587         return 0;
588 }
589
590 int domount(struct chan **cp, struct mhead **mp)
591 {
592         return findmount(cp, mp, (*cp)->type, (*cp)->dev, (*cp)->qid);
593 }
594
595 struct chan *undomount(struct chan *c, struct cname *name)
596 {
597         ERRSTACK(1);
598         struct chan *nc;
599         struct pgrp *pg;
600         struct mount *t;
601         struct mhead **h, **he, *f;
602
603         pg = current->pgrp;
604         rlock(&pg->ns);
605         if (waserror()) {
606                 runlock(&pg->ns);
607                 nexterror();
608         }
609
610         he = &pg->mnthash[MNTHASH];
611         for (h = pg->mnthash; h < he; h++) {
612                 for (f = *h; f; f = f->hash) {
613                         if (strcmp(f->from->name->s, name->s) != 0)
614                                 continue;
615                         for (t = f->mount; t; t = t->next) {
616                                 if (eqchan(c, t->to, 1)) {
617                                         /*
618                                          * We want to come out on the left hand side of the mount
619                                          * point using the element of the union that we entered on.
620                                          * To do this, find the element that has a from name of
621                                          * c->name->s.
622                                          */
623                                         if (strcmp(t->head->from->name->s, name->s) != 0)
624                                                 continue;
625                                         nc = t->head->from;
626                                         kref_get(&nc->ref, 1);
627                                         cclose(c);
628                                         c = nc;
629                                         break;
630                                 }
631                         }
632                 }
633         }
634         poperror();
635         runlock(&pg->ns);
636         return c;
637 }
638
639 /*
640  * Either walks all the way or not at all.  No partial results in *cp.
641  * *nerror is the number of names to display in an error message.
642  */
643 static char Edoesnotexist[] = "does not exist";
644 int walk(struct chan **cp, char **names, int nnames, int nomount, int *nerror)
645 {
646         int dev, dotdot, i, n, nhave, ntry, type;
647         struct chan *c, *nc;
648         struct cname *cname;
649         struct mount *f;
650         struct mhead *mh, *nmh;
651         struct walkqid *wq;
652
653         c = *cp;
654         kref_get(&c->ref, 1);
655         cname = c->name;
656         kref_get(&cname->ref, 1);
657         mh = NULL;
658
659         /*
660          * While we haven't gotten all the way down the path:
661          *    1. step through a mount po int unused_int, if any
662          *    2. send a walk request for initial dotdot or initial prefix without dotdot
663          *    3. move to the first mountpoint along the way.
664          *    4. repeat.
665          *
666          * An invariant is that each time through the loop, c is on the undomount
667          * side of the mount po int unused_int, and c's name is cname.
668          */
669         for (nhave = 0; nhave < nnames; nhave += n) {
670                 if ((c->qid.type & QTDIR) == 0) {
671                         if (nerror)
672                                 *nerror = nhave;
673                         cnameclose(cname);
674                         cclose(c);
675                         set_errstr(Enotdir);
676                         if (mh != NULL)
677                                 putmhead(mh);
678                         return -1;
679                 }
680                 ntry = nnames - nhave;
681                 if (ntry > MAXWELEM)
682                         ntry = MAXWELEM;
683                 dotdot = 0;
684                 for (i = 0; i < ntry; i++) {
685                         if (isdotdot(names[nhave + i])) {
686                                 if (i == 0) {
687                                         dotdot = 1;
688                                         ntry = 1;
689                                 } else
690                                         ntry = i;
691                                 break;
692                         }
693                 }
694
695                 if (!dotdot && !nomount)
696                         domount(&c, &mh);
697
698                 type = c->type;
699                 dev = c->dev;
700
701                 if ((wq = devtab[type].walk(c, NULL, names + nhave, ntry)) == NULL) {
702                         /* try a union mount, if any */
703                         if (mh && !nomount) {
704                                 /*
705                                  * mh->mount == c, so start at mh->mount->next
706                                  */
707                                 rlock(&mh->lock);
708                                 for (f = mh->mount->next; f; f = f->next)
709                                         if ((wq =
710                                                  devtab[f->to->type].walk(f->to, NULL, names + nhave,
711                                                                                                   ntry)) != NULL)
712                                                 break;
713                                 runlock(&mh->lock);
714                                 if (f != NULL) {
715                                         type = f->to->type;
716                                         dev = f->to->dev;
717                                 }
718                         }
719                         if (wq == NULL) {
720                                 cclose(c);
721                                 cnameclose(cname);
722                                 if (nerror)
723                                         *nerror = nhave + 1;
724                                 if (mh != NULL)
725                                         putmhead(mh);
726                                 return -1;
727                         }
728                 }
729
730                 nmh = NULL;
731                 if (dotdot) {
732                         assert(wq->nqid == 1);
733                         assert(wq->clone != NULL);
734
735                         cname = addelem(cname, "..");
736                         nc = undomount(wq->clone, cname);
737                         n = 1;
738                 } else {
739                         nc = NULL;
740                         if (!nomount)
741                                 for (i = 0; i < wq->nqid && i < ntry - 1; i++)
742                                         if (findmount(&nc, &nmh, type, dev, wq->qid[i]))
743                                                 break;
744                         if (nc == NULL) {       /* no mount points along path */
745                                 if (wq->clone == NULL) {
746                                         cclose(c);
747                                         cnameclose(cname);
748                                         if (wq->nqid == 0 || (wq->qid[wq->nqid - 1].type & QTDIR)) {
749                                                 if (nerror)
750                                                         *nerror = nhave + wq->nqid + 1;
751                                                 set_errstr(Edoesnotexist);
752                                         } else {
753                                                 if (nerror)
754                                                         *nerror = nhave + wq->nqid;
755                                                 set_errstr(Enotdir);
756                                         }
757                                         kfree(wq);
758                                         if (mh != NULL)
759                                                 putmhead(mh);
760                                         return -1;
761                                 }
762                                 n = wq->nqid;
763                                 nc = wq->clone;
764                         } else {        /* stopped early, at a mount point */
765                                 if (wq->clone != NULL) {
766                                         cclose(wq->clone);
767                                         wq->clone = NULL;
768                                 }
769                                 n = i + 1;
770                         }
771                         for (i = 0; i < n; i++)
772                                 cname = addelem(cname, names[nhave + i]);
773                 }
774                 cclose(c);
775                 c = nc;
776                 putmhead(mh);
777                 mh = nmh;
778                 kfree(wq);
779         }
780
781         putmhead(mh);
782
783         c = cunique(c);
784
785         if (c->umh != NULL) {   //BUG
786                 printd("walk umh\n");
787                 putmhead(c->umh);
788                 c->umh = NULL;
789         }
790
791         cnameclose(c->name);
792         c->name = cname;
793
794         cclose(*cp);
795         *cp = c;
796         if (nerror)
797                 *nerror = 0;
798         return 0;
799 }
800
801 /*
802  * c is a mounted non-creatable directory.  find a creatable one.
803  */
804 struct chan *createdir(struct chan *c, struct mhead *m)
805 {
806         ERRSTACK(1);
807         struct chan *nc;
808         struct mount *f;
809
810         rlock(&m->lock);
811         if (waserror()) {
812                 runlock(&m->lock);
813                 nexterror();
814         }
815         for (f = m->mount; f; f = f->next) {
816                 if (f->mflag & MCREATE) {
817                         nc = cclone(f->to);
818                         runlock(&m->lock);
819                         poperror();
820                         cclose(c);
821                         return nc;
822                 }
823         }
824         error(Enocreate);
825         poperror();
826         return 0;
827 }
828
829 /*
830  * In place, rewrite name to compress multiple /, eliminate ., and process ..
831  */
832 void cleancname(struct cname *n)
833 {
834         char *p;
835
836         if (n->s[0] == '#') {
837                 p = strchr(n->s, '/');
838                 if (p == NULL)
839                         return;
840                 cleanname(p);
841
842                 /*
843                  * The correct name is #i rather than #i/,
844                  * but the correct name of #/ is #/.
845                  */
846                 if (strcmp(p, "/") == 0 && n->s[1] != '/')
847                         *p = '\0';
848         } else
849                 cleanname(n->s);
850         n->len = strlen(n->s);
851 }
852
853 static void growparse(Elemlist * e)
854 {
855         char **new;
856         int *inew;
857         enum { Delta = 8 };
858
859         if (e->ARRAY_SIZEs % Delta == 0) {
860                 new = kzmalloc((e->ARRAY_SIZEs + Delta) * sizeof(char *), 0);
861                 memmove(new, e->elems, e->ARRAY_SIZEs * sizeof(char *));
862                 kfree(e->elems);
863                 e->elems = new;
864                 inew = kzmalloc((e->ARRAY_SIZEs + Delta + 1) * sizeof(int), 0);
865                 memmove(inew, e->off, e->ARRAY_SIZEs * sizeof(int));
866                 kfree(e->off);
867                 e->off = inew;
868         }
869 }
870
871 /*
872  * The name is known to be valid.
873  * Copy the name so slashes can be overwritten.
874  * An empty string will set ARRAY_SIZE=0.
875  * A path ending in / or /. or /.//./ etc. will have
876  * e.mustbedir = 1, so that we correctly
877  * reject, e.g., "/adm/users/." when /adm/users is a file
878  * rather than a directory.
879  */
880 static void parsename(char *name, Elemlist * e)
881 {
882         char *slash;
883
884         kstrdup(&e->name, name);
885         name = e->name;
886         e->ARRAY_SIZEs = 0;
887         e->elems = NULL;
888         e->off = kzmalloc(sizeof(int), 0);
889         e->off[0] = skipslash(name) - name;
890         for (;;) {
891                 name = skipslash(name);
892                 if (*name == '\0') {
893                         e->mustbedir = 1;
894                         break;
895                 }
896                 growparse(e);
897
898                 e->elems[e->ARRAY_SIZEs++] = name;
899                 /* we may want to do this again some day
900                    slash = utfrune(name, '/');
901                  */
902                 slash = strchr(name, '/');
903                 if (slash == NULL) {
904                         e->off[e->ARRAY_SIZEs] = name + strlen(name) - e->name;
905                         e->mustbedir = 0;
906                         break;
907                 }
908                 e->off[e->ARRAY_SIZEs] = slash - e->name;
909                 *slash++ = '\0';
910                 name = slash;
911         }
912 }
913
914 void *memrchr(void *va, int c, long n)
915 {
916         uint8_t *a, *e;
917
918         a = va;
919         for (e = a + n - 1; e > a; e--)
920                 if (*e == c)
921                         return e;
922         return NULL;
923 }
924
925 /*
926  * Turn a name into a channel.
927  * &name[0] is known to be a valid address.  It may be a kernel address.
928  *
929  * Opening with amode Aopen, Acreate, or Aremove guarantees
930  * that the result will be the only reference to that particular fid.
931  * This is necessary since we might pass the result to
932  * devtab[].remove().
933  *
934  * Opening Atodir, Amount, or Aaccess does not guarantee this.
935  *
936  * Opening Aaccess can, under certain conditions, return a
937  * correct Chan* but with an incorrect struct cname attached.
938  * Since the functions that open Aaccess (sysstat, syswstat, sys_stat)
939  * do not use the struct cname*, this avoids an unnecessary clone.
940  */
941 struct chan *namec(char *aname, int amode, int omode, uint32_t perm)
942 {
943         ERRSTACK(2);
944         int n, prefix, len, t, nomount, npath;
945         struct chan *c, *cnew;
946         struct cname *cname;
947         Elemlist e;
948         struct mhead *m;
949         char tmperrbuf[ERRMAX];
950         int saved_errno;
951         char *name;
952         // Rune r;
953
954         name = aname;
955         if (name[0] == '\0')
956                 error("empty file name");
957         validname(name, 1);
958
959         /*
960          * Find the starting off point (the current slash, the root of
961          * a device tree, or the current dot) as well as the name to
962          * evaluate starting there.
963          */
964         nomount = 0;
965         switch (name[0]) {
966                 case '/':
967                         c = current->slash;
968                         if (!c)
969                                 panic("no slash!");
970                         kref_get(&c->ref, 1);
971                         break;
972
973                 case '#':
974                         nomount = 1;
975                         get_cur_genbuf()[0] = '\0';
976                         n = 0;
977                         while (*name != '\0' && (*name != '/' || n < 2)) {
978                                 if (n >= sizeof(get_cur_genbuf()) - 1)
979                                         error(Efilename);
980                                 get_cur_genbuf()[n++] = *name++;
981                         }
982                         get_cur_genbuf()[n] = '\0';
983 #if 0
984                         n = chartorune(&r, get_cur_genbuf() + 1) + 1;
985                         if (r == 'M')
986                                 error(Enoattach);
987 #endif
988                         if (get_cur_genbuf()[1] == 'M')
989                                 error(Enoattach);
990                         /*
991                          *  the nodevs exceptions are
992                          *  |  it only gives access to pipes you create
993                          *  e  this process's environment
994                          *  s  private file2chan creation space
995                          *  D private secure sockets name space
996                          *  a private TLS name space
997                          */
998                         if (current->pgrp->nodevs &&
999                                 //          (utfrune("|esDa", r) == NULL
1000                                 ((strchr("|esDa", get_cur_genbuf()[1]) == NULL)
1001                                  || (get_cur_genbuf()[1] == 's' // || r == 's'
1002                                          && get_cur_genbuf()[n] != '\0')))
1003                                 error(Enoattach);
1004                         t = devno( /*r */ get_cur_genbuf()[1], 1);
1005                         if (t == -1)
1006                                 error(Ebadsharp);
1007                         c = devtab[t].attach(get_cur_genbuf() + n);
1008                         break;
1009
1010                 default:
1011                         c = current->dot;
1012                         if (!c)
1013                                 panic("no dot!");
1014                         kref_get(&c->ref, 1);
1015                         break;
1016         }
1017         prefix = name - aname;
1018
1019         e.name = NULL;
1020         e.elems = NULL;
1021         e.off = NULL;
1022         e.ARRAY_SIZEs = 0;
1023         if (waserror()) {
1024                 cclose(c);
1025                 kfree(e.name);
1026                 kfree(e.elems);
1027                 kfree(e.off);
1028 //dumpmount();
1029                 nexterror();
1030         }
1031
1032         /*
1033          * Build a list of elements in the path.
1034          */
1035         parsename(name, &e);
1036
1037         /*
1038          * On create, ....
1039          */
1040         if (amode == Acreate) {
1041                 /* perm must have DMDIR if last element is / or /. */
1042                 if (e.mustbedir && !(perm & DMDIR)) {
1043                         npath = e.ARRAY_SIZEs;
1044                         strncpy(tmperrbuf, "create without DMDIR", sizeof(tmperrbuf));
1045                         goto NameError;
1046                 }
1047
1048                 /* don't try to walk the last path element just yet. */
1049                 if (e.ARRAY_SIZEs == 0)
1050                         error(Eexist);
1051                 e.ARRAY_SIZEs--;
1052         }
1053
1054         if (walk(&c, e.elems, e.ARRAY_SIZEs, nomount, &npath) < 0) {
1055                 if (npath < 0 || npath > e.ARRAY_SIZEs) {
1056                         printd("namec %s walk error npath=%d\n", aname, npath);
1057                         error("walk failed");
1058                 }
1059 NameError:
1060                 if (current_errstr()[0]) {
1061                         /* errstr is set, we'll just stick with it and error out */
1062                         longjmp(&get_cur_errbuf()->jmpbuf, 1);
1063                 } else {
1064                         error("Name to chan lookup failed");
1065                 }
1066                 /* brho: skipping the namec custom error string business, since it hides
1067                  * the underlying failure.  implement this if you want the old stuff. */
1068 #if 0
1069                 strncpy(tmperrbuf, current->errstr, sizeof(tmperrbuf));
1070                 len = prefix + e.off[npath];
1071                 if (len < ERRMAX / 3 || (name = memrchr(aname, '/', len)) == NULL
1072                         || name == aname)
1073                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "%.*s", len,
1074                                          aname);
1075                 else
1076                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "...%.*s",
1077                                          (int)(len - (name - aname)), name);
1078                 snprintf(current->errstr, ERRMAX, "%#q %s", get_cur_genbuf(),
1079                                  tmperrbuf);
1080 #endif
1081         }
1082
1083         if (e.mustbedir && !(c->qid.type & QTDIR)) {
1084                 npath = e.ARRAY_SIZEs;
1085                 strncpy(tmperrbuf, "not a directory", sizeof(tmperrbuf));
1086                 goto NameError;
1087         }
1088
1089         if (amode == Aopen && (omode & 3) == OEXEC && (c->qid.type & QTDIR)) {
1090                 npath = e.ARRAY_SIZEs;
1091                 error("cannot exec directory");
1092         }
1093
1094         switch (amode) {
1095                 case Aaccess:
1096                         if (!nomount)
1097                                 domount(&c, NULL);
1098                         break;
1099
1100                 case Abind:
1101                         m = NULL;
1102                         if (!nomount)
1103                                 domount(&c, &m);
1104                         if (c->umh != NULL)
1105                                 putmhead(c->umh);
1106                         c->umh = m;
1107                         break;
1108
1109                 case Aremove:
1110                 case Aopen:
1111 Open:
1112                         /* save the name; domount might change c */
1113                         cname = c->name;
1114                         kref_get(&cname->ref, 1);
1115                         m = NULL;
1116                         if (!nomount)
1117                                 domount(&c, &m);
1118
1119                         /* our own copy to open or remove */
1120                         c = cunique(c);
1121
1122                         /* now it's our copy anyway, we can put the name back */
1123                         cnameclose(c->name);
1124                         c->name = cname;
1125
1126                         switch (amode) {
1127                                 case Aremove:
1128                                         putmhead(m);
1129                                         break;
1130
1131                                 case Aopen:
1132                                 case Acreate:
1133                                         if (c->umh != NULL) {
1134                                                 printd("cunique umh\n");
1135                                                 putmhead(c->umh);
1136                                                 c->umh = NULL;
1137                                         }
1138
1139                                         /* only save the mount head if it's a multiple element union */
1140                                         if (m && m->mount && m->mount->next)
1141                                                 c->umh = m;
1142                                         else
1143                                                 putmhead(m);
1144
1145                                         if (omode == OEXEC)
1146                                                 c->flag &= ~CCACHE;
1147
1148                                         c = devtab[c->type].open(c, omode & ~OCEXEC);
1149                                         /* here is where convert omode/vfs flags to c->flags */
1150                                         if (omode & O_APPEND)
1151                                                 c->flag |= CAPPEND;
1152                                         // CEXEC should be in the FD, not the chan, right?
1153                                         if (omode & OCEXEC)
1154                                                 c->flag |= CCEXEC;
1155                                         if (omode & ORCLOSE)
1156                                                 c->flag |= CRCLOSE;
1157                                         break;
1158                         }
1159                         break;
1160
1161                 case Atodir:
1162                         /*
1163                          * Directories (e.g. for cd) are left before the mount po int unused_int,
1164                          * so one may mount on / or . and see the effect.
1165                          */
1166                         if (!(c->qid.type & QTDIR))
1167                                 error(Enotdir);
1168                         break;
1169
1170                 case Amount:
1171                         /*
1172                          * When mounting on an already mounted upon directory,
1173                          * one wants subsequent mounts to be attached to the
1174                          * original directory, not the replacement.  Don't domount.
1175                          */
1176                         break;
1177
1178                 case Acreate:
1179                         /*
1180                          * We've already walked all but the last element.
1181                          * If the last exists, try to open it OTRUNC.
1182                          * If omode&OEXCL is set, just give up.
1183                          */
1184                         e.ARRAY_SIZEs++;
1185                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, nomount, NULL) == 0) {
1186                                 if (omode & OEXCL)
1187                                         error(Eexist);
1188                                 omode |= OTRUNC;
1189                                 goto Open;
1190                         }
1191
1192                         /*
1193                          * The semantics of the create(2) system call are that if the
1194                          * file exists and can be written, it is to be opened with truncation.
1195                          * On the other hand, the create(5) message fails if the file exists.
1196                          * If we get two create(2) calls happening simultaneously, 
1197                          * they might both get here and send create(5) messages, but only 
1198                          * one of the messages will succeed.  To provide the expected create(2)
1199                          * semantics, the call with the failed message needs to try the above
1200                          * walk again, opening for truncation.  This correctly solves the 
1201                          * create/create race, in the sense that any observable outcome can
1202                          * be explained as one happening before the other.
1203                          * The create/create race is quite common.  For example, it happens
1204                          * when two rc subshells simultaneously update the same
1205                          * environment variable.
1206                          *
1207                          * The implementation still admits a create/create/remove race:
1208                          * (A) walk to file, fails
1209                          * (B) walk to file, fails
1210                          * (A) create file, succeeds, returns 
1211                          * (B) create file, fails
1212                          * (A) remove file, succeeds, returns
1213                          * (B) walk to file, return failure.
1214                          *
1215                          * This is hardly as common as the create/create race, and is really
1216                          * not too much worse than what might happen if (B) got a hold of a
1217                          * file descriptor and then the file was removed -- either way (B) can't do
1218                          * anything with the result of the create call.  So we don't care about this race.
1219                          *
1220                          * Applications that care about more fine-grained decision of the races
1221                          * can use the OEXCL flag to get at the underlying create(5) semantics;
1222                          * by default we provide the common case.
1223                          *
1224                          * We need to stay behind the mount point in case we
1225                          * need to do the first walk again (should the create fail).
1226                          *
1227                          * We also need to cross the mount point and find the directory
1228                          * in the union in which we should be creating.
1229                          *
1230                          * The channel staying behind is c, the one moving forward is cnew.
1231                          */
1232                         m = NULL;
1233                         cnew = NULL;    /* is this assignment necessary? */
1234                         /* discard error */
1235                         if (!waserror()) {      /* try create */
1236                                 if (!nomount && findmount(&cnew, &m, c->type, c->dev, c->qid))
1237                                         cnew = createdir(cnew, m);
1238                                 else {
1239                                         cnew = c;
1240                                         kref_get(&cnew->ref, 1);
1241                                 }
1242
1243                                 /*
1244                                  * We need our own copy of the Chan because we're
1245                                  * about to send a create, which will move it.  Once we have
1246                                  * our own copy, we can fix the name, which might be wrong
1247                                  * if findmount gave us a new Chan.
1248                                  */
1249                                 cnew = cunique(cnew);
1250                                 cnameclose(cnew->name);
1251                                 cnew->name = c->name;
1252                                 kref_get(&cnew->name->ref, 1);
1253
1254                                 devtab[cnew->type].create(cnew, e.elems[e.ARRAY_SIZEs - 1],
1255                                                                                   omode & ~(OEXCL | OCEXEC), perm);
1256                                 poperror();
1257                                 if (omode & O_APPEND)
1258                                         cnew->flag |= CAPPEND;
1259                                 if (omode & OCEXEC)
1260                                         cnew->flag |= CCEXEC;
1261                                 if (omode & ORCLOSE)
1262                                         cnew->flag |= CRCLOSE;
1263                                 if (m)
1264                                         putmhead(m);
1265                                 cclose(c);
1266                                 c = cnew;
1267                                 c->name = addelem(c->name, e.elems[e.ARRAY_SIZEs - 1]);
1268                                 break;
1269                         }
1270
1271                         /* create failed */
1272                         cclose(cnew);
1273                         if (m)
1274                                 putmhead(m);
1275                         if (omode & OEXCL)
1276                                 nexterror();    /* safe since we're in a waserror() */
1277                         poperror();     /* matching the if(!waserror) */
1278
1279                         /* save error, so walk doesn't clobber our existing errstr */
1280                         strncpy(tmperrbuf, current_errstr(), MAX_ERRSTR_LEN);
1281                         saved_errno = get_errno();
1282                         /* note: we depend that walk does not error */
1283                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, nomount, NULL) < 0) {
1284                                 set_errno(saved_errno);
1285                                 error(tmperrbuf);       /* report the error we had originally */
1286                         }
1287                         strncpy(current_errstr(), tmperrbuf, MAX_ERRSTR_LEN);
1288                         omode |= OTRUNC;
1289                         goto Open;
1290
1291                 default:
1292                         panic("unknown namec access %d\n", amode);
1293         }
1294
1295         poperror();
1296
1297         if (e.ARRAY_SIZEs > 0)
1298                 strncpy(get_cur_genbuf(), e.elems[e.ARRAY_SIZEs - 1], GENBUF_SZ);
1299         else
1300                 strncpy(get_cur_genbuf(), ".", GENBUF_SZ);
1301
1302         kfree(e.name);
1303         kfree(e.elems);
1304         kfree(e.off);
1305
1306         return c;
1307 }
1308
1309 /*
1310  * name is valid. skip leading / and ./ as much as possible
1311  */
1312 char *skipslash(char *name)
1313 {
1314         while (name[0] == '/'
1315                    || (name[0] == '.' && (name[1] == 0 || name[1] == '/')))
1316                 name++;
1317         return name;
1318 }
1319
1320 char isfrog[256] = {
1321          /*NUL*/ 1, 1, 1, 1, 1, 1, 1, 1,
1322          /*BKS*/ 1, 1, 1, 1, 1, 1, 1, 1,
1323          /*DLE*/ 1, 1, 1, 1, 1, 1, 1, 1,
1324          /*CAN*/ 1, 1, 1, 1, 1, 1, 1, 1,
1325         ['/'] 1,
1326         [0x7f] 1,
1327 };
1328
1329 /*
1330  * Check that the name
1331  *  a) is in valid memory.
1332  *  b) is shorter than 2^16 bytes, so it can fit in a 9P string field.
1333  *  c) contains no frogs.
1334  * The first byte is known to be addressible by the requester, so the
1335  * routine works for kernel and user memory both.
1336  * The parameter slashok flags whether a slash character is an error
1337  * or a valid character.
1338  */
1339 void validname(char *aname, int slashok)
1340 {
1341         char *ename, *name;
1342         int c;
1343
1344         name = aname;
1345         ename = memchr(name, 0, (1 << 16));
1346
1347         if (ename == NULL || ename - name >= (1 << 16))
1348                 error("name too long");
1349
1350         while (*name) {
1351                 /* all characters above '~' are ok */
1352                 c = *(uint8_t *) name;
1353 #if 0
1354                 if (c >= Runeself)
1355                         name += chartorune(&r, name);
1356 #endif
1357                 if (c >= 0x7f) {
1358                         error("Akaros doesn't do UTF-8");
1359                 } else {
1360                         if (isfrog[c])
1361                                 if (!slashok || c != '/') {
1362                                         error("%s: %q", Ebadchar, aname);
1363                                 }
1364                         name++;
1365                 }
1366         }
1367 }
1368
1369 void isdir(struct chan *c)
1370 {
1371         if (c->qid.type & QTDIR)
1372                 return;
1373         error(Enotdir);
1374 }
1375
1376 /*
1377  * This is necessary because there are many
1378  * pointers to the top of a given mount list:
1379  *
1380  *      - the mhead in the namespace hash table
1381  *      - the mhead in chans returned from findmount:
1382  *        used in namec and then by unionread.
1383  *      - the mhead in chans returned from createdir:
1384  *        used in the open/create race protect, which is gone.
1385  *
1386  * The RWlock in the Mhead protects the mount list it contains.
1387  * The mount list is deleted when we cunmount.
1388  * The RWlock ensures that nothing is using the mount list at that time.
1389  *
1390  * It is okay to replace c->mh with whatever you want as 
1391  * long as you are sure you have a unique reference to it.
1392  *
1393  * This comment might belong somewhere else.
1394  */
1395 void putmhead(struct mhead *m)
1396 {
1397         if (m)
1398                 kref_put(&m->ref);
1399 }