All qlocks are initialized
[akaros.git] / kern / src / ns / chan.c
1 // INFERNO
2 #include <vfs.h>
3 #include <kfs.h>
4 #include <slab.h>
5 #include <kmalloc.h>
6 #include <kref.h>
7 #include <string.h>
8 #include <stdio.h>
9 #include <assert.h>
10 #include <error.h>
11 #include <cpio.h>
12 #include <pmap.h>
13 #include <smp.h>
14 #include <syscall.h>
15
16 char*
17 channame(struct chan *c)                /* DEBUGGING */
18 {
19         if(c == NULL)
20                 return "<NULL chan>";
21         if(c->name == NULL)
22                 return "<NULL name>";
23         if(c->name->s == NULL)
24                 return "<NULL name.s>";
25         return c->name->s;
26 }
27
28 enum
29 {
30         CNAMESLOP       = 20
31 };
32
33 struct
34 {
35         spinlock_t lock;
36         int     fid;
37         struct chan     *free;
38         struct chan     *list;
39 }chanalloc;
40
41 typedef struct Elemlist Elemlist;
42
43 struct Elemlist
44 {
45         char    *name;  /* copy of name, so '/' can be overwritten */
46         int     ARRAY_SIZEs;
47         char    **elems;
48         int     *off;
49         int     mustbedir;
50 };
51
52 #define SEP(c) ((c) == 0 || (c) == '/')
53 void cleancname(struct cname*);
54
55 int
56 isdotdot(char *p)
57 {
58         return p[0]=='.' && p[1]=='.' && p[2]=='\0';
59 }
60
61 int
62 emptystr(char *s)
63 {
64         if(s == NULL)
65                 return 1;
66         if(s[0] == '\0')
67                 return 1;
68         return 0;
69 }
70
71 /*
72  * Atomically replace *p with copy of s
73  */
74 void
75 kstrdup(char **p, char *s)
76 {
77         int n;
78         char *t, *prev;
79
80         n = strlen(s)+1;
81         /* if it's a user, we can wait for memory; if not, something's very wrong */
82         if (current) {
83                 t = kzmalloc(n, 0);
84         }else{
85                 t = kzmalloc(n, 0);
86                 if(t == NULL)
87                         panic("kstrdup: no memory");
88         }
89         memmove(t, s, n);
90         prev = *p;
91         *p = t;
92         kfree(prev);
93 }
94
95 void
96 chandevreset(void)
97 {
98         int i;
99
100         for(i=0; devtab[i] != NULL; i++)
101                 devtab[i]->reset();
102 }
103
104 void
105 chandevinit(void)
106 {
107         int i;
108
109         for(i=0; devtab[i] != NULL; i++)
110                 devtab[i]->init();
111 }
112
113 void
114 chandevshutdown(void)
115 {
116         int i;
117         
118         /* shutdown in reverse order */
119         for(i=0; devtab[i] != NULL; i++)
120                 ;
121         for(i--; i >= 0; i--)
122                 devtab[i]->shutdown();
123 }
124
125 static void chan_release(struct kref *kref)
126 {
127         struct chan *c = container_of(kref, struct chan, ref);
128         ERRSTACK(1);
129         /* this style discards the error from close().  picture it as
130          * if (waserror()) { } else { close(); } chanfree_no_matter_what();  */
131         if (!waserror()) {
132                 devtab[c->type]->close(c);
133         }
134         /* need to poperror regardless of whether we error'd or not */
135         poperror();
136         /* and chan free no matter what */
137         chanfree(c);
138 }
139
140 struct chan*
141 newchan(void)
142 {
143         struct chan *c;
144
145         spin_lock(&(&chanalloc)->lock);
146         c = chanalloc.free;
147         if(c != 0)
148                 chanalloc.free = c->next;
149         spin_unlock(&(&chanalloc)->lock);
150
151         if(c == NULL) {
152                 c = kzmalloc(sizeof(struct chan), 0);
153                 spin_lock(&(&chanalloc)->lock);
154                 c->fid = ++chanalloc.fid;
155                 c->link = chanalloc.list;
156                 chanalloc.list = c;
157                 spin_unlock(&(&chanalloc)->lock);
158                 spinlock_init(&c->lock);
159                 qlock_init(&c->umqlock);
160         }
161
162         /* if you get an error before associating with a dev,
163            close calls rootclose, a nop */
164         c->type = 0;
165         c->flag = 0;
166         kref_init(&c->ref, chan_release, 1);
167         c->dev = 0;
168         c->offset = 0;
169         c->iounit = 0;
170         c->umh = 0;
171         c->uri = 0;
172         c->dri = 0;
173         c->aux = 0;
174         c->mchan = 0;
175         c->mcp = 0;
176         c->mux = 0;
177         c->mqid.path = 0;
178         c->mqid.vers = 0;
179         c->mqid.type = 0;
180         c->name = 0;
181         return c;
182 }
183
184 static void __cname_release(struct kref *kref)
185 {
186         struct cname *n = container_of(kref, struct cname, ref);
187         kfree(n->s);
188         kfree(n);
189 }
190
191 struct cname*
192 newcname(char *s)
193 {
194         struct cname *n;
195         int i;
196
197         n = kzmalloc(sizeof(*n), 0);
198         i = strlen(s);
199         n->len = i;
200         n->alen = i+CNAMESLOP;
201         n->s = kzmalloc(n->alen, 0);
202         memmove(n->s, s, i+1);
203         kref_init(&n->ref, __cname_release, 1);
204         return n;
205 }
206
207 void
208 cnameclose(struct cname *n)
209 {
210         if(n == NULL)
211                 return;
212         kref_put(&n->ref);
213 }
214
215 struct cname*
216 addelem(struct cname *n, char *s)
217 {
218         int i, a;
219         char *t;
220         struct cname *new;
221
222         if(s[0]=='.' && s[1]=='\0')
223                 return n;
224
225         if(kref_refcnt(&n->ref) > 1){
226                 /* copy on write */
227                 new = newcname(n->s);
228                 cnameclose(n);
229                 n = new;
230         }
231
232         i = strlen(s);
233         if(n->len+1+i+1 > n->alen){
234                 a = n->len+1+i+1 + CNAMESLOP;
235                 t = kzmalloc(a, 0);
236                 memmove(t, n->s, n->len+1);
237                 kfree(n->s);
238                 n->s = t;
239                 n->alen = a;
240         }
241         if(n->len>0 && n->s[n->len-1]!='/' && s[0]!='/')        /* don't insert extra slash if one is present */
242                 n->s[n->len++] = '/';
243         memmove(n->s+n->len, s, i+1);
244         n->len += i;
245         if(isdotdot(s))
246                 cleancname(n);
247         return n;
248 }
249
250 void
251 chanfree(struct chan *c)
252 {
253         c->flag = CFREE;
254
255         if(c->umh != NULL){
256                 putmhead(c->umh);
257                 c->umh = NULL;
258         }
259         if(c->umc != NULL){
260                 cclose(c->umc);
261                 c->umc = NULL;
262         }
263         if(c->mux != NULL){
264                 //
265                 muxclose(c->mux);
266                 c->mux = NULL;
267         }
268         if(c->mchan != NULL){
269                 cclose(c->mchan);
270                 c->mchan = NULL;
271         }
272
273         cnameclose(c->name);
274
275         spin_lock(&(&chanalloc)->lock);
276         c->next = chanalloc.free;
277         chanalloc.free = c;
278         spin_unlock(&(&chanalloc)->lock);
279 }
280
281 void
282 cclose(struct chan *c)
283 {
284         if(c == 0)
285                 return;
286
287         if(c->flag&CFREE)
288                 panic("cclose %lux", getcallerpc(&c));
289
290         kref_put(&c->ref);
291 }
292
293 /*
294  * Make sure we have the only copy of c.  (Copy on write.)
295  */
296 struct chan*
297 cunique(struct chan *c)
298 {
299         struct chan *nc;
300
301         if(kref_refcnt(&c->ref) != 1) {
302                 nc = cclone(c);
303                 cclose(c);
304                 c = nc;
305         }
306
307         return c;
308 }
309
310 int
311 eqqid(struct qid a, struct qid b)
312 {
313         return a.path==b.path && a.vers==b.vers;
314 }
315
316 int
317 eqchan(struct chan *a, struct chan *b, int pathonly)
318 {
319         if(a->qid.path != b->qid.path)
320                 return 0;
321         if(!pathonly && a->qid.vers!=b->qid.vers)
322                 return 0;
323         if(a->type != b->type)
324                 return 0;
325         if(a->dev != b->dev)
326                 return 0;
327         return 1;
328 }
329
330 int
331 eqchantdqid(struct chan *a, int type, int dev, struct qid qid, int pathonly)
332 {
333         if(a->qid.path != qid.path)
334                 return 0;
335         if(!pathonly && a->qid.vers!=qid.vers)
336                 return 0;
337         if(a->type != type)
338                 return 0;
339         if(a->dev != dev)
340                 return 0;
341         return 1;
342 }
343
344 static void mh_release(struct kref *kref)
345 {
346         struct mhead *mh = container_of(kref, struct mhead, ref);
347         mh->mount = (struct mount*)0xCafeBeef;
348         kfree(mh);
349 }
350
351 struct mhead *newmhead(struct chan *from)
352 {
353         struct mhead *mh;
354
355         mh = kzmalloc(sizeof(struct mhead), 0);
356         kref_init(&mh->ref, mh_release, 1);
357         mh->from = from;
358         kref_get(&from->ref, 1);
359
360 /*
361         n = from->name->len;
362         if(n >= sizeof(mh->fromname))
363                 n = sizeof(mh->fromname)-1;
364         memmove(mh->fromname, from->name->s, n);
365         mh->fromname[n] = 0;
366 */
367         return mh;
368 }
369
370 int
371 cmount(struct chan *new, struct chan *old, int flag, char *spec)
372 {
373         ERRSTACK(1);
374         struct pgrp *pg;
375         int order, flg;
376         struct mhead *m, **l, *mh;
377         struct mount *nm, *f, *um, **h;
378
379         if(QTDIR & (old->qid.type^new->qid.type))
380                 error(Emount);
381
382 if(old->umh)
383         printd("cmount old extra umh\n");
384
385         order = flag&MORDER;
386
387         if((old->qid.type&QTDIR)==0 && order != MREPL)
388                 error(Emount);
389
390         mh = new->umh;
391
392         /*
393          * Not allowed to bind when the old directory
394          * is itself a union.  (Maybe it should be allowed, but I don't see
395          * what the semantics would be.)
396          *
397          * We need to check mh->mount->next to tell unions apart from
398          * simple mount points, so that things like
399          *      mount -c fd /root
400          *      bind -c /root /
401          * work.  The check of mount->mflag catches things like
402          *      mount fd /root
403          *      bind -c /root /
404          * 
405          * This is far more complicated than it should be, but I don't
406          * see an easier way at the moment.             -rsc
407          */
408         if((flag&MCREATE) && mh && mh->mount
409         && (mh->mount->next || !(mh->mount->mflag&MCREATE)))
410                 error(Emount);
411
412         pg = current->pgrp;
413         wlock(&pg->ns);
414
415         l = &MOUNTH(pg, old->qid);
416         for(m = *l; m; m = m->hash) {
417                 if(eqchan(m->from, old, 1))
418                         break;
419                 l = &m->hash;
420         }
421
422         if(m == NULL) {
423                 /*
424                  *  nothing mounted here yet.  create a mount
425                  *  head and add to the hash table.
426                  */
427                 m = newmhead(old);
428                 *l = m;
429
430                 /*
431                  *  if this is a union mount, add the old
432                  *  node to the mount chain.
433                  */
434                 if(order != MREPL)
435                         m->mount = newmount(m, old, 0, 0);
436         }
437         wlock(&m->lock);
438         if(waserror()){
439                 wunlock(&m->lock);
440                 nexterror();
441         }
442         wunlock(&pg->ns);
443
444         nm = newmount(m, new, flag, spec);
445         if(mh != NULL && mh->mount != NULL) {
446                 /*
447                  *  copy a union when binding it onto a directory
448                  */
449                 flg = order;
450                 if(order == MREPL)
451                         flg = MAFTER;
452                 h = &nm->next;
453                 um = mh->mount;
454                 for(um = um->next; um; um = um->next) {
455                         f = newmount(m, um->to, flg, um->spec);
456                         *h = f;
457                         h = &f->next;
458                 }
459         }
460
461         if(m->mount && order == MREPL) {
462                 mountfree(m->mount);
463                 m->mount = 0;
464         }
465
466         if(flag & MCREATE)
467                 nm->mflag |= MCREATE;
468
469         if(m->mount && order == MAFTER) {
470                 for(f = m->mount; f->next; f = f->next)
471                         ;
472                 f->next = nm;
473         }
474         else {
475                 for(f = nm; f->next; f = f->next)
476                         ;
477                 f->next = m->mount;
478                 m->mount = nm;
479         }
480
481         wunlock(&m->lock);
482         poperror();
483         return nm->mountid;
484 }
485
486 void
487 cunmount(struct chan *mnt, struct chan *mounted)
488 {
489         struct pgrp *pg;
490         struct mhead *m, **l;
491         struct mount *f, **p;
492
493         if(mnt->umh)    /* should not happen */
494                 printd("cunmount newp extra umh %p has %p\n", mnt, mnt->umh);
495
496         /*
497          * It _can_ happen that mounted->umh is non-NULL, 
498          * because mounted is the result of namec(Aopen)
499          * (see sysfile.c:/^sysunmount).
500          * If we open a union directory, it will have a umh.
501          * Although surprising, this is okay, since the
502          * cclose will take care of freeing the umh.
503          */
504
505         pg = current->pgrp;
506         wlock(&pg->ns);
507
508         l = &MOUNTH(pg, mnt->qid);
509         for(m = *l; m; m = m->hash) {
510                 if(eqchan(m->from, mnt, 1))
511                         break;
512                 l = &m->hash;
513         }
514
515         if(m == 0) {
516                 wunlock(&pg->ns);
517                 error(Eunmount);
518         }
519
520         wlock(&m->lock);
521         if(mounted == 0) {
522                 *l = m->hash;
523                 wunlock(&pg->ns);
524                 mountfree(m->mount);
525                 m->mount = NULL;
526                 cclose(m->from);
527                 wunlock(&m->lock);
528                 putmhead(m);
529                 return;
530         }
531
532         p = &m->mount;
533         for(f = *p; f; f = f->next) {
534                 /* BUG: Needs to be 2 pass */
535                 if(eqchan(f->to, mounted, 1) ||
536                   (f->to->mchan && eqchan(f->to->mchan, mounted, 1))) {
537                         *p = f->next;
538                         f->next = 0;
539                         mountfree(f);
540                         if(m->mount == NULL) {
541                                 *l = m->hash;
542                                 cclose(m->from);
543                                 wunlock(&m->lock);
544                                 wunlock(&pg->ns);
545                                 putmhead(m);
546                                 return;
547                         }
548                         wunlock(&m->lock);
549                         wunlock(&pg->ns);
550                         return;
551                 }
552                 p = &f->next;
553         }
554         wunlock(&m->lock);
555         wunlock(&pg->ns);
556         error(Eunion);
557 }
558
559 struct chan*
560 cclone(struct chan *c)
561 {
562         struct chan *nc;
563         struct walkqid *wq;
564
565         wq = devtab[c->type]->walk(c, NULL, NULL, 0);
566         if(wq == NULL)
567                 error("clone failed");
568         nc = wq->clone;
569         kfree(wq);
570         nc->name = c->name;
571         if(c->name)
572                 kref_get(&c->name->ref, 1);
573         return nc;
574 }
575
576 int
577 findmount(struct chan **cp,
578           struct mhead **mp, int type, int dev, struct qid qid)
579 {
580         struct pgrp *pg;
581         struct mhead *m;
582
583         pg = current->pgrp;
584         rlock(&pg->ns);
585         for(m = MOUNTH(pg, qid); m; m = m->hash){
586                 rlock(&m->lock);
587 if(m->from == NULL){
588         printd("m %p m->from 0\n", m);
589         runlock(&m->lock);
590         continue;
591 }
592                 if(eqchantdqid(m->from, type, dev, qid, 1)) {
593                         runlock(&pg->ns);
594                         if(mp != NULL){
595                                 kref_get(&m->ref, 1);
596                                 if(*mp != NULL)
597                                         putmhead(*mp);
598                                 *mp = m;
599                         }
600                         if(*cp != NULL)
601                                 cclose(*cp);
602                         kref_get(&m->mount->to->ref, 1);
603                         *cp = m->mount->to;
604                         runlock(&m->lock);
605                         return 1;
606                 }
607                 runlock(&m->lock);
608         }
609
610         runlock(&pg->ns);
611         return 0;
612 }
613
614 int
615 domount(struct chan **cp, struct mhead **mp)
616 {
617         return findmount(cp, mp, (*cp)->type, (*cp)->dev, (*cp)->qid);
618 }
619
620 struct chan*
621 undomount(struct chan *c, struct cname *name)
622 {
623         ERRSTACK(1);
624         struct chan *nc;
625         struct pgrp *pg;
626         struct mount *t;
627         struct mhead **h, **he, *f;
628
629         pg = current->pgrp;
630         rlock(&pg->ns);
631         if(waserror()) {
632                 runlock(&pg->ns);
633                 nexterror();
634         }
635
636         he = &pg->mnthash[MNTHASH];
637         for(h = pg->mnthash; h < he; h++) {
638                 for(f = *h; f; f = f->hash) {
639                         if(strcmp(f->from->name->s, name->s) != 0)
640                                 continue;
641                         for(t = f->mount; t; t = t->next) {
642                                 if(eqchan(c, t->to, 1)) {
643                                         /*
644                                          * We want to come out on the left hand side of the mount
645                                          * point using the element of the union that we entered on.
646                                          * To do this, find the element that has a from name of
647                                          * c->name->s.
648                                          */
649                                         if(strcmp(t->head->from->name->s, name->s) != 0)
650                                                 continue;
651                                         nc = t->head->from;
652                                         kref_get(&nc->ref, 1);
653                                         cclose(c);
654                                         c = nc;
655                                         break;
656                                 }
657                         }
658                 }
659         }
660         poperror();
661         runlock(&pg->ns);
662         return c;
663 }
664
665 /*
666  * Either walks all the way or not at all.  No partial results in *cp.
667  * *nerror is the number of names to display in an error message.
668  */
669 static char Edoesnotexist[] = "does not exist";
670 int
671 walk(struct chan **cp, char **names, int nnames, int nomount, int *nerror)
672 {
673         int dev, dotdot, i, n, nhave, ntry, type;
674         struct chan *c, *nc;
675         struct cname *cname;
676         struct mount *f;
677         struct mhead *mh, *nmh;
678         struct walkqid *wq;
679
680         c = *cp;
681         kref_get(&c->ref, 1);
682         cname = c->name;
683         kref_get(&cname->ref, 1);
684         mh = NULL;
685
686         /*
687          * While we haven't gotten all the way down the path:
688          *    1. step through a mount po int unused_int, if any
689          *    2. send a walk request for initial dotdot or initial prefix without dotdot
690          *    3. move to the first mountpoint along the way.
691          *    4. repeat.
692          *
693          * An invariant is that each time through the loop, c is on the undomount
694          * side of the mount po int unused_int, and c's name is cname.
695          */
696         for(nhave=0; nhave<nnames; nhave+=n){
697                 if((c->qid.type&QTDIR)==0){
698                         if(nerror)
699                                 *nerror = nhave;
700                         cnameclose(cname);
701                         cclose(c);
702                         set_errstr(Enotdir);
703                         if(mh != NULL)
704                                 putmhead(mh);
705                         return -1;
706                 }
707                 ntry = nnames - nhave;
708                 if(ntry > MAXWELEM)
709                         ntry = MAXWELEM;
710                 dotdot = 0;
711                 for(i=0; i<ntry; i++){
712                         if(isdotdot(names[nhave+i])){
713                                 if(i==0) {
714                                         dotdot = 1;
715                                         ntry = 1;
716                                 } else
717                                         ntry = i;
718                                 break;
719                         }
720                 }
721
722                 if(!dotdot && !nomount)
723                         domount(&c, &mh);
724
725                 type = c->type;
726                 dev = c->dev;
727
728                 if((wq = devtab[type]->walk(c, NULL, names+nhave, ntry)) == NULL){
729                         /* try a union mount, if any */
730                         if(mh && !nomount){
731                                 /*
732                                  * mh->mount == c, so start at mh->mount->next
733                                  */
734                                 rlock(&mh->lock);
735                                 for(f = mh->mount->next; f; f = f->next)
736                                         if((wq = devtab[f->to->type]->walk(f->to, NULL, names+nhave, ntry)) != NULL)
737                                                 break;
738                                 runlock(&mh->lock);
739                                 if(f != NULL){
740                                         type = f->to->type;
741                                         dev = f->to->dev;
742                                 }
743                         }
744                         if(wq == NULL){
745                                 cclose(c);
746                                 cnameclose(cname);
747                                 if(nerror)
748                                         *nerror = nhave+1;
749                                 if(mh != NULL)
750                                         putmhead(mh);
751                                 return -1;
752                         }
753                 }
754
755                 nmh = NULL;
756                 if(dotdot) {
757                         assert(wq->nqid == 1);
758                         assert(wq->clone != NULL);
759
760                         cname = addelem(cname, "..");
761                         nc = undomount(wq->clone, cname);
762                         n = 1;
763                 } else {
764                         nc = NULL;
765                         if(!nomount)
766                                 for(i=0; i<wq->nqid && i<ntry-1; i++)
767                                         if(findmount(&nc, &nmh, type, dev, wq->qid[i]))
768                                                 break;
769                         if(nc == NULL){ /* no mount points along path */
770                                 if(wq->clone == NULL){
771                                         cclose(c);
772                                         cnameclose(cname);
773                                         if(wq->nqid==0 || (wq->qid[wq->nqid-1].type&QTDIR)){
774                                                 if(nerror)
775                                                         *nerror = nhave+wq->nqid+1;
776                                                 set_errstr(Edoesnotexist);
777                                         }else{
778                                                 if(nerror)
779                                                         *nerror = nhave+wq->nqid;
780                                                 set_errstr(Enotdir);
781                                         }
782                                         kfree(wq);
783                                         if(mh != NULL)
784                                                 putmhead(mh);
785                                         return -1;
786                                 }
787                                 n = wq->nqid;
788                                 nc = wq->clone;
789                         }else{          /* stopped early, at a mount point */
790                                 if(wq->clone != NULL){
791                                         cclose(wq->clone);
792                                         wq->clone = NULL;
793                                 }
794                                 n = i+1;
795                         }
796                         for(i=0; i<n; i++)
797                                 cname = addelem(cname, names[nhave+i]);
798                 }
799                 cclose(c);
800                 c = nc;
801                 putmhead(mh);
802                 mh = nmh;
803                 kfree(wq);
804         }
805
806         putmhead(mh);
807
808         c = cunique(c);
809
810         if(c->umh != NULL){     //BUG
811                 printd("walk umh\n");
812                 putmhead(c->umh);
813                 c->umh = NULL;
814         }
815
816         cnameclose(c->name);
817         c->name = cname;
818
819         cclose(*cp);
820         *cp = c;
821         if(nerror)
822                 *nerror = 0;
823         return 0;
824 }
825
826 /*
827  * c is a mounted non-creatable directory.  find a creatable one.
828  */
829 struct chan*
830 createdir(struct chan *c, struct mhead *m)
831 {
832         ERRSTACK(1);
833         struct chan *nc;
834         struct mount *f;
835
836         rlock(&m->lock);
837         if(waserror()) {
838                 runlock(&m->lock);
839                 nexterror();
840         }
841         for(f = m->mount; f; f = f->next) {
842                 if(f->mflag&MCREATE) {
843                         nc = cclone(f->to);
844                         runlock(&m->lock);
845                         poperror();
846                         cclose(c);
847                         return nc;
848                 }
849         }
850         error(Enocreate);
851         poperror();
852         return 0;
853 }
854
855 /*
856  * In place, rewrite name to compress multiple /, eliminate ., and process ..
857  */
858 void
859 cleancname(struct cname *n)
860 {
861         char *p;
862
863         if(n->s[0] == '#'){
864                 p = strchr(n->s, '/');
865                 if(p == NULL)
866                         return;
867                 cleanname(p);
868
869                 /*
870                  * The correct name is #i rather than #i/,
871                  * but the correct name of #/ is #/.
872                  */
873                 if(strcmp(p, "/")==0 && n->s[1] != '/')
874                         *p = '\0';
875         }else
876                 cleanname(n->s);
877         n->len = strlen(n->s);
878 }
879
880 static void
881 growparse(Elemlist *e)
882 {
883         char **new;
884         int *inew;
885         enum { Delta = 8 };
886
887         if(e->ARRAY_SIZEs % Delta == 0){
888                 new = kzmalloc((e->ARRAY_SIZEs + Delta) * sizeof(char *), 0);
889                 memmove(new, e->elems, e->ARRAY_SIZEs*sizeof( char *));
890                 kfree(e->elems);
891                 e->elems = new;
892                 inew = kzmalloc((e->ARRAY_SIZEs + Delta + 1) * sizeof(int), 0);
893                 memmove(inew, e->off, e->ARRAY_SIZEs*sizeof(int));
894                 kfree(e->off);
895                 e->off = inew;
896         }
897 }
898
899 /*
900  * The name is known to be valid.
901  * Copy the name so slashes can be overwritten.
902  * An empty string will set ARRAY_SIZE=0.
903  * A path ending in / or /. or /.//./ etc. will have
904  * e.mustbedir = 1, so that we correctly
905  * reject, e.g., "/adm/users/." when /adm/users is a file
906  * rather than a directory.
907  */
908 static void
909 parsename(char *name, Elemlist *e)
910 {
911         char *slash;
912
913         kstrdup(&e->name, name);
914         name = e->name;
915         e->ARRAY_SIZEs = 0;
916         e->elems = NULL;
917         e->off = kzmalloc(sizeof(int), 0);
918         e->off[0] = skipslash(name) - name;
919         for(;;){
920                 name = skipslash(name);
921                 if(*name=='\0'){
922                         e->mustbedir = 1;
923                         break;
924                 }
925                 growparse(e);
926                 
927                 e->elems[e->ARRAY_SIZEs++] = name;
928                 /* we may want to do this again some day
929                 slash = utfrune(name, '/');
930                 */
931                 slash = strchr(name, '/');
932                 if(slash == NULL){
933                         e->off[e->ARRAY_SIZEs] = name+strlen(name) - e->name;
934                         e->mustbedir = 0;
935                         break;
936                 }
937                 e->off[e->ARRAY_SIZEs] = slash - e->name;
938                 *slash++ = '\0';
939                 name = slash;
940         }
941 }
942
943 void*
944 memrchr(void *va, int c, long n)
945 {
946         uint8_t *a, *e;
947
948         a = va;
949         for(e=a+n-1; e>a; e--)
950                 if(*e == c)
951                         return e;
952         return NULL;
953 }
954
955 /*
956  * Turn a name into a channel.
957  * &name[0] is known to be a valid address.  It may be a kernel address.
958  *
959  * Opening with amode Aopen, Acreate, or Aremove guarantees
960  * that the result will be the only reference to that particular fid.
961  * This is necessary since we might pass the result to
962  * devtab[]->remove().
963  *
964  * Opening Atodir, Amount, or Aaccess does not guarantee this.
965  *
966  * Opening Aaccess can, under certain conditions, return a
967  * correct Chan* but with an incorrect struct cname attached.
968  * Since the functions that open Aaccess (sysstat, syswstat, sys_stat)
969  * do not use the struct cname*, this avoids an unnecessary clone.
970  */
971 struct chan*
972 namec(char *aname, int amode, int omode, uint32_t perm)
973 {
974         ERRSTACK(2);
975         int n, prefix, len, t, nomount, npath;
976         struct chan *c, *cnew;
977         struct cname *cname;
978         Elemlist e;
979         struct mhead *m;
980         char tmperrbuf[ERRMAX];
981         char *name;
982         // Rune r;
983
984         name = aname;
985         if(name[0] == '\0')
986                 error("empty file name");
987         validname(name, 1);
988
989         /*
990          * Find the starting off point (the current slash, the root of
991          * a device tree, or the current dot) as well as the name to
992          * evaluate starting there.
993          */
994         nomount = 0;
995         switch(name[0]){
996         case '/':
997                 c = current->slash;
998                 if (! c)
999                         panic("no slash!");
1000                 kref_get(&c->ref, 1);
1001                 break;
1002         
1003         case '#':
1004                 nomount = 1;
1005                 get_cur_genbuf()[0] = '\0';
1006                 n = 0;
1007                 while(*name!='\0' && (*name != '/' || n < 2)){
1008                         if(n >= sizeof(get_cur_genbuf())-1)
1009                                 error(Efilename);
1010                         get_cur_genbuf()[n++] = *name++;
1011                 }
1012                 get_cur_genbuf()[n] = '\0';
1013 #if 0
1014                 n = chartorune(&r, get_cur_genbuf()+1)+1;
1015                 if(r == 'M')
1016                         error(Enoattach);
1017 #endif
1018                 if (get_cur_genbuf()[1] == 'M')
1019                         error(Enoattach);
1020                 /*
1021                  *  the nodevs exceptions are
1022                  *      |  it only gives access to pipes you create
1023                  *      e  this process's environment
1024                  *      s  private file2chan creation space
1025                  *      D private secure sockets name space
1026                  *      a private TLS name space
1027                  */
1028                 if(current->pgrp->nodevs &&
1029                    //              (utfrune("|esDa", r) == NULL
1030                    ((strchr("|esDa", get_cur_genbuf()[1]) == NULL)
1031                     || (get_cur_genbuf()[1] == 's' // || r == 's'
1032                         && get_cur_genbuf()[n]!='\0')))
1033                         error(Enoattach);
1034                 t = devno(/*r*/get_cur_genbuf()[1], 1);
1035                 if(t == -1)
1036                         error(Ebadsharp);
1037                 c = devtab[t]->attach(get_cur_genbuf()+n);
1038                 break;
1039
1040         default:
1041                 c = current->dot;
1042                 if (! c)
1043                         panic("no dot!");
1044                 kref_get(&c->ref, 1);
1045                 break;
1046         }
1047         prefix = name - aname;
1048
1049         e.name = NULL;
1050         e.elems = NULL;
1051         e.off = NULL;
1052         e.ARRAY_SIZEs = 0;
1053         if(waserror()){
1054                 cclose(c);
1055                 kfree(e.name);
1056                 kfree(e.elems);
1057                 kfree(e.off);
1058 //dumpmount();
1059                 nexterror();
1060         }
1061
1062         /*
1063          * Build a list of elements in the path.
1064          */
1065         parsename(name, &e);
1066
1067         /*
1068          * On create, ....
1069          */
1070         if(amode == Acreate){
1071                 /* perm must have DMDIR if last element is / or /. */
1072                 if(e.mustbedir && !(perm&DMDIR)){
1073                         npath = e.ARRAY_SIZEs;
1074                         strncpy(tmperrbuf,  "create without DMDIR", sizeof(tmperrbuf));
1075                         goto NameError;
1076                 }
1077
1078                 /* don't try to walk the last path element just yet. */
1079                 if(e.ARRAY_SIZEs == 0)
1080                         error(Eexist);
1081                 e.ARRAY_SIZEs--;
1082         }
1083
1084         if(walk(&c, e.elems, e.ARRAY_SIZEs, nomount, &npath) < 0){
1085                 if(npath < 0 || npath > e.ARRAY_SIZEs){
1086                         printd("namec %s walk error npath=%d\n", aname, npath);
1087                         error("walk failed");
1088                 }
1089         NameError:
1090                 error("some kinda name error");
1091                 /* brho: skipping the namec custom error string business, since it hides
1092                  * the underlying failure.  implement this if you want the old stuff. */
1093 #if 0
1094                 strncpy(tmperrbuf,  current->errstr, sizeof(tmperrbuf));
1095                 len = prefix+e.off[npath];
1096                 if(len < ERRMAX/3 || (name=memrchr(aname, '/', len))==NULL || name==aname)
1097                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "%.*s", len, aname);
1098                 else
1099                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "...%.*s", (int)(len-(name-aname)), name);
1100                 snprintf(current->errstr, ERRMAX, "%#q %s", get_cur_genbuf(), tmperrbuf);
1101 #endif
1102         }
1103
1104         if(e.mustbedir && !(c->qid.type&QTDIR)){
1105                 npath = e.ARRAY_SIZEs;
1106                 strncpy(tmperrbuf,  "not a directory", sizeof(tmperrbuf));
1107                 goto NameError;
1108         }
1109
1110         if(amode == Aopen && (omode&3) == OEXEC && (c->qid.type&QTDIR)){
1111                 npath = e.ARRAY_SIZEs;
1112                 error("cannot exec directory");
1113         }
1114
1115         switch(amode){
1116         case Aaccess:
1117                 if(!nomount)
1118                         domount(&c, NULL);
1119                 break;
1120
1121         case Abind:
1122                 m = NULL;
1123                 if(!nomount)
1124                         domount(&c, &m);
1125                 if(c->umh != NULL)
1126                         putmhead(c->umh);
1127                 c->umh = m;
1128                 break;
1129
1130         case Aremove:
1131         case Aopen:
1132         Open:
1133                 /* save the name; domount might change c */
1134                 cname = c->name;
1135                 kref_get(&cname->ref, 1);
1136                 m = NULL;
1137                 if(!nomount)
1138                         domount(&c, &m);
1139
1140                 /* our own copy to open or remove */
1141                 c = cunique(c);
1142
1143                 /* now it's our copy anyway, we can put the name back */
1144                 cnameclose(c->name);
1145                 c->name = cname;
1146
1147                 switch(amode){
1148                 case Aremove:
1149                         putmhead(m);
1150                         break;
1151
1152                 case Aopen:
1153                 case Acreate:
1154 if(c->umh != NULL){
1155         printd("cunique umh\n");
1156         putmhead(c->umh);
1157         c->umh = NULL;
1158 }
1159
1160                         /* only save the mount head if it's a multiple element union */
1161                         if(m && m->mount && m->mount->next)
1162                                 c->umh = m;
1163                         else
1164                                 putmhead(m);
1165
1166                         if(omode == OEXEC)
1167                                 c->flag &= ~CCACHE;
1168
1169                         c = devtab[c->type]->open(c, omode&~OCEXEC);
1170
1171                         if(omode & OCEXEC)
1172                                 c->flag |= CCEXEC;
1173                         if(omode & ORCLOSE)
1174                                 c->flag |= CRCLOSE;
1175                         break;
1176                 }
1177                 break;
1178
1179         case Atodir:
1180                 /*
1181                  * Directories (e.g. for cd) are left before the mount po int unused_int,
1182                  * so one may mount on / or . and see the effect.
1183                  */
1184                 if(!(c->qid.type & QTDIR))
1185                         error(Enotdir);
1186                 break;
1187
1188         case Amount:
1189                 /*
1190                  * When mounting on an already mounted upon directory,
1191                  * one wants subsequent mounts to be attached to the
1192                  * original directory, not the replacement.  Don't domount.
1193                  */
1194                 break;
1195
1196         case Acreate:
1197                 /*
1198                  * We've already walked all but the last element.
1199                  * If the last exists, try to open it OTRUNC.
1200                  * If omode&OEXCL is set, just give up.
1201                  */
1202                 e.ARRAY_SIZEs++;
1203                 if(walk(&c, e.elems+e.ARRAY_SIZEs-1, 1, nomount, NULL) == 0){
1204                         if(omode&OEXCL)
1205                                 error(Eexist);
1206                         omode |= OTRUNC;
1207                         goto Open;
1208                 }
1209
1210                 /*
1211                  * The semantics of the create(2) system call are that if the
1212                  * file exists and can be written, it is to be opened with truncation.
1213                  * On the other hand, the create(5) message fails if the file exists.
1214                  * If we get two create(2) calls happening simultaneously, 
1215                  * they might both get here and send create(5) messages, but only 
1216                  * one of the messages will succeed.  To provide the expected create(2)
1217                  * semantics, the call with the failed message needs to try the above
1218                  * walk again, opening for truncation.  This correctly solves the 
1219                  * create/create race, in the sense that any observable outcome can
1220                  * be explained as one happening before the other.
1221                  * The create/create race is quite common.  For example, it happens
1222                  * when two rc subshells simultaneously update the same
1223                  * environment variable.
1224                  *
1225                  * The implementation still admits a create/create/remove race:
1226                  * (A) walk to file, fails
1227                  * (B) walk to file, fails
1228                  * (A) create file, succeeds, returns 
1229                  * (B) create file, fails
1230                  * (A) remove file, succeeds, returns
1231                  * (B) walk to file, return failure.
1232                  *
1233                  * This is hardly as common as the create/create race, and is really
1234                  * not too much worse than what might happen if (B) got a hold of a
1235                  * file descriptor and then the file was removed -- either way (B) can't do
1236                  * anything with the result of the create call.  So we don't care about this race.
1237                  *
1238                  * Applications that care about more fine-grained decision of the races
1239                  * can use the OEXCL flag to get at the underlying create(5) semantics;
1240                  * by default we provide the common case.
1241                  *
1242                  * We need to stay behind the mount point in case we
1243                  * need to do the first walk again (should the create fail).
1244                  *
1245                  * We also need to cross the mount point and find the directory
1246                  * in the union in which we should be creating.
1247                  *
1248                  * The channel staying behind is c, the one moving forward is cnew.
1249                  */
1250                 m = NULL;
1251                 cnew = NULL;    /* is this assignment necessary? */
1252                 /* discard error */
1253                 if(!waserror()){        /* try create */
1254                         if(!nomount && findmount(&cnew, &m, c->type, c->dev, c->qid))
1255                                 cnew = createdir(cnew, m);
1256                         else{
1257                                 cnew = c;
1258                                 kref_get(&cnew->ref, 1);
1259                         }
1260
1261                         /*
1262                          * We need our own copy of the Chan because we're
1263                          * about to send a create, which will move it.  Once we have
1264                          * our own copy, we can fix the name, which might be wrong
1265                          * if findmount gave us a new Chan.
1266                          */
1267                         cnew = cunique(cnew);
1268                         cnameclose(cnew->name);
1269                         cnew->name = c->name;
1270                         kref_get(&cnew->name->ref, 1);
1271
1272                         devtab[cnew->type]->create(cnew, e.elems[e.ARRAY_SIZEs-1], omode&~(OEXCL|OCEXEC), perm);
1273                         poperror();
1274                         if(omode & OCEXEC)
1275                                 cnew->flag |= CCEXEC;
1276                         if(omode & ORCLOSE)
1277                                 cnew->flag |= CRCLOSE;
1278                         if(m)
1279                                 putmhead(m);
1280                         cclose(c);
1281                         c = cnew;
1282                         c->name = addelem(c->name, e.elems[e.ARRAY_SIZEs-1]);
1283                         break;
1284                 }
1285
1286                 /* create failed */
1287                 cclose(cnew);
1288                 if(m)
1289                         putmhead(m);
1290                 if(omode & OEXCL)
1291                         nexterror();    /* safe since we're in a waserror() */
1292                 poperror();             /* matching the if(!waserror) */
1293
1294                 /* save error, so walk doesn't clobber our existing errstr */         
1295                 strncpy(tmperrbuf, current_errstr(), MAX_ERRSTR_LEN);                 
1296                 /* note: we depend that walk does not error */
1297                 if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, nomount, NULL) < 0) {
1298                         error(tmperrbuf);   /* report the error we had originally */      
1299                 }
1300                 strncpy(current_errstr(), tmperrbuf, MAX_ERRSTR_LEN); 
1301                 omode |= OTRUNC;
1302                 goto Open;
1303
1304         default:
1305                 panic("unknown namec access %d\n", amode);
1306         }
1307
1308         poperror();
1309
1310         if(e.ARRAY_SIZEs > 0)
1311                 strncpy(get_cur_genbuf(), e.elems[e.ARRAY_SIZEs-1], GENBUF_SZ);
1312         else
1313                 strncpy(get_cur_genbuf(), ".", GENBUF_SZ);
1314
1315         kfree(e.name);
1316         kfree(e.elems);
1317         kfree(e.off);
1318
1319         return c;
1320 }
1321
1322 /*
1323  * name is valid. skip leading / and ./ as much as possible
1324  */
1325 char*
1326 skipslash(char *name)
1327 {
1328         while(name[0]=='/' || (name[0]=='.' && (name[1]==0 || name[1]=='/')))
1329                 name++;
1330         return name;
1331 }
1332
1333 char isfrog[256]={
1334         /*NUL*/ 1, 1, 1, 1, 1, 1, 1, 1,
1335         /*BKS*/ 1, 1, 1, 1, 1, 1, 1, 1,
1336         /*DLE*/ 1, 1, 1, 1, 1, 1, 1, 1,
1337         /*CAN*/ 1, 1, 1, 1, 1, 1, 1, 1,
1338         ['/']   1,
1339         [0x7f]  1,
1340 };
1341
1342 /*
1343  * Check that the name
1344  *  a) is in valid memory.
1345  *  b) is shorter than 2^16 bytes, so it can fit in a 9P string field.
1346  *  c) contains no frogs.
1347  * The first byte is known to be addressible by the requester, so the
1348  * routine works for kernel and user memory both.
1349  * The parameter slashok flags whether a slash character is an error
1350  * or a valid character.
1351  */
1352 void
1353 validname(char *aname, int slashok)
1354 {
1355         char *ename, *name;
1356         int c;
1357
1358         name = aname;
1359         ename = memchr(name, 0, (1<<16));
1360
1361         if(ename==NULL || ename-name>=(1<<16))
1362                 error("name too long");
1363
1364         while(*name){
1365                 /* all characters above '~' are ok */
1366                 c = *( uint8_t *)name;
1367 #if 0       
1368                 if(c >= Runeself)
1369                         name += chartorune(&r, name);
1370 #endif
1371                 if(c >= 0x7f){
1372                         error("Akaros doesn't do UTF-8");
1373                 } else {
1374                         if(isfrog[c])
1375                                 if(!slashok || c!='/'){
1376                                         error("%s: %q", Ebadchar, aname);
1377                         }
1378                         name++;
1379                 }
1380         }
1381 }
1382
1383 void
1384 isdir(struct chan *c)
1385 {
1386         if(c->qid.type & QTDIR)
1387                 return;
1388         error(Enotdir);
1389 }
1390
1391 /*
1392  * This is necessary because there are many
1393  * pointers to the top of a given mount list:
1394  *
1395  *      - the mhead in the namespace hash table
1396  *      - the mhead in chans returned from findmount:
1397  *        used in namec and then by unionread.
1398  *      - the mhead in chans returned from createdir:
1399  *        used in the open/create race protect, which is gone.
1400  *
1401  * The RWlock in the Mhead protects the mount list it contains.
1402  * The mount list is deleted when we cunmount.
1403  * The RWlock ensures that nothing is using the mount list at that time.
1404  *
1405  * It is okay to replace c->mh with whatever you want as 
1406  * long as you are sure you have a unique reference to it.
1407  *
1408  * This comment might belong somewhere else.
1409  */
1410 void
1411 putmhead(struct mhead *m)
1412 {
1413         if (m)
1414                 kref_put(&m->ref);
1415 }