Replace most uses of strncpy with strlcpy.
[akaros.git] / kern / src / ns / chan.c
1 /* Copyright © 1994-1999 Lucent Technologies Inc.  All rights reserved.
2  * Portions Copyright © 1997-1999 Vita Nuova Limited
3  * Portions Copyright © 2000-2007 Vita Nuova Holdings Limited
4  *                                (www.vitanuova.com)
5  * Revisions Copyright © 2000-2007 Lucent Technologies Inc. and others
6  *
7  * Modified for the Akaros operating system:
8  * Copyright (c) 2013-2014 The Regents of the University of California
9  * Copyright (c) 2013-2015 Google Inc.
10  *
11  * Permission is hereby granted, free of charge, to any person obtaining a copy
12  * of this software and associated documentation files (the "Software"), to deal
13  * in the Software without restriction, including without limitation the rights
14  * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
15  * copies of the Software, and to permit persons to whom the Software is
16  * furnished to do so, subject to the following conditions:
17  *
18  * The above copyright notice and this permission notice shall be included in
19  * all copies or substantial portions of the Software.
20  *
21  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
22  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
23  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL THE
24  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
25  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
26  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
27  * SOFTWARE. */
28
29 #include <vfs.h>
30 #include <kfs.h>
31 #include <slab.h>
32 #include <kmalloc.h>
33 #include <kref.h>
34 #include <string.h>
35 #include <stdio.h>
36 #include <assert.h>
37 #include <error.h>
38 #include <cpio.h>
39 #include <pmap.h>
40 #include <smp.h>
41 #include <syscall.h>
42
43 char *channame(struct chan *c)
44 {       /* DEBUGGING */
45         if (c == NULL)
46                 return "<NULL chan>";
47         if (c->name == NULL)
48                 return "<NULL name>";
49         if (c->name->s == NULL)
50                 return "<NULL name.s>";
51         return c->name->s;
52 }
53
54 enum {
55         CNAMESLOP = 20
56 };
57
58 struct {
59         spinlock_t lock;
60         int fid;
61         struct chan *free;
62         struct chan *list;
63 } chanalloc;
64
65 typedef struct Elemlist Elemlist;
66
67 struct Elemlist {
68         char *name;                                     /* copy of name, so '/' can be overwritten */
69         int ARRAY_SIZEs;
70         char **elems;
71         int *off;
72         int mustbedir;
73 };
74
75 #define SEP(c) ((c) == 0 || (c) == '/')
76 void cleancname(struct cname *);
77
78 int isdotdot(char *p)
79 {
80         return p[0] == '.' && p[1] == '.' && p[2] == '\0';
81 }
82
83 int emptystr(char *s)
84 {
85         if (s == NULL)
86                 return 1;
87         if (s[0] == '\0')
88                 return 1;
89         return 0;
90 }
91
92 /*
93  * Atomically replace *p with copy of s
94  */
95 void kstrdup(char **p, char *s)
96 {
97         int n;
98         char *t, *prev;
99
100         n = strlen(s) + 1;
101         /* if it's a user, we can wait for memory; if not, something's very wrong */
102         if (current) {
103                 t = kzmalloc(n, 0);
104         } else {
105                 t = kzmalloc(n, 0);
106                 if (t == NULL)
107                         panic("kstrdup: no memory");
108         }
109         memmove(t, s, n);
110         prev = *p;
111         *p = t;
112         kfree(prev);
113 }
114
115 void chandevreset(void)
116 {
117         int i;
118
119         for (i = 0; &devtab[i] < __devtabend; i++)
120                 devtab[i].reset();
121 }
122
123 void chandevinit(void)
124 {
125         int i;
126
127         for (i = 0; &devtab[i] < __devtabend; i++)
128                 devtab[i].init();
129 }
130
131 void chandevshutdown(void)
132 {
133         int i;
134
135         /* shutdown in reverse order */
136         for (i = 0; &devtab[i] < __devtabend; i++) ;
137         for (i--; i >= 0; i--)
138                 devtab[i].shutdown();
139 }
140
141 static void chan_release(struct kref *kref)
142 {
143         struct chan *c = container_of(kref, struct chan, ref);
144         ERRSTACK(1);
145         /* this style discards the error from close().  picture it as
146          * if (waserror()) { } else { close(); } chanfree_no_matter_what();  */
147         if (!waserror()) {
148                 printd("releasing chan %p, type %d\n", c, c->type);
149                 /* -1 means there is no dev yet.  wants a noop for close() */
150                 if (c->type != -1)
151                         devtab[c->type].close(c);
152         }
153         /* need to poperror regardless of whether we error'd or not */
154         poperror();
155         /* and chan free no matter what */
156         chanfree(c);
157 }
158
159 struct chan *newchan(void)
160 {
161         struct chan *c;
162
163         spin_lock(&(&chanalloc)->lock);
164         c = chanalloc.free;
165         if (c != 0)
166                 chanalloc.free = c->next;
167         spin_unlock(&(&chanalloc)->lock);
168
169         if (c == NULL) {
170                 c = kzmalloc(sizeof(struct chan), 0);
171                 spin_lock(&(&chanalloc)->lock);
172                 c->fid = ++chanalloc.fid;
173                 c->link = chanalloc.list;
174                 chanalloc.list = c;
175                 spin_unlock(&(&chanalloc)->lock);
176                 spinlock_init(&c->lock);
177                 qlock_init(&c->umqlock);
178         }
179
180         /* if you get an error before associating with a dev, cclose skips calling
181          * the dev's close */
182         c->type = -1;
183         c->flag = 0;
184         kref_init(&c->ref, chan_release, 1);
185         c->dev = 0;
186         c->offset = 0;
187         c->iounit = 0;
188         c->umh = 0;
189         c->uri = 0;
190         c->dri = 0;
191         c->aux = 0;
192         c->mchan = 0;
193         c->mcp = 0;
194         c->mux = 0;
195         c->mqid.path = 0;
196         c->mqid.vers = 0;
197         c->mqid.type = 0;
198         c->name = 0;
199         c->buf = NULL;
200         c->mountpoint = NULL;
201         return c;
202 }
203
204 static void __cname_release(struct kref *kref)
205 {
206         struct cname *n = container_of(kref, struct cname, ref);
207         kfree(n->s);
208         kfree(n);
209 }
210
211 struct cname *newcname(char *s)
212 {
213         struct cname *n;
214         int i;
215
216         n = kzmalloc(sizeof(*n), 0);
217         i = strlen(s);
218         n->len = i;
219         n->alen = i + CNAMESLOP;
220         n->s = kzmalloc(n->alen, 0);
221         memmove(n->s, s, i + 1);
222         kref_init(&n->ref, __cname_release, 1);
223         return n;
224 }
225
226 void cnameclose(struct cname *n)
227 {
228         if (n == NULL)
229                 return;
230         kref_put(&n->ref);
231 }
232
233 struct cname *addelem(struct cname *n, char *s)
234 {
235         int i, a;
236         char *t;
237         struct cname *new;
238
239         if (s[0] == '.' && s[1] == '\0')
240                 return n;
241
242         if (kref_refcnt(&n->ref) > 1) {
243                 /* copy on write */
244                 new = newcname(n->s);
245                 cnameclose(n);
246                 n = new;
247         }
248
249         i = strlen(s);
250         if (n->len + 1 + i + 1 > n->alen) {
251                 a = n->len + 1 + i + 1 + CNAMESLOP;
252                 t = kzmalloc(a, 0);
253                 memmove(t, n->s, n->len + 1);
254                 kfree(n->s);
255                 n->s = t;
256                 n->alen = a;
257         }
258         if (n->len > 0 && n->s[n->len - 1] != '/' && s[0] != '/')       /* don't insert extra slash if one is present */
259                 n->s[n->len++] = '/';
260         memmove(n->s + n->len, s, i + 1);
261         n->len += i;
262         if (isdotdot(s))
263                 cleancname(n);
264         return n;
265 }
266
267 void chanfree(struct chan *c)
268 {
269         c->flag = CFREE;
270
271         if (c->umh != NULL) {
272                 putmhead(c->umh);
273                 c->umh = NULL;
274         }
275         if (c->umc != NULL) {
276                 cclose(c->umc);
277                 c->umc = NULL;
278         }
279         if (c->mux != NULL) {
280                 //
281                 muxclose(c->mux);
282                 c->mux = NULL;
283         }
284         if (c->mchan != NULL) {
285                 cclose(c->mchan);
286                 c->mchan = NULL;
287         }
288
289         cnameclose(c->name);
290         if (c->buf)
291                 kfree(c->buf);
292         c->buf = NULL;
293         c->bufused = 0;
294         c->ateof = 0;
295
296         spin_lock(&(&chanalloc)->lock);
297         c->next = chanalloc.free;
298         chanalloc.free = c;
299         spin_unlock(&(&chanalloc)->lock);
300 }
301
302 void cclose(struct chan *c)
303 {
304         if (c == 0)
305                 return;
306
307         if (c->flag & CFREE)
308                 panic("cclose %p", getcallerpc(&c));
309
310         kref_put(&c->ref);
311 }
312
313 /* convenience wrapper for interposition.  if you do use this, don't forget
314  * about the kref_get_not_zero in plan9setup() */
315 void chan_incref(struct chan *c)
316 {
317         kref_get(&c->ref, 1);
318 }
319
320 /*
321  * Make sure we have the only copy of c.  (Copy on write.)
322  */
323 struct chan *cunique(struct chan *c)
324 {
325         struct chan *nc;
326
327         if (kref_refcnt(&c->ref) != 1) {
328                 nc = cclone(c);
329                 cclose(c);
330                 c = nc;
331         }
332
333         return c;
334 }
335
336 int eqqid(struct qid a, struct qid b)
337 {
338         return a.path == b.path && a.vers == b.vers;
339 }
340
341 int eqchan(struct chan *a, struct chan *b, int pathonly)
342 {
343         if (a->qid.path != b->qid.path)
344                 return 0;
345         if (!pathonly && a->qid.vers != b->qid.vers)
346                 return 0;
347         if (a->type != b->type)
348                 return 0;
349         if (a->dev != b->dev)
350                 return 0;
351         return 1;
352 }
353
354 int eqchantdqid(struct chan *a, int type, int dev, struct qid qid, int pathonly)
355 {
356         if (a->qid.path != qid.path)
357                 return 0;
358         if (!pathonly && a->qid.vers != qid.vers)
359                 return 0;
360         if (a->type != type)
361                 return 0;
362         if (a->dev != dev)
363                 return 0;
364         return 1;
365 }
366
367 static void mh_release(struct kref *kref)
368 {
369         struct mhead *mh = container_of(kref, struct mhead, ref);
370         mh->mount = (struct mount *)0xCafeBeef;
371         kfree(mh);
372 }
373
374 struct mhead *newmhead(struct chan *from)
375 {
376         struct mhead *mh;
377
378         mh = kzmalloc(sizeof(struct mhead), 0);
379         kref_init(&mh->ref, mh_release, 1);
380         rwinit(&mh->lock);
381         mh->from = from;
382         chan_incref(from);
383
384 /*
385         n = from->name->len;
386         if(n >= sizeof(mh->fromname))
387                 n = sizeof(mh->fromname)-1;
388         memmove(mh->fromname, from->name->s, n);
389         mh->fromname[n] = 0;
390 */
391         return mh;
392 }
393
394 int cmount(struct chan *new, struct chan *old, int flag, char *spec)
395 {
396         ERRSTACK(1);
397         struct pgrp *pg;
398         int order, flg;
399         struct mhead *m, **l, *mh;
400         struct mount *nm, *f, *um, **h;
401
402         if (QTDIR & (old->qid.type ^ new->qid.type))
403                 error(EINVAL, NULL);
404
405         if (old->umh)
406                 printd("cmount old extra umh\n");
407
408         order = flag & MORDER;
409
410         if ((old->qid.type & QTDIR) == 0 && order != MREPL)
411                 error(EINVAL, NULL);
412
413         mh = new->umh;
414
415         /*
416          * Not allowed to bind when the old directory
417          * is itself a union.  (Maybe it should be allowed, but I don't see
418          * what the semantics would be.)
419          *
420          * We need to check mh->mount->next to tell unions apart from
421          * simple mount points, so that things like
422          *  mount -c fd /root
423          *  bind -c /root /
424          * work.  The check of mount->mflag catches things like
425          *  mount fd /root
426          *  bind -c /root /
427          *
428          * This is far more complicated than it should be, but I don't
429          * see an easier way at the moment.     -rsc
430          */
431         if ((flag & MCREATE) && mh && mh->mount
432                 && (mh->mount->next || !(mh->mount->mflag & MCREATE)))
433                 error(EEXIST, NULL);
434
435         pg = current->pgrp;
436         wlock(&pg->ns);
437
438         l = &MOUNTH(pg, old->qid);
439         for (m = *l; m; m = m->hash) {
440                 if (eqchan(m->from, old, 1))
441                         break;
442                 l = &m->hash;
443         }
444
445         if (m == NULL) {
446                 /*
447                  *  nothing mounted here yet.  create a mount
448                  *  head and add to the hash table.
449                  */
450                 m = newmhead(old);
451                 *l = m;
452
453                 /*
454                  *  if this is a union mount, add the old
455                  *  node to the mount chain.
456                  */
457                 if (order != MREPL)
458                         m->mount = newmount(m, old, 0, 0);
459         }
460         wlock(&m->lock);
461         if (waserror()) {
462                 wunlock(&m->lock);
463                 nexterror();
464         }
465         wunlock(&pg->ns);
466
467         nm = newmount(m, new, flag, spec);
468         if (mh != NULL && mh->mount != NULL) {
469                 /*
470                  *  copy a union when binding it onto a directory
471                  */
472                 flg = order;
473                 if (order == MREPL)
474                         flg = MAFTER;
475                 h = &nm->next;
476                 um = mh->mount;
477                 for (um = um->next; um; um = um->next) {
478                         f = newmount(m, um->to, flg, um->spec);
479                         *h = f;
480                         h = &f->next;
481                 }
482         }
483
484         if (m->mount && order == MREPL) {
485                 mountfree(m->mount);
486                 m->mount = 0;
487         }
488
489         if (flag & MCREATE)
490                 nm->mflag |= MCREATE;
491
492         if (m->mount && order == MAFTER) {
493                 for (f = m->mount; f->next; f = f->next) ;
494                 f->next = nm;
495         } else {
496                 for (f = nm; f->next; f = f->next) ;
497                 f->next = m->mount;
498                 m->mount = nm;
499         }
500
501         wunlock(&m->lock);
502         poperror();
503         return nm->mountid;
504 }
505
506 void cunmount(struct chan *mnt, struct chan *mounted)
507 {
508         struct pgrp *pg;
509         struct mhead *m, **l;
510         struct mount *f, **p;
511
512         if (mnt->umh)   /* should not happen */
513                 printd("cunmount newp extra umh %p has %p\n", mnt, mnt->umh);
514
515         /*
516          * It _can_ happen that mounted->umh is non-NULL,
517          * because mounted is the result of namec(Aopen)
518          * (see sysfile.c:/^sysunmount).
519          * If we open a union directory, it will have a umh.
520          * Although surprising, this is okay, since the
521          * cclose will take care of freeing the umh.
522          */
523
524         pg = current->pgrp;
525         wlock(&pg->ns);
526
527         l = &MOUNTH(pg, mnt->qid);
528         for (m = *l; m; m = m->hash) {
529                 if (eqchan(m->from, mnt, 1))
530                         break;
531                 l = &m->hash;
532         }
533
534         if (m == 0) {
535                 wunlock(&pg->ns);
536                 error(ENOENT, NULL);
537         }
538
539         wlock(&m->lock);
540         if (mounted == 0) {
541                 *l = m->hash;
542                 wunlock(&pg->ns);
543                 mountfree(m->mount);
544                 m->mount = NULL;
545                 cclose(m->from);
546                 wunlock(&m->lock);
547                 putmhead(m);
548                 return;
549         }
550
551         p = &m->mount;
552         for (f = *p; f; f = f->next) {
553                 /* BUG: Needs to be 2 pass */
554                 if (eqchan(f->to, mounted, 1) ||
555                         (f->to->mchan && eqchan(f->to->mchan, mounted, 1))) {
556                         *p = f->next;
557                         f->next = 0;
558                         mountfree(f);
559                         if (m->mount == NULL) {
560                                 *l = m->hash;
561                                 cclose(m->from);
562                                 wunlock(&m->lock);
563                                 wunlock(&pg->ns);
564                                 putmhead(m);
565                                 return;
566                         }
567                         wunlock(&m->lock);
568                         wunlock(&pg->ns);
569                         return;
570                 }
571                 p = &f->next;
572         }
573         wunlock(&m->lock);
574         wunlock(&pg->ns);
575         error(ENOENT, NULL);
576 }
577
578 struct chan *cclone(struct chan *c)
579 {
580         struct chan *nc;
581         struct walkqid *wq;
582
583         wq = devtab[c->type].walk(c, NULL, NULL, 0);
584         if (wq == NULL)
585                 error(EFAIL, "clone failed");
586         nc = wq->clone;
587         kfree(wq);
588         nc->name = c->name;
589         if (c->name)
590                 kref_get(&c->name->ref, 1);
591         return nc;
592 }
593
594 int
595 findmount(struct chan **cp,
596                   struct mhead **mp, int type, int dev, struct qid qid)
597 {
598         struct pgrp *pg;
599         struct mhead *m;
600
601         pg = current->pgrp;
602         rlock(&pg->ns);
603         for (m = MOUNTH(pg, qid); m; m = m->hash) {
604                 rlock(&m->lock);
605                 if (m->from == NULL) {
606                         printd("m %p m->from 0\n", m);
607                         runlock(&m->lock);
608                         continue;
609                 }
610                 if (eqchantdqid(m->from, type, dev, qid, 1)) {
611                         runlock(&pg->ns);
612                         if (mp != NULL) {
613                                 kref_get(&m->ref, 1);
614                                 if (*mp != NULL)
615                                         putmhead(*mp);
616                                 *mp = m;
617                         }
618                         if (*cp != NULL)
619                                 cclose(*cp);
620                         chan_incref(m->mount->to);
621                         *cp = m->mount->to;
622                         runlock(&m->lock);
623                         return 1;
624                 }
625                 runlock(&m->lock);
626         }
627
628         runlock(&pg->ns);
629         return 0;
630 }
631
632 int domount(struct chan **cp, struct mhead **mp)
633 {
634         return findmount(cp, mp, (*cp)->type, (*cp)->dev, (*cp)->qid);
635 }
636
637 struct chan *undomount(struct chan *c, struct cname *name)
638 {
639         ERRSTACK(1);
640         struct chan *nc;
641         struct pgrp *pg;
642         struct mount *t;
643         struct mhead **h, **he, *f;
644
645         pg = current->pgrp;
646         rlock(&pg->ns);
647         if (waserror()) {
648                 runlock(&pg->ns);
649                 nexterror();
650         }
651
652         he = &pg->mnthash[MNTHASH];
653         for (h = pg->mnthash; h < he; h++) {
654                 for (f = *h; f; f = f->hash) {
655                         if (strcmp(f->from->name->s, name->s) != 0)
656                                 continue;
657                         for (t = f->mount; t; t = t->next) {
658                                 if (eqchan(c, t->to, 1)) {
659                                         /*
660                                          * We want to come out on the left hand side of the mount
661                                          * point using the element of the union that we entered on.
662                                          * To do this, find the element that has a from name of
663                                          * c->name->s.
664                                          */
665                                         if (strcmp(t->head->from->name->s, name->s) != 0)
666                                                 continue;
667                                         nc = t->head->from;
668                                         chan_incref(nc);
669                                         cclose(c);
670                                         c = nc;
671                                         break;
672                                 }
673                         }
674                 }
675         }
676         poperror();
677         runlock(&pg->ns);
678         return c;
679 }
680
681 /*
682  * Either walks all the way or not at all.  No partial results in *cp.
683  * *nerror is the number of names to display in an error message.
684  */
685 static char Edoesnotexist[] = "does not exist";
686 int walk(struct chan **cp, char **names, int nnames, bool can_mount, int *nerror)
687 {
688         int dev, dotdot, i, n, nhave, ntry, type;
689         struct chan *c, *nc, *lastmountpoint = NULL;
690         struct cname *cname;
691         struct mount *f;
692         struct mhead *mh, *nmh;
693         struct walkqid *wq;
694
695         c = *cp;
696         chan_incref(c);
697         cname = c->name;
698         kref_get(&cname->ref, 1);
699         mh = NULL;
700
701         /*
702          * While we haven't gotten all the way down the path:
703          *    1. step through a mount point, if any
704          *    2. send a walk request for initial dotdot or initial prefix without dotdot
705          *    3. move to the first mountpoint along the way.
706          *    4. repeat.
707          *
708          * An invariant is that each time through the loop, c is on the undomount
709          * side of the mount point, and c's name is cname.
710          */
711         for (nhave = 0; nhave < nnames; nhave += n) {
712                 if ((c->qid.type & QTDIR) == 0) {
713                         if (nerror)
714                                 *nerror = nhave;
715                         cnameclose(cname);
716                         cclose(c);
717                         set_error(ENOTDIR, NULL);
718                         if (mh != NULL)
719                                 putmhead(mh);
720                         return -1;
721                 }
722                 ntry = nnames - nhave;
723                 if (ntry > MAXWELEM)
724                         ntry = MAXWELEM;
725                 dotdot = 0;
726                 for (i = 0; i < ntry; i++) {
727                         if (isdotdot(names[nhave + i])) {
728                                 if (i == 0) {
729                                         dotdot = 1;
730                                         ntry = 1;
731                                 } else
732                                         ntry = i;
733                                 break;
734                         }
735                 }
736
737                 if (!dotdot && can_mount)
738                         domount(&c, &mh);
739
740                 type = c->type;
741                 dev = c->dev;
742
743                 if ((wq = devtab[type].walk(c, NULL, names + nhave, ntry)) == NULL) {
744                         /* try a union mount, if any */
745                         if (mh && can_mount) {
746                                 /*
747                                  * mh->mount == c, so start at mh->mount->next
748                                  */
749                                 rlock(&mh->lock);
750                                 for (f = mh->mount->next; f; f = f->next)
751                                         if ((wq =
752                                                  devtab[f->to->type].walk(f->to, NULL, names + nhave,
753                                                                                                   ntry)) != NULL)
754                                                 break;
755                                 runlock(&mh->lock);
756                                 if (f != NULL) {
757                                         type = f->to->type;
758                                         dev = f->to->dev;
759                                 }
760                         }
761                         if (wq == NULL) {
762                                 cclose(c);
763                                 cnameclose(cname);
764                                 if (nerror)
765                                         *nerror = nhave + 1;
766                                 if (mh != NULL)
767                                         putmhead(mh);
768                                 return -1;
769                         }
770                 }
771
772                 nmh = NULL;
773                 if (dotdot) {
774                         assert(wq->nqid == 1);
775                         assert(wq->clone != NULL);
776
777                         cname = addelem(cname, "..");
778                         nc = undomount(wq->clone, cname);
779                         n = 1;
780                 } else {
781                         nc = NULL;
782                         if (can_mount)
783                                 for (i = 0; i < wq->nqid && i < ntry - 1; i++)
784                                         if (findmount(&nc, &nmh, type, dev, wq->qid[i]))
785                                                 break;
786                         if (nc == NULL) {       /* no mount points along path */
787                                 if (wq->clone == NULL) {
788                                         cclose(c);
789                                         cnameclose(cname);
790                                         if (wq->nqid == 0 || (wq->qid[wq->nqid - 1].type & QTDIR)) {
791                                                 if (nerror)
792                                                         *nerror = nhave + wq->nqid + 1;
793                                                 set_errstr(Edoesnotexist);
794                                         } else {
795                                                 if (nerror)
796                                                         *nerror = nhave + wq->nqid;
797                                                 set_errstr(errno_to_string(ENOTDIR));
798                                         }
799                                         kfree(wq);
800                                         if (mh != NULL)
801                                                 putmhead(mh);
802                                         return -1;
803                                 }
804                                 n = wq->nqid;
805                                 nc = wq->clone;
806                         } else {        /* stopped early, at a mount point */
807                                 if (wq->clone != NULL) {
808                                         cclose(wq->clone);
809                                         wq->clone = NULL;
810                                 }
811                                 lastmountpoint = nc;
812                                 n = i + 1;
813                         }
814                         for (i = 0; i < n; i++)
815                                 cname = addelem(cname, names[nhave + i]);
816                 }
817                 cclose(c);
818                 c = nc;
819                 putmhead(mh);
820                 mh = nmh;
821                 kfree(wq);
822         }
823
824         putmhead(mh);
825
826         c = cunique(c);
827
828         if (c->umh != NULL) {   //BUG
829                 printd("walk umh\n");
830                 putmhead(c->umh);
831                 c->umh = NULL;
832         }
833
834         cnameclose(c->name);
835         c->name = cname;
836         c->mountpoint = lastmountpoint;
837
838         cclose(*cp);
839         *cp = c;
840         if (nerror)
841                 *nerror = 0;
842         return 0;
843 }
844
845 /*
846  * c is a mounted non-creatable directory.  find a creatable one.
847  */
848 struct chan *createdir(struct chan *c, struct mhead *m)
849 {
850         ERRSTACK(1);
851         struct chan *nc;
852         struct mount *f;
853
854         rlock(&m->lock);
855         if (waserror()) {
856                 runlock(&m->lock);
857                 nexterror();
858         }
859         for (f = m->mount; f; f = f->next) {
860                 if (f->mflag & MCREATE) {
861                         nc = cclone(f->to);
862                         runlock(&m->lock);
863                         poperror();
864                         cclose(c);
865                         return nc;
866                 }
867         }
868         error(EPERM, NULL);
869         poperror();
870         return 0;
871 }
872
873 /*
874  * In place, rewrite name to compress multiple /, eliminate ., and process ..
875  */
876 void cleancname(struct cname *n)
877 {
878         char *p;
879
880         if (n->s[0] == '#') {
881                 p = strchr(n->s, '/');
882                 if (p == NULL)
883                         return;
884                 cleanname(p);
885
886                 /*
887                  * The correct name is #i rather than #i/,
888                  * but the correct name of #/ is #/.
889                  */
890                 if (strcmp(p, "/") == 0 && n->s[1] != '/')
891                         *p = '\0';
892         } else
893                 cleanname(n->s);
894         n->len = strlen(n->s);
895 }
896
897 static void growparse(Elemlist * e)
898 {
899         char **new;
900         int *inew;
901         enum { Delta = 8 };
902
903         if (e->ARRAY_SIZEs % Delta == 0) {
904                 new = kzmalloc((e->ARRAY_SIZEs + Delta) * sizeof(char *), 0);
905                 memmove(new, e->elems, e->ARRAY_SIZEs * sizeof(char *));
906                 kfree(e->elems);
907                 e->elems = new;
908                 inew = kzmalloc((e->ARRAY_SIZEs + Delta + 1) * sizeof(int), 0);
909                 memmove(inew, e->off, e->ARRAY_SIZEs * sizeof(int));
910                 kfree(e->off);
911                 e->off = inew;
912         }
913 }
914
915 /*
916  * The name is known to be valid.
917  * Copy the name so slashes can be overwritten.
918  * An empty string will set ARRAY_SIZE=0.
919  * A path ending in / or /. or /.//./ etc. will have
920  * e.mustbedir = 1, so that we correctly
921  * reject, e.g., "/adm/users/." when /adm/users is a file
922  * rather than a directory.
923  */
924 static void parsename(char *name, Elemlist * e)
925 {
926         char *slash;
927
928         kstrdup(&e->name, name);
929         name = e->name;
930         e->ARRAY_SIZEs = 0;
931         e->elems = NULL;
932         e->off = kzmalloc(sizeof(int), 0);
933         e->off[0] = skipslash(name) - name;
934         for (;;) {
935                 name = skipslash(name);
936                 if (*name == '\0') {
937                         e->mustbedir = 1;
938                         break;
939                 }
940                 growparse(e);
941
942                 e->elems[e->ARRAY_SIZEs++] = name;
943                 /* we may want to do this again some day
944                    slash = utfrune(name, '/');
945                  */
946                 slash = strchr(name, '/');
947                 if (slash == NULL) {
948                         e->off[e->ARRAY_SIZEs] = name + strlen(name) - e->name;
949                         e->mustbedir = 0;
950                         break;
951                 }
952                 e->off[e->ARRAY_SIZEs] = slash - e->name;
953                 *slash++ = '\0';
954                 name = slash;
955         }
956 }
957
958 void *memrchr(void *va, int c, long n)
959 {
960         uint8_t *a, *e;
961
962         a = va;
963         for (e = a + n - 1; e > a; e--)
964                 if (*e == c)
965                         return e;
966         return NULL;
967 }
968
969 /*
970  * Turn a name into a channel.
971  * &name[0] is known to be a valid address.  It may be a kernel address.
972  *
973  * Opening with amode Aopen, Acreate, or Aremove guarantees
974  * that the result will be the only reference to that particular fid.
975  * This is necessary since we might pass the result to
976  * devtab[].remove().
977  *
978  * Opening Atodir, Amount, or Aaccess does not guarantee this.
979  *
980  * Opening Aaccess can, under certain conditions, return a
981  * correct Chan* but with an incorrect struct cname attached.
982  * Since the functions that open Aaccess (sysstat, syswstat, sys_stat)
983  * do not use the struct cname*, this avoids an unnecessary clone.
984  *
985  * Acreatechan will never open. It will do all the tests and return a chan
986  * for the directory where an open will succeed.
987  *
988  * The classic namec() is broken into a front end to get the starting point and
989  * a __namec_from, which does the guts of the lookup.  */
990 static struct chan *__namec_from(struct chan *c, char *aname, int amode,
991                                  int omode, uint32_t perm, bool can_mount)
992 {
993         ERRSTACK(2);
994         int len, npath;
995         struct chan *cnew;
996         struct cname *cname;
997         Elemlist e;
998         struct mhead *m;
999         char tmperrbuf[ERRMAX];
1000         int saved_errno;
1001         // Rune r;
1002
1003         static_assert(!(CINTERNAL_FLAGS & CEXTERNAL_FLAGS));
1004
1005         e.name = NULL;
1006         e.elems = NULL;
1007         e.off = NULL;
1008         e.ARRAY_SIZEs = 0;
1009         if (waserror()) {
1010                 cclose(c);
1011                 kfree(e.name);
1012                 kfree(e.elems);
1013                 kfree(e.off);
1014                 //dumpmount();
1015                 nexterror();
1016         }
1017
1018         /*
1019          * Build a list of elements in the path.
1020          */
1021         parsename(aname, &e);
1022
1023         /*
1024          * On create, ....
1025          */
1026         if ((amode == Acreate) || (amode == Acreatechan)) {
1027                 /* perm must have DMDIR if last element is / or /. */
1028                 if (e.mustbedir && !(perm & DMDIR)) {
1029                         npath = e.ARRAY_SIZEs;
1030                         strlcpy(tmperrbuf, "create without DMDIR", sizeof(tmperrbuf));
1031                         goto NameError;
1032                 }
1033
1034                 /* don't try to walk the last path element just yet. */
1035                 if (e.ARRAY_SIZEs == 0)
1036                         error(EEXIST, NULL);
1037                 e.ARRAY_SIZEs--;
1038         }
1039
1040         if (walk(&c, e.elems, e.ARRAY_SIZEs, can_mount, &npath) < 0) {
1041                 if (npath < 0 || npath > e.ARRAY_SIZEs) {
1042                         printd("namec %s walk error npath=%d\n", aname, npath);
1043                         error(EFAIL, "walk failed");
1044                 }
1045 NameError:
1046                 if (current_errstr()[0]) {
1047                         /* errstr is set, we'll just stick with it and error out */
1048                         longjmp(&get_cur_errbuf()->jmpbuf, 1);
1049                 } else {
1050                         error(EFAIL, "Name to chan lookup failed");
1051                 }
1052                 /* brho: skipping the namec custom error string business, since it hides
1053                  * the underlying failure.  implement this if you want the old stuff. */
1054 #if 0
1055                 strlcpy(tmperrbuf, current->errstr, sizeof(tmperrbuf));
1056                 len = prefix + e.off[npath]; // prefix was name - aname, the start pt
1057                 if (len < ERRMAX / 3 || (name = memrchr(aname, '/', len)) == NULL
1058                         || name == aname)
1059                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "%.*s", len,
1060                                          aname);
1061                 else
1062                         snprintf(get_cur_genbuf(), sizeof current->genbuf, "...%.*s",
1063                                          (int)(len - (name - aname)), name);
1064                 snprintf(current->errstr, ERRMAX, "%#q %s", get_cur_genbuf(),
1065                                  tmperrbuf);
1066 #endif
1067         }
1068
1069         if (e.mustbedir && !(c->qid.type & QTDIR)) {
1070                 npath = e.ARRAY_SIZEs;
1071                 strlcpy(tmperrbuf, "not a directory", sizeof(tmperrbuf));
1072                 goto NameError;
1073         }
1074
1075         if ((amode == Aopen) && (omode & O_EXEC) && (c->qid.type & QTDIR)) {
1076                 npath = e.ARRAY_SIZEs;
1077                 error(EFAIL, "cannot exec directory");
1078         }
1079
1080         switch (amode) {
1081                 case Aaccess:
1082                         if (can_mount)
1083                                 domount(&c, NULL);
1084                         break;
1085
1086                 case Abind:
1087                         m = NULL;
1088                         if (can_mount)
1089                                 domount(&c, &m);
1090                         if (c->umh != NULL)
1091                                 putmhead(c->umh);
1092                         c->umh = m;
1093                         break;
1094
1095                 case Aremove:
1096                 case Aopen:
1097 Open:
1098                         /* save the name; domount might change c */
1099                         cname = c->name;
1100                         kref_get(&cname->ref, 1);
1101                         m = NULL;
1102                         if (can_mount)
1103                                 domount(&c, &m);
1104
1105                         /* our own copy to open or remove */
1106                         c = cunique(c);
1107
1108                         /* now it's our copy anyway, we can put the name back */
1109                         cnameclose(c->name);
1110                         c->name = cname;
1111
1112                         switch (amode) {
1113                                 case Aremove:
1114                                         putmhead(m);
1115                                         break;
1116
1117                                 case Aopen:
1118                                 case Acreate:
1119                                         if (c->umh != NULL) {
1120                                                 printd("cunique umh\n");
1121                                                 putmhead(c->umh);
1122                                                 c->umh = NULL;
1123                                         }
1124
1125                                         /* only save the mount head if it's a multiple element union */
1126                                         if (m && m->mount && m->mount->next)
1127                                                 c->umh = m;
1128                                         else
1129                                                 putmhead(m);
1130                                         if (omode == O_EXEC)
1131                                                 c->flag &= ~CCACHE;
1132                                         /* here is where convert omode/vfs flags to c->flags.
1133                                          * careful, O_CLOEXEC and O_REMCLO are in there.  might need
1134                                          * to change that. */
1135                                         c->flag |= omode & CEXTERNAL_FLAGS;
1136                                         c = devtab[c->type].open(c,
1137                                                                  omode & ~O_CLOEXEC);
1138                                         /* if you get this from a dev, in the dev's open, you are
1139                                          * probably saving mode directly, without passing it through
1140                                          * openmode. */
1141                                         if (c->mode & O_TRUNC)
1142                                                 error(EFAIL, "Device %s open failed to clear O_TRUNC",
1143                                                       devtab[c->type].name);
1144                                         break;
1145                         }
1146                         break;
1147
1148                 case Atodir:
1149                         /*
1150                          * Directories (e.g. for cd) are left before the mount point,
1151                          * so one may mount on / or . and see the effect.
1152                          */
1153                         if (!(c->qid.type & QTDIR))
1154                                 error(ENOTDIR, NULL);
1155                         break;
1156
1157                 case Amount:
1158                         /*
1159                          * When mounting on an already mounted upon directory,
1160                          * one wants subsequent mounts to be attached to the
1161                          * original directory, not the replacement.  Don't domount.
1162                          */
1163                         break;
1164
1165                 case Acreatechan:
1166                         /*
1167                          * We've walked to the place where it *could* be created.
1168                          * Return that chan.
1169                          */
1170                         break;
1171
1172                 case Acreate:
1173                         /*
1174                          * We've already walked all but the last element.
1175                          * If the last exists, try to open it OTRUNC.
1176                          * If omode&OEXCL is set, just give up.
1177                          */
1178                         e.ARRAY_SIZEs++;
1179                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, can_mount, NULL) == 0) {
1180                                 if (omode & O_EXCL)
1181                                         error(EEXIST, NULL);
1182                                 omode |= O_TRUNC;
1183                                 goto Open;
1184                         }
1185
1186                         /*
1187                          * The semantics of the create(2) system call are that if the
1188                          * file exists and can be written, it is to be opened with truncation.
1189                          * On the other hand, the create(5) message fails if the file exists.
1190                          * If we get two create(2) calls happening simultaneously,
1191                          * they might both get here and send create(5) messages, but only
1192                          * one of the messages will succeed.  To provide the expected create(2)
1193                          * semantics, the call with the failed message needs to try the above
1194                          * walk again, opening for truncation.  This correctly solves the
1195                          * create/create race, in the sense that any observable outcome can
1196                          * be explained as one happening before the other.
1197                          * The create/create race is quite common.  For example, it happens
1198                          * when two rc subshells simultaneously update the same
1199                          * environment variable.
1200                          *
1201                          * The implementation still admits a create/create/remove race:
1202                          * (A) walk to file, fails
1203                          * (B) walk to file, fails
1204                          * (A) create file, succeeds, returns
1205                          * (B) create file, fails
1206                          * (A) remove file, succeeds, returns
1207                          * (B) walk to file, return failure.
1208                          *
1209                          * This is hardly as common as the create/create race, and is really
1210                          * not too much worse than what might happen if (B) got a hold of a
1211                          * file descriptor and then the file was removed -- either way (B) can't do
1212                          * anything with the result of the create call.  So we don't care about this race.
1213                          *
1214                          * Applications that care about more fine-grained decision of the races
1215                          * can use the OEXCL flag to get at the underlying create(5) semantics;
1216                          * by default we provide the common case.
1217                          *
1218                          * We need to stay behind the mount point in case we
1219                          * need to do the first walk again (should the create fail).
1220                          *
1221                          * We also need to cross the mount point and find the directory
1222                          * in the union in which we should be creating.
1223                          *
1224                          * The channel staying behind is c, the one moving forward is cnew.
1225                          */
1226                         m = NULL;
1227                         cnew = NULL;    /* is this assignment necessary? */
1228                         /* discard error */
1229                         if (!waserror()) {      /* try create */
1230                                 if (can_mount && findmount(&cnew, &m, c->type, c->dev, c->qid))
1231                                         cnew = createdir(cnew, m);
1232                                 else {
1233                                         cnew = c;
1234                                         chan_incref(cnew);
1235                                 }
1236
1237                                 /*
1238                                  * We need our own copy of the Chan because we're
1239                                  * about to send a create, which will move it.  Once we have
1240                                  * our own copy, we can fix the name, which might be wrong
1241                                  * if findmount gave us a new Chan.
1242                                  */
1243                                 cnew = cunique(cnew);
1244                                 cnameclose(cnew->name);
1245                                 cnew->name = c->name;
1246                                 kref_get(&cnew->name->ref, 1);
1247
1248                                 devtab[cnew->type].create(cnew, e.elems[e.ARRAY_SIZEs - 1],
1249                                                                                   omode & ~(O_EXCL | O_CLOEXEC),
1250                                                           perm);
1251                                 poperror();
1252                                 if (omode & O_APPEND)
1253                                         cnew->flag |= O_APPEND;
1254                                 if (omode & O_CLOEXEC)
1255                                         cnew->flag |= O_CLOEXEC;
1256                                 if (omode & O_REMCLO)
1257                                         cnew->flag |= O_REMCLO;
1258                                 if (m)
1259                                         putmhead(m);
1260                                 cclose(c);
1261                                 c = cnew;
1262                                 c->name = addelem(c->name, e.elems[e.ARRAY_SIZEs - 1]);
1263                                 break;
1264                         }
1265
1266                         /* create failed */
1267                         cclose(cnew);
1268                         if (m)
1269                                 putmhead(m);
1270                         if (omode & O_EXCL)
1271                                 nexterror();    /* safe since we're in a waserror() */
1272                         poperror();     /* matching the if(!waserror) */
1273
1274                         /* save error, so walk doesn't clobber our existing errstr */
1275                         strlcpy(tmperrbuf, current_errstr(), sizeof(tmperrbuf));
1276                         saved_errno = get_errno();
1277                         /* note: we depend that walk does not error */
1278                         if (walk(&c, e.elems + e.ARRAY_SIZEs - 1, 1, can_mount, NULL) < 0) {
1279                                 set_errno(saved_errno);
1280                                 /* Report the error we had originally */
1281                                 error(EFAIL, tmperrbuf);
1282                         }
1283                         strlcpy(current_errstr(), tmperrbuf, MAX_ERRSTR_LEN);
1284                         omode |= O_TRUNC;
1285                         goto Open;
1286
1287                 default:
1288                         panic("unknown namec access %d\n", amode);
1289         }
1290
1291         poperror();
1292
1293         if (e.ARRAY_SIZEs > 0)
1294                 strlcpy(get_cur_genbuf(), e.elems[e.ARRAY_SIZEs - 1], GENBUF_SZ);
1295         else
1296                 strlcpy(get_cur_genbuf(), ".", GENBUF_SZ);
1297
1298         kfree(e.name);
1299         kfree(e.elems);
1300         kfree(e.off);
1301
1302         return c;
1303 }
1304
1305 struct chan *namec(char *name, int amode, int omode, uint32_t perm)
1306 {
1307         bool can_mount = TRUE;
1308         struct chan *c;
1309         char *devname, *devspec;
1310         int n, devtype;
1311
1312         if (name[0] == '\0')
1313                 error(EFAIL, "empty file name");
1314         validname(name, 1);
1315         /*
1316          * Find the starting off point (the current slash, the root of
1317          * a device tree, or the current dot) as well as the name to
1318          * evaluate starting there.
1319          */
1320         switch (name[0]) {
1321                 case '/':
1322                         c = current->slash;
1323                         if (!c)
1324                                 panic("no slash!");
1325                         chan_incref(c);
1326                         break;
1327
1328                 case '#':
1329                         can_mount = FALSE;
1330                         devname = get_cur_genbuf();
1331                         devname[0] = '\0';
1332                         n = 0;
1333                         name++; /* drop the # */
1334                         while ((*name != '\0') && (*name != '/')) {
1335                                 if (n >= GENBUF_SZ - 1)
1336                                         error(ENAMETOOLONG, NULL);
1337                                 devname[n++] = *name++;
1338                         }
1339                         devname[n] = '\0';
1340                         /* for a name #foo.spec, devname = foo\0, devspec = spec\0.
1341                          * genbuf contains foo\0spec\0.  for no spec, devspec = \0 */
1342                         devspec = strchr(devname, '.');
1343                         if (devspec) {
1344                                 *devspec = '\0';
1345                                 devspec++;
1346                         } else {
1347                                 devspec = &devname[n];
1348                         }
1349                         if (!strcmp(devname, "mnt"))
1350                                 error(EINVAL, NULL);
1351                         /* TODO: deal with this "nodevs" business. */
1352                         #if 0
1353                         /*
1354                          *  the nodevs exceptions are
1355                          *  |  it only gives access to pipes you create
1356                          *  e  this process's environment
1357                          *  s  private file2chan creation space
1358                          *  D private secure sockets name space
1359                          *  a private TLS name space
1360                          */
1361                         if (current->pgrp->nodevs &&
1362                                 //          (utfrune("|esDa", r) == NULL
1363                                 ((strchr("|esDa", get_cur_genbuf()[1]) == NULL)
1364                                  || (get_cur_genbuf()[1] == 's' // || r == 's'
1365                                          && get_cur_genbuf()[n] != '\0')))
1366                                 error(EINVAL, NULL);
1367                         #endif
1368                         devtype = devno(devname, 1);
1369                         if (devtype == -1)
1370                                 error(EFAIL, "Unknown #device %s (spec %s)", devname, devspec);
1371                         c = devtab[devtype].attach(devspec);
1372                         break;
1373                 default:
1374                         /* this case also covers \0 */
1375                         c = current->dot;
1376                         if (!c)
1377                                 panic("no dot!");
1378                         chan_incref(c);
1379                         break;
1380         }
1381         return __namec_from(c, name, amode, omode, perm, can_mount);
1382 }
1383
1384 struct chan *namec_from(struct chan *c, char *name, int amode, int omode,
1385                         uint32_t perm)
1386 {
1387         if (name[0] == '\0') {
1388                 /* Our responsibility to cclose 'c' on our error */
1389                 cclose(c);
1390                 error(EFAIL, "empty file name");
1391         }
1392         validname(name, 1);
1393         return __namec_from(c, name, amode, omode, perm, TRUE);
1394 }
1395
1396 /*
1397  * name is valid. skip leading / and ./ as much as possible
1398  */
1399 char *skipslash(char *name)
1400 {
1401         while (name[0] == '/'
1402                    || (name[0] == '.' && (name[1] == 0 || name[1] == '/')))
1403                 name++;
1404         return name;
1405 }
1406
1407 char isfrog[256] = {
1408          /*NUL*/ 1, 1, 1, 1, 1, 1, 1, 1,
1409          /*BKS*/ 1, 1, 1, 1, 1, 1, 1, 1,
1410          /*DLE*/ 1, 1, 1, 1, 1, 1, 1, 1,
1411          /*CAN*/ 1, 1, 1, 1, 1, 1, 1, 1,
1412         ['/'] 1,
1413         [0x7f] 1,
1414 };
1415
1416 /*
1417  * Check that the name
1418  *  a) is in valid memory.
1419  *  b) is shorter than 2^16 bytes, so it can fit in a 9P string field.
1420  *  c) contains no frogs.
1421  * The first byte is known to be addressible by the requester, so the
1422  * routine works for kernel and user memory both.
1423  * The parameter slashok flags whether a slash character is an error
1424  * or a valid character.
1425  */
1426 void validname(char *aname, int slashok)
1427 {
1428         char *ename, *name;
1429         int c;
1430
1431         name = aname;
1432         ename = memchr(name, 0, (1 << 16));
1433
1434         if (ename == NULL || ename - name >= (1 << 16))
1435                 error(EINVAL, "Name too long");
1436
1437         while (*name) {
1438                 /* all characters above '~' are ok */
1439                 c = *(uint8_t *) name;
1440 #if 0
1441                 if (c >= Runeself)
1442                         name += chartorune(&r, name);
1443 #endif
1444                 if (c >= 0x7f) {
1445                         error(EFAIL, "Akaros doesn't do UTF-8");
1446                 } else {
1447                         if (isfrog[c])
1448                                 if (!slashok || c != '/') {
1449                                         error(EINVAL, "%s (%p), at char %c", aname, aname, c);
1450                                 }
1451                         name++;
1452                 }
1453         }
1454 }
1455
1456 void isdir(struct chan *c)
1457 {
1458         if (c->qid.type & QTDIR)
1459                 return;
1460         error(ENOTDIR, NULL);
1461 }
1462
1463 /*
1464  * This is necessary because there are many
1465  * pointers to the top of a given mount list:
1466  *
1467  *      - the mhead in the namespace hash table
1468  *      - the mhead in chans returned from findmount:
1469  *        used in namec and then by unionread.
1470  *      - the mhead in chans returned from createdir:
1471  *        used in the open/create race protect, which is gone.
1472  *
1473  * The RWlock in the Mhead protects the mount list it contains.
1474  * The mount list is deleted when we cunmount.
1475  * The RWlock ensures that nothing is using the mount list at that time.
1476  *
1477  * It is okay to replace c->mh with whatever you want as
1478  * long as you are sure you have a unique reference to it.
1479  *
1480  * This comment might belong somewhere else.
1481  */
1482 void putmhead(struct mhead *m)
1483 {
1484         if (m)
1485                 kref_put(&m->ref);
1486 }