Implement sys_open() with sys_openat() (XCC)
[akaros.git] / kern / include / ns.h
index 009919a..8e7a29e 100644 (file)
@@ -7,6 +7,7 @@
 #include <rendez.h>
 #include <rwlock.h>
 #include <linker_func.h>
+#include <fdtap.h>
 
 /*
  * functions (possibly) linked in, complete, from libc.
@@ -121,9 +122,6 @@ struct dir {
        char *muid;                                     /* last modifier name */
 };
 
-/* Part of the dirty kdirent hack in sysread.  Used to be 59... */
-#define MIN_M_BUF_SZ 52                        /* TODO: 53 is the smallest i've seen */
-
 struct waitmsg {
        int pid;                                        /* of loved one */
        uint32_t time[3];                       /* of loved one and descendants */
@@ -246,6 +244,7 @@ enum {
        Tmax,
 };
 
+void init_empty_dir(struct dir *d);
 unsigned int convM2S(uint8_t * unused_uint8_p_t, unsigned int unused_int,
                                         struct fcall *);
 unsigned int convS2M(struct fcall *, uint8_t * unused_uint8_p_t, unsigned int);
@@ -303,24 +302,50 @@ enum {
        Amount,                                         /* to be mounted or mounted upon */
        Acreate,                                        /* is to be created */
        Aremove,                                        /* will be removed by caller */
-
-       COPEN = 0x0001,                         /* for i/o */
-       CMSG = 0x0002,  /* the message channel for a mount */
-       CCEXEC = 0x0008,        /* close on exec */
-       CFREE = 0x0010, /* not in use */
-       CRCLOSE = 0x0020,       /* remove on close */
-       CCACHE = 0x0080,        /* client cache */
-       /* file/chan status flags, affected by setfl and reported in getfl */
-       CAPPEND = 0x0100,       /* append on write */
-};
+       Acreatechan,                                    /* return a chan for a create request. for sysrename. */
+
+       /* internal chan flags, used by the kernel only */
+       COPEN =                 0x0001, /* for i/o */
+       CMSG =                  0x0002, /* the message channel for a mount */
+       CFREE =                 0x0004, /* not in use */
+       CCACHE =                0x0008, /* client cache */
+       CINTERNAL_FLAGS = (COPEN | CMSG | CFREE | CCACHE),
+
+       /* chan/file flags, getable via fcntl/getfl and setably via open and
+        * sometimes fcntl/setfl.  those that can't be set cause an error() in
+        * fd_setfl. */
+       CEXTERNAL_FLAGS = (
+           O_CLOEXEC      | /* (prob should be on the FD, 9ns has it here) */
+           O_REMCLO       | /* remove on close (also, maybe should be on FD) */
+           O_APPEND       | /* append on write */
+           O_NONBLOCK     | /* don't block, can't be set via setfl */
+           O_PATH         | /* path open, just the name, no I/O */
+           0),
+};
+
+#define NS_IPCK_SHIFT  2
+#define NS_UDPCK_SHIFT 3
+#define NS_TCPCK_SHIFT 4
+#define NS_PKTCK_SHIFT 5
+#define NS_TSO_SHIFT 6
+#define NS_SHIFT_MAX 6
 
 enum {
        BINTR = (1 << 0),
        BFREE = (1 << 1),
-       Bipck = (1 << 2),       /* ip checksum */
-       Budpck = (1 << 3),      /* udp checksum */
-       Btcpck = (1 << 4),      /* tcp checksum */
-       Bpktck = (1 << 5),      /* packet checksum */
+       Bipck = (1 << NS_IPCK_SHIFT),   /* ip checksum */
+       Budpck = (1 << NS_UDPCK_SHIFT), /* udp checksum */
+       Btcpck = (1 << NS_TCPCK_SHIFT), /* tcp checksum */
+       Bpktck = (1 << NS_PKTCK_SHIFT), /* packet checksum */
+       Btso = (1 << NS_TSO_SHIFT),     /* TSO */
+};
+#define BCKSUM_FLAGS (Bipck|Budpck|Btcpck|Bpktck|Btso)
+
+struct extra_bdata {
+       uintptr_t base;
+       /* using u32s for packing reasons.  this means no extras > 4GB */
+       uint32_t off;
+       uint32_t len;
 };
 
 struct block {
@@ -333,9 +358,17 @@ struct block {
        void (*free) (struct block *);
        uint16_t flag;
        uint16_t checksum;                      /* IP checksum of complete packet (minus media header) */
-};
-#define BLEN(s)        ((s)->wp - (s)->rp)
-#define BALLOC(s) ((s)->lim - (s)->base)
+       uint16_t checksum_start;                /* off from start of block to start csum */
+       uint16_t checksum_offset;               /* off from checksum_start to store csum */
+       uint16_t mss;               /* TCP MSS for TSO */
+       /* might want something to track the next free extra_data slot */
+       size_t extra_len;
+       unsigned int nr_extra_bufs;
+       struct extra_bdata *extra_data;
+};
+#define BLEN(s)        ((s)->wp - (s)->rp + (s)->extra_len)
+#define BHLEN(s) ((s)->wp - (s)->rp)
+#define BALLOC(s) ((s)->lim - (s)->base + (s)->extra_len)
 
 struct chan {
        spinlock_t lock;
@@ -362,9 +395,17 @@ struct chan {
                void *aux;
                char tag[4];                    /* for iproute */
        };
+       /* mountpoint, as discovered during walk.
+        * Used for rename at present.
+        */
+       struct chan *mountpoint;
        struct chan *mchan;                     /* channel to mounted server */
        struct qid mqid;                        /* qid of root of mount point */
        struct cname *name;
+       /* hack for dir reads to try to get them right. */
+       int ateof;
+       void *buf;
+       int bufused;
 };
 
 struct cname {
@@ -375,7 +416,6 @@ struct cname {
 };
 
 struct dev {
-       int dc;
        char *name;
 
        void (*reset) (void);
@@ -396,8 +436,9 @@ struct dev {
        void (*power) (int);            /* power mgt: power(1) → on, power (0) → off */
 //  int (*config)( int unused_int, char *unused_char_p_t, DevConf*);
        char *(*chaninfo) (struct chan *, char *, size_t);
-       /* we need to be aligned, i think to 32 bytes, for the linker tables. */
-} __attribute__ ((aligned(32)));
+       int (*tapfd) (struct chan *, struct fd_tap *, int);
+       /* we need to be aligned, we think to 64 bytes, for the linker tables. */
+} __attribute__ ((aligned(64)));
 
 struct dirtab {
        char name[KNAMELEN];
@@ -490,16 +531,6 @@ struct pgrp {
        int pin;
 };
 
-struct fgrp {
-       spinlock_t lock;
-       struct kref ref;
-       struct chan **fd;
-       int nfd;                                        /* number of fd slots */
-       int maxfd;                                      /* highest fd in use */
-       int minfd;                                      /* lower bound on free fd */
-       int closed;
-};
-
 struct evalue {
        char *var;
        char *val;
@@ -549,7 +580,7 @@ enum {
        PRINTSIZE = 256,
        NUMSIZE = 12,   /* size of formatted number */
        MB = (1024 * 1024),
-       READSTR = 1000, /* temporary buffer size for device reads */
+       READSTR = 2000, /* temporary buffer size for device reads */
 };
 
 extern struct dev devtab[];
@@ -567,15 +598,16 @@ struct cmdtab {
        int narg;                                       /* expected #args; 0 ==> variadic */
 };
 
-/* queue state bits,  Qmsg, Qcoalesce, and Qkick can be set in qopen */
+/* queue state bits, all can be set in qopen (Qstarve is always set) */
 enum {
-       /* Queue.state */
        Qstarve = (1 << 0),                     /* consumer starved */
        Qmsg = (1 << 1),        /* message stream */
        Qclosed = (1 << 2),     /* queue has been closed/hungup */
        Qflow = (1 << 3),       /* producer flow controlled */
        Qcoalesce = (1 << 4),   /* coallesce packets on read */
        Qkick = (1 << 5),       /* always call the kick routine after qwrite */
+       Qdropoverflow = (1 << 6),       /* writes that would block will be dropped */
+       Qnonblock = (1 << 7),   /* do not block, throw EAGAIN */
 };
 
 #define DEVDOTDOT -1
@@ -593,6 +625,7 @@ void addprog(struct proc *);
 void addrootfile(char *unused_char_p_t, uint8_t * unused_uint8_p_t, uint32_t);
 struct block *adjustblock(struct block *, int);
 struct block *allocb(int);
+void block_add_extd(struct block *b, unsigned int nr_bufs, int mem_flags);
 int anyhigher(void);
 int anyready(void);
 void _assert(char *unused_char_p_t);
@@ -604,7 +637,6 @@ void chan_incref(struct chan *);
 void chandevinit(void);
 void chandevreset(void);
 void chandevshutdown(void);
-struct dir *chandirstat(struct chan *);
 void chanfree(struct chan *);
 void chanrec(struct mnt *);
 void checkalarms(void);
@@ -613,15 +645,15 @@ void cinit(void);
 struct chan *cclone(struct chan *);
 void cclose(struct chan *);
 void closeegrp(struct egrp *);
-void closefgrp(struct fgrp *);
 void closemount(struct mount *);
 void closepgrp(struct pgrp *);
 void closesigs(struct skeyset *);
-void cmderror(struct cmdbuf *, char *unused_char_p_t);
+void debugcmd(struct cmdbuf *cb);
 struct mhead *newmhead(struct chan *from);
 int cmount(struct chan *, struct chan *, int unused_int, char *unused_char_p_t);
 void cnameclose(struct cname *);
 struct block *concatblock(struct block *);
+struct block *linearizeblock(struct block *b);
 void confinit(void);
 void copen(struct chan *);
 struct block *copyblock(struct block *, int);
@@ -636,7 +668,7 @@ void cursordisable(void);
 int cursoron(int);
 void cursoroff(int);
 void cwrite(struct chan *, uint8_t * unused_uint8_p_t, int unused_int, int64_t);
-struct chan *devattach(int unused_int, char *unused_char_p_t);
+struct chan *devattach(const char *name, char *spec);
 struct block *devbread(struct chan *, long, uint32_t);
 long devbwrite(struct chan *, struct block *, uint32_t);
 struct chan *devclone(struct chan *);
@@ -646,7 +678,7 @@ void devdir(struct chan *, struct qid, char *, int64_t, char *, long,
 long devdirread(struct chan *, char *, long, struct dirtab *, int, Devgen *);
 Devgen devgen;
 void devinit(void);
-int devno(int unused_int, int);
+int devno(const char *name, int user);
 void devpower(int);
 struct dev *devbyname(char *unused_char_p_t);
 struct chan *devopen(struct chan *, int unused_int,
@@ -668,7 +700,6 @@ int domount(struct chan **, struct mhead **);
 void drawactive(int);
 void drawcmap(void);
 void dumpstack(void);
-struct fgrp *dupfgrp(struct proc *, struct fgrp *);
 void egrpcpy(struct egrp *, struct egrp *);
 int emptystr(char *unused_char_p_t);
 int eqchan(struct chan *, struct chan *, int);
@@ -682,8 +713,6 @@ void halt(void);
 int export(int unused_int, char *unused_char_p_t, int);
 uint64_t fastticks(uint64_t *);
 uint64_t fastticks2ns(uint64_t);
-void fdclose(struct fgrp *, int);
-struct chan *fdtochan(struct fgrp *, int unused_int, int, int, int);
 int findmount(struct chan **, struct mhead **, int unused_int, int, struct qid);
 void free(void *);
 void freeb(struct block *);
@@ -692,10 +721,9 @@ void freeskey(struct signerkey *);
 void getcolor(uint32_t, uint32_t *, uint32_t *, uint32_t *);
 uint32_t getmalloctag(void *);
 uint32_t getrealloctag(void *);
-void hnputl(void *, uint32_t);
-void hnputs(void *, uint16_t);
 struct block *iallocb(int);
 void iallocsummary(void);
+void printblock(struct block *b);
 void ilock(spinlock_t *);
 int iprint(char *unused_char_p_t, ...);
 void isdir(struct chan *);
@@ -707,14 +735,12 @@ int kbdcr2nl(struct queue *, int);
 int kbdputc(struct queue *, int);
 void kbdrepeat(int);
 void kproc(char *unused_char_p_t, void (*)(void *), void *, int);
-int fgrpclose(struct fgrp *, int);
 void kprocchild(struct proc *, void (*)(void *), void *);
 void (*kproftick) (uint32_t);
 void ksetenv(char *unused_char_p_t, char *, int);
 //void      kstrncpy( char *unused_char_p_t, char*, int unused_int, sizeof(char*, char*));
 void kstrdup(char **unused_char_pp_t, char *unused_char_p_t);
 
-struct cmdtab *lookupcmd(struct cmdbuf *, struct cmdtab *, int);
 struct block *mem2bl(uint8_t * unused_uint8_p_t, int);
 int memusehigh(void);
 void microdelay(int);
@@ -729,9 +755,10 @@ uint64_t ms2fastticks(uint32_t);
 void mul64fract(uint64_t *, uint64_t, uint64_t);
 void muxclose(struct mnt *);
 struct chan *namec(char *unused_char_p_t, int unused_int, int, uint32_t);
+struct chan *namec_from(struct chan *c, char *name, int amode, int omode,
+                        uint32_t perm);
 struct chan *newchan(void);
 struct egrp *newegrp(void);
-struct fgrp *newfgrp(void);
 struct mount *newmount(struct mhead *, struct chan *, int unused_int,
                                           char *unused_char_p_t);
 struct pgrp *newpgrp(void);
@@ -743,12 +770,11 @@ void notkilled(void);
 int nrand(int);
 uint64_t ns2fastticks(uint64_t);
 int okaddr(uint32_t, uint32_t, int);
-int openmode(uint32_t);
+int omode_to_rwx(int);
+int omode_to_9p_accmode(int open_flags);
 struct block *packblock(struct block *);
 struct block *padblock(struct block *, int);
 
-struct cmdbuf *parsecmd(char *unused_char_p_t, int);
-
 void pgrpcpy(struct pgrp *, struct pgrp *);
 
 int progfdprint(struct chan *, int unused_int, int, char *unused_char_p_t,
@@ -761,11 +787,16 @@ void putstrn(char *unused_char_p_t, int);
 void qaddlist(struct queue *, struct block *);
 struct block *qbread(struct queue *, int);
 long qbwrite(struct queue *, struct block *);
+long qibwrite(struct queue *q, struct block *b);
 struct queue *qbypass(void (*)(void *, struct block *), void *);
 int qcanread(struct queue *);
 void qclose(struct queue *);
 int qconsume(struct queue *, void *, int);
 struct block *qcopy(struct queue *, int unused_int, uint32_t);
+struct block *qclone(struct queue *q, int header_len, int len,
+                     uint32_t offset);
+struct block *blist_clone(struct block *blist, int header_len, int len,
+                          uint32_t offset);
 int qdiscard(struct queue *, int);
 void qflush(struct queue *);
 void qfree(struct queue *);
@@ -775,7 +806,8 @@ void qhangup(struct queue *, char *unused_char_p_t);
 int qisclosed(struct queue *);
 int qiwrite(struct queue *, void *, int);
 int qlen(struct queue *);
-void qnoblock(struct queue *, int);
+void qdropoverflow(struct queue *, bool);
+void qnonblock(struct queue *, bool);
 struct queue *qopen(int unused_int, int, void (*)(void *), void *);
 int qpass(struct queue *, struct block *);
 int qpassnolim(struct queue *, struct block *);
@@ -787,6 +819,9 @@ void qreopen(struct queue *);
 void qsetlimit(struct queue *, int);
 int qwindow(struct queue *);
 int qwrite(struct queue *, void *, int);
+typedef void (*qio_wake_cb_t)(struct queue *q, void *data, int filter);
+void qio_set_wake_cb(struct queue *q, qio_wake_cb_t func, void *data);
+
 void randominit(void);
 uint32_t randomread(void *, uint32_t);
 void *realloc(void *, uint32_t);
@@ -801,7 +836,6 @@ void renameproguser(char *unused_char_p_t, char *);
 void renameuser(char *unused_char_p_t, char *);
 void resrcwait(char *unused_char_p_t);
 struct proc *runproc(void);
-long seconds(void);
 void (*serwrite) (char *unused_char_p_t, int);
 int setcolor(uint32_t, uint32_t, uint32_t, uint32_t);
 
@@ -829,15 +863,12 @@ struct block *trimblock(struct block *, int unused_int, int);
 int uartgetc(void);
 void uartputc(int);
 void uartputs(char *unused_char_p_t, int);
-long unionread(struct chan *, void *, long);
 void unlock(spinlock_t *);
 void userinit(void);
 uint32_t userpc(void);
-void validname(char *unused_char_p_t, int);
-void validstat(uint8_t * unused_uint8_p_t, int);
-void validwstatname(char *unused_char_p_t);
-int walk(struct chan **, char **unused_char_pp_t, int unused_int, int, int *);
-void werrstr(char *unused_char_p_t, ...);
+void validname(char *, int);
+void validwstatname(char *);
+int walk(struct chan **, char **unused_char_pp_t, int unused_int, bool, int *);
 void *xalloc(uint32_t);
 void *xallocz(uint32_t, int);
 void xfree(void *);
@@ -857,18 +888,13 @@ uint32_t nhgetl(void *);
 uint16_t nhgets(void *);
 
 /* error messages, from inferno emu error.h */
-extern char Enoerror[];                        /* no error */
 extern char Emount[];                  /* inconsistent mount */
 extern char Eunmount[];                        /* not mounted */
 extern char Eunion[];                  /* not in union */
 extern char Emountrpc[];               /* mount rpc error */
-extern char Eshutdown[];               /* mounted device shut down */
-extern char Eowner[];                  /* not owner */
-extern char Eunknown[];                        /* unknown user or group id */
 extern char Enocreate[];               /* mounted directory forbids creation */
 extern char Enonexist[];               /* file does not exist */
 extern char Eexist[];                  /* file already exists */
-extern char Ebadsharp[];               /* unknown device in # filename */
 extern char Enotdir[];                 /* not a directory */
 extern char Eisdir[];                  /* file is a directory */
 extern char Ebadchar[];                        /* bad character in file name */
@@ -880,54 +906,30 @@ extern char Einuse[];                     /* device or object already in use */
 extern char Eio[];                             /* i/o error */
 extern char Etoobig[];                 /* read or write too large */
 extern char Etoosmall[];               /* read or write too small */
-extern char Enetaddr[];                        /* bad network address */
-extern char Emsgsize[];                        /* message is too big for protocol */
-extern char Enetbusy[];                        /* network device is busy or allocated */
-extern char Enoproto[];                        /* network protocol not supported */
-extern char Enoport[];                 /* network port not available */
 extern char Enoifc[];                  /* bad interface or no free interface slots */
-extern char Enolisten[];               /* not announced */
 extern char Ehungup[];                 /* i/o on hungup channel */
 extern char Ebadctl[];                 /* bad process or channel control request */
 extern char Enodev[];                  /* no free devices */
-extern char Enoenv[];                  /* no free environment resources */
-extern char Ethread[];                 /* thread exited */
 extern char Enochild[];                        /* no living children */
-extern char Eioload[];                 /* i/o error in demand load */
 extern char Enovmem[];                 /* out of memory: virtual memory */
-extern char Ebadld[];                  /* illegal line discipline */
-extern char Ebadfd[];                  /* fd out of range or not open */
 extern char Eisstream[];               /* seek on a stream */
-extern char Ebadexec[];                        /* exec header invalid */
 extern char Etimedout[];               /* connection timed out */
 extern char Econrefused[];             /* connection refused */
 extern char Econinuse[];               /* connection in use */
-extern char Enetunreach[];             /* network unreachable */
 extern char Eintr[];                   /* interrupted */
 extern char Enomem[];                  /* out of memory: kernel */
-extern char Esfnotcached[];            /* subfont not cached */
-extern char Esoverlap[];               /* segments overlap */
-extern char Emouseset[];               /* mouse type already set */
 extern char Eshort[];                  /* i/o count too small */
 extern char Enobitstore[];             /* out of screen memory */
 extern char Egreg[];                   /* jim'll fix it */
 extern char Ebadspec[];                        /* bad attach specifier */
-extern char Estopped[];                        /* thread must be stopped */
 extern char Enoattach[];               /* mount/attach disallowed */
 extern char Eshortstat[];              /* stat buffer too small */
 extern char Enegoff[];                 /* negative i/o offset */
 extern char Ebadstat[];                        /* malformed stat buffer */
 extern char Ecmdargs[];                        /* wrong #args in control message */
 extern char Enofd[];                   /* no free file descriptors */
-extern char Enoctl[];                  /* unknown control request */
 extern char Eprocdied[];               /* process died */
 
-/* kern/src/err.c */
-int errpush(struct errbuf *errstack, int stacksize, int *curindex,
-                       struct errbuf **prev_errbuf);
-void errpop(struct errbuf *errstack, int stacksize, int *curindex,
-                       struct errbuf *prev_errbuf);
-/* */
 char *get_cur_genbuf(void);
 
 /* hack for now. */
@@ -945,16 +947,19 @@ void cmderror(struct cmdbuf *cb, char *s);
 struct cmdtab *lookupcmd(struct cmdbuf *cb, struct cmdtab *ctab, int nctab);
 
 /* kern/src/ns/sysfile.c */
-int newfd(struct chan *c);
-struct chan *fdtochan(struct fgrp *f, int fd, int mode, int chkmnt, int iref);
+int newfd(struct chan *c, int oflags);
+struct chan *fdtochan(struct fd_table *fdt, int fd, int mode, int chkmnt,
+                      int iref);
 long kchanio(void *vc, void *buf, int n, int mode);
 int openmode(uint32_t o);
-void fdclose(struct fgrp *f, int fd);
+void fdclose(struct fd_table *fdt, int fd);
 int syschdir(char *path);
-int grpclose(struct fgrp *f, int fd);
+int grpclose(struct fd_table *fdt, int fd);
 int sysclose(int fd);
 int syscreate(char *path, int mode, uint32_t perm);
-int sysdup(int old, int new);
+int sysdup(int old);
+int sys_dup_to(struct proc *from_proc, unsigned int from_fd,
+               struct proc *to_proc, unsigned int to_fd);
 int sysfstat(int fd, uint8_t*, int n);
 int sysfstatakaros(int fd, struct kstat *);
 char *sysfd2path(int fd);
@@ -966,13 +971,15 @@ long bindmount(struct chan *c, char *old, int flag, char *spec);
 int sysbind(char *new, char *old, int flags);
 int sysmount(int fd, int afd, char *old, int flags, char *spec);
 int sysunmount(char *old, char *new);
-int sysopen(char *path, int mode);
+int sysopenat(int dirfd, char *path, int vfs_flags);
+int sysopen(char *path, int vfs_flags);
 long unionread(struct chan *c, void *va, long n);
+void read_exactly_n(struct chan *c, void *vp, long n);
 long sysread(int fd, void *va, long n);
 long syspread(int fd, void *va, long n, int64_t off);
 int sysremove(char *path);
 int64_t sysseek(int fd, int64_t off, int whence);
-void validstat(uint8_t * s, int n);
+void validstat(uint8_t * s, int n, int slashok);
 int sysstat(char *path, uint8_t*, int n);
 int sysstatakaros(char *path, struct kstat *);
 long syswrite(int fd, void *va, long n);
@@ -985,10 +992,8 @@ int sysdirwstat(char *name, struct dir *dir);
 int sysdirfwstat(int fd, struct dir *dir);
 long sysdirread(int fd, struct kdirent **d);
 int sysiounit(int fd);
-void close_9ns_files(struct proc *p, bool only_cloexec);
 void print_chaninfo(struct chan *ch);
-void print_9ns_files(struct proc *p);
-int plan9setup(struct proc *new_proc, struct proc *parent);
+int plan9setup(struct proc *new_proc, struct proc *parent, int flags);
 int iseve(void);
 int fd_getfl(int fd);
 int fd_setfl(int fd, int flags);
@@ -996,6 +1001,11 @@ int fd_setfl(int fd, int flags);
 /* kern/drivers/dev/srv.c */
 char *srvname(struct chan *c);
 
+/* kern/src/eipconv.c. Put them here or face real include hell. */
+void printqid(void (*putch) (int, void **), void **putdat, struct qid *q);
+void printcname(void (*putch) (int, void **), void **putdat, struct cname *c);
+void printchan(void (*putch) (int, void **), void **putdat, struct chan *c);
+
 static inline int abs(int a)
 {
        if (a < 0)