def7a9c4ddfb102106f5c332b1e69f42bb0b4f7e
[akaros.git] / kern / src / net / ethermedium.c
1 /* Copyright © 1994-1999 Lucent Technologies Inc.  All rights reserved.
2  * Portions Copyright © 1997-1999 Vita Nuova Limited
3  * Portions Copyright © 2000-2007 Vita Nuova Holdings Limited
4  *                                (www.vitanuova.com)
5  * Revisions Copyright © 2000-2007 Lucent Technologies Inc. and others
6  *
7  * Modified for the Akaros operating system:
8  * Copyright (c) 2013-2014 The Regents of the University of California
9  * Copyright (c) 2013-2015 Google Inc.
10  *
11  * Permission is hereby granted, free of charge, to any person obtaining a copy
12  * of this software and associated documentation files (the "Software"), to deal
13  * in the Software without restriction, including without limitation the rights
14  * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
15  * copies of the Software, and to permit persons to whom the Software is
16  * furnished to do so, subject to the following conditions:
17  *
18  * The above copyright notice and this permission notice shall be included in
19  * all copies or substantial portions of the Software.
20  *
21  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
22  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
23  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL THE
24  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
25  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
26  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
27  * SOFTWARE. */
28
29 #include <vfs.h>
30 #include <kfs.h>
31 #include <slab.h>
32 #include <kmalloc.h>
33 #include <kref.h>
34 #include <string.h>
35 #include <stdio.h>
36 #include <assert.h>
37 #include <error.h>
38 #include <cpio.h>
39 #include <pmap.h>
40 #include <smp.h>
41 #include <net/ip.h>
42
43 typedef struct Etherhdr Etherhdr;
44 struct Etherhdr {
45         uint8_t d[6];
46         uint8_t s[6];
47         uint8_t t[2];
48 };
49
50 static uint8_t ipbroadcast[IPaddrlen] = {
51         0xff, 0xff, 0xff, 0xff,
52         0xff, 0xff, 0xff, 0xff,
53         0xff, 0xff, 0xff, 0xff,
54         0xff, 0xff, 0xff, 0xff,
55 };
56
57 static uint8_t etherbroadcast[] = { 0xff, 0xff, 0xff, 0xff, 0xff, 0xff };
58
59 static void etherread4(void *a);
60 static void etherread6(void *a);
61 static void etherbind(struct Ipifc *ifc, int argc, char **argv);
62 static void etherunbind(struct Ipifc *ifc);
63 static void etherbwrite(struct Ipifc *ifc, struct block *bp, int version,
64                                                 uint8_t * ip);
65 static void etheraddmulti(struct Ipifc *ifc, uint8_t * a, uint8_t * ia);
66 static void etherremmulti(struct Ipifc *ifc, uint8_t * a, uint8_t * ia);
67 static struct block *multicastarp(struct Fs *f, struct arpent *a,
68                                                                   struct medium *, uint8_t * mac);
69 static void sendarp(struct Ipifc *ifc, struct arpent *a);
70 static void sendgarp(struct Ipifc *ifc, uint8_t * unused_uint8_p_t);
71 static int multicastea(uint8_t * ea, uint8_t * ip);
72 static void recvarpproc(void *);
73 static void resolveaddr6(struct Ipifc *ifc, struct arpent *a);
74 static void etherpref2addr(uint8_t * pref, uint8_t * ea);
75
76 struct medium ethermedium = {
77         .name = "ether",
78         .hsize = 14,
79         .mintu = 60,
80         .maxtu = 1514,
81         .maclen = 6,
82         .bind = etherbind,
83         .unbind = etherunbind,
84         .bwrite = etherbwrite,
85         .addmulti = etheraddmulti,
86         .remmulti = etherremmulti,
87         .ares = arpenter,
88         .areg = sendgarp,
89         .pref2addr = etherpref2addr,
90 };
91
92 struct medium trexmedium = {
93         .name = "trex",
94         .hsize = 14,
95         .mintu = 60,
96         .maxtu = 1514,
97         .maclen = 6,
98         .bind = etherbind,
99         .unbind = etherunbind,
100         .bwrite = etherbwrite,
101         .addmulti = etheraddmulti,
102         .remmulti = etherremmulti,
103         .ares = arpenter,
104         .areg = sendgarp,
105         .pref2addr = etherpref2addr,
106 };
107
108 typedef struct Etherrock Etherrock;
109 struct Etherrock {
110         struct Fs *f;                           /* file system we belong to */
111         struct proc *arpp;                      /* arp process */
112         struct proc *read4p;            /* reading process (v4) */
113         struct proc *read6p;            /* reading process (v6) */
114         struct chan *mchan4;            /* Data channel for v4 */
115         struct chan *achan;                     /* Arp channel */
116         struct chan *cchan4;            /* Control channel for v4 */
117         struct chan *mchan6;            /* Data channel for v6 */
118         struct chan *cchan6;            /* Control channel for v6 */
119 };
120
121 /*
122  *  ethernet arp request
123  */
124 enum {
125         ETARP = 0x0806,
126         ETIP4 = 0x0800,
127         ETIP6 = 0x86DD,
128         ARPREQUEST = 1,
129         ARPREPLY = 2,
130 };
131
132 typedef struct Etherarp Etherarp;
133 struct Etherarp {
134         uint8_t d[6];
135         uint8_t s[6];
136         uint8_t type[2];
137         uint8_t hrd[2];
138         uint8_t pro[2];
139         uint8_t hln;
140         uint8_t pln;
141         uint8_t op[2];
142         uint8_t sha[6];
143         uint8_t spa[4];
144         uint8_t tha[6];
145         uint8_t tpa[4];
146 };
147
148 static char *nbmsg = "nonblocking";
149
150 static unsigned int parsefeat(char *ptr)
151 {
152         unsigned int feat = 0;
153
154         if (strstr(ptr, "ipck"))
155                 feat |= NETF_IPCK;
156         if (strstr(ptr, "udpck"))
157                 feat |= NETF_UDPCK;
158         if (strstr(ptr, "tcpck"))
159                 feat |= NETF_TCPCK;
160         if (strstr(ptr, "padmin"))
161                 feat |= NETF_PADMIN;
162         if (strstr(ptr, "sg"))
163                 feat |= NETF_SG;
164         if (strstr(ptr, "tso"))
165                 feat |= NETF_TSO;
166         if (strstr(ptr, "lro"))
167                 feat |= NETF_LRO;
168         if (strstr(ptr, "rxcsum"))
169                 feat |= NETF_RXCSUM;
170         return feat;
171 }
172
173 /*
174  *  called to bind an IP ifc to an ethernet device
175  *  called with ifc wlock'd
176  */
177 static void etherbind(struct Ipifc *ifc, int argc, char **argv)
178 {
179         ERRSTACK(1);
180         struct chan *mchan4, *cchan4, *achan, *mchan6, *cchan6;
181         char *addr, *dir, *buf;
182         int fd, cfd, n;
183         char *ptr;
184         Etherrock *er;
185
186         if (argc < 2)
187                 error(EINVAL, ERROR_FIXME);
188
189         addr = kmalloc(Maxpath, MEM_WAIT);      //char addr[2*KNAMELEN];
190         dir = kmalloc(Maxpath, MEM_WAIT);       //char addr[2*KNAMELEN];
191         mchan4 = cchan4 = achan = mchan6 = cchan6 = NULL;
192         buf = NULL;
193         if (waserror()) {
194                 if (mchan4 != NULL)
195                         cclose(mchan4);
196                 if (cchan4 != NULL)
197                         cclose(cchan4);
198                 if (achan != NULL)
199                         cclose(achan);
200                 if (mchan6 != NULL)
201                         cclose(mchan6);
202                 if (cchan6 != NULL)
203                         cclose(cchan6);
204                 if (buf != NULL)
205                         kfree(buf);
206                 kfree(addr);
207                 kfree(dir);
208                 nexterror();
209         }
210
211         /*
212          *  open ip converstation
213          *
214          *  the dial will fail if the type is already open on
215          *  this device.
216          */
217         snprintf(addr, Maxpath, "%s!0x800", argv[2]);
218         fd = kdial(addr, NULL, dir, &cfd);
219         if (fd < 0)
220                 error(EFAIL, "dial 0x800 failed: %s", get_cur_errbuf());
221         mchan4 = commonfdtochan(fd, O_RDWR, 0, 1);
222         cchan4 = commonfdtochan(cfd, O_RDWR, 0, 1);
223         sysclose(fd);
224         sysclose(cfd);
225
226         /*
227          *  make it non-blocking
228          */
229         devtab[cchan4->type].write(cchan4, nbmsg, strlen(nbmsg), 0);
230
231         /*
232          *  get mac address and speed
233          */
234         snprintf(addr, Maxpath, "%s/stats", dir);
235         fd = sysopen(addr, O_READ);
236         if (fd < 0)
237                 error(EFAIL, "can't open ether stats: %s", get_cur_errbuf());
238
239         buf = kzmalloc(512, 0);
240         n = sysread(fd, buf, 511);
241         sysclose(fd);
242         if (n <= 0)
243                 error(EIO, ERROR_FIXME);
244         buf[n] = 0;
245
246         ptr = strstr(buf, "addr: ");
247         if (!ptr)
248                 error(EIO, ERROR_FIXME);
249         ptr += 6;
250         parsemac(ifc->mac, ptr, 6);
251
252         ptr = strstr(buf, "mbps: ");
253         if (ptr) {
254                 ptr += 6;
255                 ifc->mbps = atoi(ptr);
256         } else
257                 ifc->mbps = 100;
258
259
260         ptr = strstr(buf, "feat: ");
261         if (ptr) {
262                 ptr += 6;
263                 ifc->feat = parsefeat(ptr);
264         } else {
265                 ifc->feat = 0;
266         }
267         /*
268          *  open arp conversation
269          */
270         snprintf(addr, Maxpath, "%s!0x806", argv[2]);
271         fd = kdial(addr, NULL, NULL, NULL);
272         if (fd < 0)
273                 error(EFAIL, "dial 0x806 failed: %s", get_cur_errbuf());
274         achan = commonfdtochan(fd, O_RDWR, 0, 1);
275         sysclose(fd);
276
277         /*
278          *  open ip conversation
279          *
280          *  the dial will fail if the type is already open on
281          *  this device.
282          */
283         snprintf(addr, Maxpath, "%s!0x86DD", argv[2]);
284         fd = kdial(addr, NULL, dir, &cfd);
285         if (fd < 0)
286                 error(EFAIL, "dial 0x86DD failed: %s", get_cur_errbuf());
287         mchan6 = commonfdtochan(fd, O_RDWR, 0, 1);
288         cchan6 = commonfdtochan(cfd, O_RDWR, 0, 1);
289         sysclose(fd);
290         sysclose(cfd);
291
292         /*
293          *  make it non-blocking
294          */
295         devtab[cchan6->type].write(cchan6, nbmsg, strlen(nbmsg), 0);
296
297         er = kzmalloc(sizeof(*er), 0);
298         er->mchan4 = mchan4;
299         er->cchan4 = cchan4;
300         er->achan = achan;
301         er->mchan6 = mchan6;
302         er->cchan6 = cchan6;
303         er->f = ifc->conv->p->f;
304         ifc->arg = er;
305
306         kfree(buf);
307         kfree(addr);
308         kfree(dir);
309         poperror();
310
311         ktask("etherread4", etherread4, ifc);
312         ktask("recvarpproc", recvarpproc, ifc);
313         ktask("etherread6", etherread6, ifc);
314 }
315
316 /*
317  *  called with ifc wlock'd
318  */
319 static void etherunbind(struct Ipifc *ifc)
320 {
321         Etherrock *er = ifc->arg;
322         printk("[kernel] etherunbind not supported yet!\n");
323
324         // we'll need to tell the ktasks to exit, maybe via flags and a wakeup
325 #if 0
326         if (er->read4p)
327                 postnote(er->read4p, 1, "unbind", 0);
328         if (er->read6p)
329                 postnote(er->read6p, 1, "unbind", 0);
330         if (er->arpp)
331                 postnote(er->arpp, 1, "unbind", 0);
332 #endif
333
334         /* wait for readers to die */
335         while (er->arpp != 0 || er->read4p != 0 || er->read6p != 0)
336                 cpu_relax();
337         kthread_usleep(300 * 1000);
338
339         if (er->mchan4 != NULL)
340                 cclose(er->mchan4);
341         if (er->achan != NULL)
342                 cclose(er->achan);
343         if (er->cchan4 != NULL)
344                 cclose(er->cchan4);
345         if (er->mchan6 != NULL)
346                 cclose(er->mchan6);
347         if (er->cchan6 != NULL)
348                 cclose(er->cchan6);
349
350         kfree(er);
351 }
352
353 /*
354  * copy ethernet address
355  */
356 static inline void etherfilladdr(uint16_t *pkt, uint16_t *dst, uint16_t *src)
357 {
358         *pkt++ = *dst++;
359         *pkt++ = *dst++;
360         *pkt++ = *dst++;
361         *pkt++ = *src++;
362         *pkt++ = *src++;
363         *pkt = *src;
364 }
365
366 /*
367  *  called by ipoput with a single block to write with ifc rlock'd
368  */
369 static void
370 etherbwrite(struct Ipifc *ifc, struct block *bp, int version, uint8_t * ip)
371 {
372         Etherhdr *eh;
373         struct arpent *a;
374         uint8_t mac[6];
375         Etherrock *er = ifc->arg;
376
377         ipifc_trace_block(ifc, bp);
378         /* get mac address of destination.
379          *
380          * Locking is tricky here.  If we get arpent 'a' back, the f->arp is
381          * qlocked.  if multicastarp returns bp, then it unlocked it for us.  if
382          * not, sendarp or resolveaddr6 unlocked it for us.  yikes. */
383         a = arpget(er->f->arp, bp, version, ifc, ip, mac);
384         if (a) {
385                 /* check for broadcast or multicast.  if it is either, this sorts that
386                  * out and returns the bp for the first packet on the arp's hold list.*/
387                 bp = multicastarp(er->f, a, ifc->m, mac);
388                 if (bp == NULL) {
389                         switch (version) {
390                                 case V4:
391                                         sendarp(ifc, a);
392                                         break;
393                                 case V6:
394                                         resolveaddr6(ifc, a);
395                                         break;
396                                 default:
397                                         panic("etherbwrite: version %d", version);
398                         }
399                         return;
400                 }
401         }
402
403         /* make it a single block with space for the ether header */
404         bp = padblock(bp, ifc->m->hsize);
405         if (bp->next)
406                 bp = concatblock(bp);
407         eh = (Etherhdr *) bp->rp;
408
409         /* copy in mac addresses and ether type */
410         etherfilladdr((uint16_t *)bp->rp, (uint16_t *)mac, (uint16_t *)ifc->mac);
411
412         switch (version) {
413                 case V4:
414                         eh->t[0] = 0x08;
415                         eh->t[1] = 0x00;
416                         devtab[er->mchan4->type].bwrite(er->mchan4, bp, 0);
417                         break;
418                 case V6:
419                         eh->t[0] = 0x86;
420                         eh->t[1] = 0xDD;
421                         devtab[er->mchan6->type].bwrite(er->mchan6, bp, 0);
422                         break;
423                 default:
424                         panic("etherbwrite2: version %d", version);
425         }
426         ifc->out++;
427 }
428
429 /*
430  *  process to read from the ethernet
431  */
432 static void etherread4(void *a)
433 {
434         ERRSTACK(2);
435         struct Ipifc *ifc;
436         struct block *bp;
437         Etherrock *er;
438
439         ifc = a;
440         er = ifc->arg;
441         er->read4p = current;   /* hide identity under a rock for unbind */
442         if (waserror()) {
443                 er->read4p = 0;
444                 poperror();
445                 warn("etherread4 returns, probably unexpectedly\n");
446                 return;
447         }
448         for (;;) {
449                 bp = devtab[er->mchan4->type].bread(er->mchan4, 128 * 1024, 0);
450                 if (!canrlock(&ifc->rwlock)) {
451                         freeb(bp);
452                         continue;
453                 }
454                 if (waserror()) {
455                         runlock(&ifc->rwlock);
456                         nexterror();
457                 }
458                 ifc->in++;
459                 bp->rp += ifc->m->hsize;
460                 if (ifc->lifc == NULL) {
461                         freeb(bp);
462                 } else {
463                         ipifc_trace_block(ifc, bp);
464                         ipiput4(er->f, ifc, bp);
465                 }
466                 runlock(&ifc->rwlock);
467                 poperror();
468         }
469         poperror();
470 }
471
472 /*
473  *  process to read from the ethernet, IPv6
474  */
475 static void etherread6(void *a)
476 {
477         ERRSTACK(2);
478         struct Ipifc *ifc;
479         struct block *bp;
480         Etherrock *er;
481
482         ifc = a;
483         er = ifc->arg;
484         er->read6p = current;   /* hide identity under a rock for unbind */
485         if (waserror()) {
486                 er->read6p = 0;
487                 warn("etherread6 returns, probably unexpectedly\n");
488                 poperror();
489                 return;
490         }
491         for (;;) {
492                 bp = devtab[er->mchan6->type].bread(er->mchan6, ifc->maxtu, 0);
493                 if (!canrlock(&ifc->rwlock)) {
494                         freeb(bp);
495                         continue;
496                 }
497                 if (waserror()) {
498                         runlock(&ifc->rwlock);
499                         nexterror();
500                 }
501                 ifc->in++;
502                 bp->rp += ifc->m->hsize;
503                 if (ifc->lifc == NULL) {
504                         freeb(bp);
505                 } else {
506                         ipifc_trace_block(ifc, bp);
507                         ipiput6(er->f, ifc, bp);
508                 }
509                 runlock(&ifc->rwlock);
510                 poperror();
511         }
512         poperror();
513 }
514
515 static void etheraddmulti(struct Ipifc *ifc, uint8_t * a, uint8_t * unused)
516 {
517         uint8_t mac[6];
518         char buf[64];
519         Etherrock *er = ifc->arg;
520         int version;
521
522         version = multicastea(mac, a);
523         snprintf(buf, sizeof(buf), "addmulti %E", mac);
524         switch (version) {
525                 case V4:
526                         devtab[er->cchan4->type].write(er->cchan4, buf, strlen(buf), 0);
527                         break;
528                 case V6:
529                         devtab[er->cchan6->type].write(er->cchan6, buf, strlen(buf), 0);
530                         break;
531                 default:
532                         panic("etheraddmulti: version %d", version);
533         }
534 }
535
536 static void etherremmulti(struct Ipifc *ifc, uint8_t * a, uint8_t * unused)
537 {
538         uint8_t mac[6];
539         char buf[64];
540         Etherrock *er = ifc->arg;
541         int version;
542
543         version = multicastea(mac, a);
544         snprintf(buf, sizeof(buf), "remmulti %E", mac);
545         switch (version) {
546                 case V4:
547                         devtab[er->cchan4->type].write(er->cchan4, buf, strlen(buf), 0);
548                         break;
549                 case V6:
550                         devtab[er->cchan6->type].write(er->cchan6, buf, strlen(buf), 0);
551                         break;
552                 default:
553                         panic("etherremmulti: version %d", version);
554         }
555 }
556
557 /*
558  *  send an ethernet arp
559  *  (only v4, v6 uses the neighbor discovery, rfc1970)
560  *
561  * May drop packets on stale arps. */
562 static void sendarp(struct Ipifc *ifc, struct arpent *a)
563 {
564         int n;
565         struct block *bp;
566         Etherarp *e;
567         Etherrock *er = ifc->arg;
568
569         /* don't do anything if it's been less than a second since the last.  ctime
570          * is set to 0 for the first time through.  we hold the f->arp qlock, so
571          * there shouldn't be a problem with another arp request for this same
572          * arpent coming down til we update ctime again. */
573         if (NOW - a->ctime < 1000) {
574                 arprelease(er->f->arp, a);
575                 return;
576         }
577
578         /* remove all but the last message.  brho: this might be unnecessary.  we'll
579          * eventually send them.  but they should be quite stale at this point. */
580         while ((bp = a->hold) != NULL) {
581                 if (bp == a->last)
582                         break;
583                 a->hold = bp->list;
584                 freeblist(bp);
585         }
586
587         /* update last sent time */
588         a->ctime = NOW;
589         arprelease(er->f->arp, a);
590
591         n = sizeof(Etherarp);
592         if (n < a->type->mintu)
593                 n = a->type->mintu;
594         bp = block_alloc(n, MEM_WAIT);
595         memset(bp->rp, 0, n);
596         e = (Etherarp *) bp->rp;
597         memmove(e->tpa, a->ip + IPv4off, sizeof(e->tpa));
598         ipv4local(ifc, e->spa);
599         memmove(e->sha, ifc->mac, sizeof(e->sha));
600         memset(e->d, 0xff, sizeof(e->d));       /* ethernet broadcast */
601         memmove(e->s, ifc->mac, sizeof(e->s));
602
603         hnputs(e->type, ETARP);
604         hnputs(e->hrd, 1);
605         hnputs(e->pro, ETIP4);
606         e->hln = sizeof(e->sha);
607         e->pln = sizeof(e->spa);
608         hnputs(e->op, ARPREQUEST);
609         bp->wp += n;
610
611         n = devtab[er->achan->type].bwrite(er->achan, bp, 0);
612         if (n < 0)
613                 printd("arp: send: %r\n");
614 }
615
616 static void resolveaddr6(struct Ipifc *ifc, struct arpent *a)
617 {
618         int sflag;
619         struct block *bp;
620         Etherrock *er = ifc->arg;
621         uint8_t ipsrc[IPaddrlen];
622
623         /* don't do anything if it's been less than a second since the last */
624         if (NOW - a->ctime < ReTransTimer) {
625                 arprelease(er->f->arp, a);
626                 return;
627         }
628
629         /* remove all but the last message */
630         while ((bp = a->hold) != NULL) {
631                 if (bp == a->last)
632                         break;
633                 a->hold = bp->list;
634                 freeblist(bp);
635         }
636
637         /* try to keep it around for a second more */
638         a->ctime = NOW;
639         a->rtime = NOW + ReTransTimer;
640         if (a->rxtsrem <= 0) {
641                 arprelease(er->f->arp, a);
642                 return;
643         }
644
645         a->rxtsrem--;
646         arprelease(er->f->arp, a);
647
648         if ((sflag = ipv6anylocal(ifc, ipsrc)))
649                 icmpns(er->f, ipsrc, sflag, a->ip, TARG_MULTI, ifc->mac);
650 }
651
652 /*
653  *  send a gratuitous arp to refresh arp caches
654  */
655 static void sendgarp(struct Ipifc *ifc, uint8_t * ip)
656 {
657         int n;
658         struct block *bp;
659         Etherarp *e;
660         Etherrock *er = ifc->arg;
661
662         /* don't arp for our initial non address */
663         if (ipcmp(ip, IPnoaddr) == 0)
664                 return;
665
666         n = sizeof(Etherarp);
667         if (n < ifc->m->mintu)
668                 n = ifc->m->mintu;
669         bp = block_alloc(n, MEM_WAIT);
670         memset(bp->rp, 0, n);
671         e = (Etherarp *) bp->rp;
672         memmove(e->tpa, ip + IPv4off, sizeof(e->tpa));
673         memmove(e->spa, ip + IPv4off, sizeof(e->spa));
674         memmove(e->sha, ifc->mac, sizeof(e->sha));
675         memset(e->d, 0xff, sizeof(e->d));       /* ethernet broadcast */
676         memmove(e->s, ifc->mac, sizeof(e->s));
677
678         hnputs(e->type, ETARP);
679         hnputs(e->hrd, 1);
680         hnputs(e->pro, ETIP4);
681         e->hln = sizeof(e->sha);
682         e->pln = sizeof(e->spa);
683         hnputs(e->op, ARPREQUEST);
684         bp->wp += n;
685
686         n = devtab[er->achan->type].bwrite(er->achan, bp, 0);
687         if (n < 0)
688                 printd("garp: send: %r\n");
689 }
690
691 static void recvarp(struct Ipifc *ifc)
692 {
693         int n;
694         struct block *ebp, *rbp;
695         Etherarp *e, *r;
696         uint8_t ip[IPaddrlen];
697         static uint8_t eprinted[4];
698         Etherrock *er = ifc->arg;
699
700         ebp = devtab[er->achan->type].bread(er->achan, ifc->maxtu, 0);
701         if (ebp == NULL) {
702                 printd("arp: rcv: %r\n");
703                 return;
704         }
705
706         e = (Etherarp *) ebp->rp;
707         switch (nhgets(e->op)) {
708                 default:
709                         break;
710
711                 case ARPREPLY:
712                         /* check for machine using my ip address */
713                         v4tov6(ip, e->spa);
714                         if (iplocalonifc(ifc, ip) || ipproxyifc(er->f, ifc, ip)) {
715                                 if (memcmp(e->sha, ifc->mac, sizeof(e->sha)) != 0) {
716                                         printd("arprep: 0x%E/0x%E also has ip addr %V\n",
717                                                    e->s, e->sha, e->spa);
718                                         break;
719                                 }
720                         }
721
722                         /* make sure we're not entering broadcast addresses */
723                         if (ipcmp(ip, ipbroadcast) == 0 ||
724                                 !memcmp(e->sha, etherbroadcast, sizeof(e->sha))) {
725                                 printd
726                                         ("arprep: 0x%E/0x%E cannot register broadcast address %I\n",
727                                          e->s, e->sha, e->spa);
728                                 break;
729                         }
730
731                         arpenter(er->f, V4, e->spa, e->sha, sizeof(e->sha), 0);
732                         break;
733
734                 case ARPREQUEST:
735                         /* don't answer arps till we know who we are */
736                         if (ifc->lifc == 0)
737                                 break;
738
739                         /* check for machine using my ip or ether address */
740                         v4tov6(ip, e->spa);
741                         if (iplocalonifc(ifc, ip) || ipproxyifc(er->f, ifc, ip)) {
742                                 if (memcmp(e->sha, ifc->mac, sizeof(e->sha)) != 0) {
743                                         if (memcmp(eprinted, e->spa, sizeof(e->spa))) {
744                                                 /* print only once */
745                                                 printd("arpreq: 0x%E also has ip addr %V\n", e->sha,
746                                                            e->spa);
747                                                 memmove(eprinted, e->spa, sizeof(e->spa));
748                                         }
749                                 }
750                         } else {
751                                 if (memcmp(e->sha, ifc->mac, sizeof(e->sha)) == 0) {
752                                         printd("arpreq: %V also has ether addr %E\n", e->spa,
753                                                    e->sha);
754                                         break;
755                                 }
756                         }
757
758                         /* refresh what we know about sender */
759                         arpenter(er->f, V4, e->spa, e->sha, sizeof(e->sha), 1);
760
761                         /* answer only requests for our address or systems we're proxying for */
762                         v4tov6(ip, e->tpa);
763                         if (!iplocalonifc(ifc, ip))
764                                 if (!ipproxyifc(er->f, ifc, ip))
765                                         break;
766
767                         n = sizeof(Etherarp);
768                         if (n < ifc->mintu)
769                                 n = ifc->mintu;
770                         rbp = block_alloc(n, MEM_WAIT);
771                         r = (Etherarp *) rbp->rp;
772                         memset(r, 0, sizeof(Etherarp));
773                         hnputs(r->type, ETARP);
774                         hnputs(r->hrd, 1);
775                         hnputs(r->pro, ETIP4);
776                         r->hln = sizeof(r->sha);
777                         r->pln = sizeof(r->spa);
778                         hnputs(r->op, ARPREPLY);
779                         memmove(r->tha, e->sha, sizeof(r->tha));
780                         memmove(r->tpa, e->spa, sizeof(r->tpa));
781                         memmove(r->sha, ifc->mac, sizeof(r->sha));
782                         memmove(r->spa, e->tpa, sizeof(r->spa));
783                         memmove(r->d, e->sha, sizeof(r->d));
784                         memmove(r->s, ifc->mac, sizeof(r->s));
785                         rbp->wp += n;
786
787                         n = devtab[er->achan->type].bwrite(er->achan, rbp, 0);
788                         if (n < 0)
789                                 printd("arp: write: %r\n");
790         }
791         freeb(ebp);
792 }
793
794 static void recvarpproc(void *v)
795 {
796         ERRSTACK(1);
797         struct Ipifc *ifc = v;
798         Etherrock *er = ifc->arg;
799
800         er->arpp = current;
801         if (waserror()) {
802                 er->arpp = 0;
803                 warn("recvarpproc returns, probably unexpectedly\n");
804                 poperror();
805                 return;
806         }
807         for (;;)
808                 recvarp(ifc);
809         poperror();
810 }
811
812 static int multicastea(uint8_t * ea, uint8_t * ip)
813 {
814         int x;
815
816         switch (x = ipismulticast(ip)) {
817                 case V4:
818                         ea[0] = 0x01;
819                         ea[1] = 0x00;
820                         ea[2] = 0x5e;
821                         ea[3] = ip[13] & 0x7f;
822                         ea[4] = ip[14];
823                         ea[5] = ip[15];
824                         break;
825                 case V6:
826                         ea[0] = 0x33;
827                         ea[1] = 0x33;
828                         ea[2] = ip[12];
829                         ea[3] = ip[13];
830                         ea[4] = ip[14];
831                         ea[5] = ip[15];
832                         break;
833         }
834         return x;
835 }
836
837 /*
838  *  fill in an arp entry for broadcast or multicast
839  *  addresses.  Return the first queued packet for the
840  *  IP address.
841  */
842 static struct block *multicastarp(struct Fs *f,
843                                                                   struct arpent *a, struct medium *medium,
844                                                                   uint8_t * mac)
845 {
846         /* is it broadcast? */
847         switch (ipforme(f, a->ip)) {
848                 case Runi:
849                         return NULL;
850                 case Rbcast:
851                         memset(mac, 0xff, 6);
852                         return arpresolve(f->arp, a, medium, mac);
853                 default:
854                         break;
855         }
856
857         /* if multicast, fill in mac */
858         switch (multicastea(mac, a->ip)) {
859                 case V4:
860                 case V6:
861                         return arpresolve(f->arp, a, medium, mac);
862         }
863
864         /* let arp take care of it */
865         return NULL;
866 }
867
868 linker_func_4(ethermediumlink)
869 {
870         addipmedium(&ethermedium);
871         addipmedium(&trexmedium);
872 }
873
874 static void etherpref2addr(uint8_t * pref, uint8_t * ea)
875 {
876         pref[8] = ea[0] | 0x2;
877         pref[9] = ea[1];
878         pref[10] = ea[2];
879         pref[11] = 0xFF;
880         pref[12] = 0xFE;
881         pref[13] = ea[3];
882         pref[14] = ea[4];
883         pref[15] = ea[5];
884 }