Changes devether's Max Trans Unit to 1500
[akaros.git] / kern / drivers / net / bnx2x / bnx2x_dev.c
1 /* This file is part of the UCB release of Plan 9. It is subject to the license
2  * terms in the LICENSE file found in the top-level directory of this
3  * distribution and at http://akaros.cs.berkeley.edu/files/Plan9License. No
4  * part of the UCB release of Plan 9, including this file, may be copied,
5  * modified, propagated, or distributed except according to the terms contained
6  * in the LICENSE file. */
7
8 /* Network driver stub for bnx2x_ */
9
10 #include <vfs.h>
11 #include <kfs.h>
12 #include <slab.h>
13 #include <kmalloc.h>
14 #include <kref.h>
15 #include <string.h>
16 #include <stdio.h>
17 #include <assert.h>
18 #include <error.h>
19 #include <cpio.h>
20 #include <pmap.h>
21 #include <smp.h>
22 #include <arch/pci.h>
23 #include <ip.h>
24 #include <ns.h>
25 #include "bnx2x.h"
26
27 /* TODO: Cheap externs */
28 extern int __init bnx2x_init(void);
29 extern bool is_bnx2x_dev(struct pci_device *dev);
30 extern const struct pci_device_id *
31                     srch_bnx2x_pci_tbl(struct pci_device *needle);
32 extern int bnx2x_init_one(struct ether *dev, struct bnx2x *bp,
33                           struct pci_device *pdev,
34                           const struct pci_device_id *ent);
35 extern int bnx2x_open(struct ether *dev);
36 extern void bnx2x_set_rx_mode(struct ether *dev);
37 extern netdev_tx_t bnx2x_start_xmit(struct block *block,
38                                     struct bnx2x_fp_txdata *txdata);
39
40 spinlock_t bnx2x_tq_lock = SPINLOCK_INITIALIZER;
41 TAILQ_HEAD(bnx2x_tq, bnx2x);
42 struct bnx2x_tq bnx2x_tq = TAILQ_HEAD_INITIALIZER(bnx2x_tq);
43
44 /* We're required to print out stats at some point.  Here are a couple from
45  * igbe, as an example. */
46 static char *statistics[Nstatistics] = {
47         "CRC Error",
48         "Alignment Error",
49 };
50
51 static long bnx2x_ifstat(struct ether *edev, void *a, long n, uint32_t offset)
52 {
53         struct bnx2x *ctlr;
54         char *p, *s;
55         int i, l, r;
56         uint64_t tuvl, ruvl;
57
58         ctlr = edev->ctlr;
59         qlock(&ctlr->slock);
60         p = kzmalloc(READSTR, 0);
61         if (p == NULL) {
62                 qunlock(&ctlr->slock);
63                 error(Enomem);
64         }
65         l = 0;
66         for (i = 0; i < Nstatistics; i++) {
67                 /* somehow read the device's HW stats */
68                 //r = csr32r(ctlr, Statistics + i * 4);
69                 r = 3;  /* TODO: this is the value for the statistic */
70                 if ((s = statistics[i]) == NULL)
71                         continue;
72                 /* based on the stat, spit out a string */
73                 switch (i) {
74                         default:
75                                 ctlr->statistics[i] += r;
76                                 if (ctlr->statistics[i] == 0)
77                                         continue;
78                                 l += snprintf(p + l, READSTR - l, "%s: %ud %ud\n",
79                                                           s, ctlr->statistics[i], r);
80                                 break;
81                 }
82         }
83
84         /* TODO: then print out the software-only (ctlr) stats */
85 //      l += snprintf(p + l, READSTR - l, "lintr: %ud %ud\n",
86 //                                ctlr->lintr, ctlr->lsleep);
87         n = readstr(offset, a, n, p);
88         kfree(p);
89         qunlock(&ctlr->slock);
90
91         return n;
92 }
93
94 static long bnx2x_ctl(struct ether *edev, void *buf, long n)
95 {
96         ERRSTACK(1);
97         int v;
98         char *p;
99         struct bnx2x *ctlr;
100         struct cmdbuf *cb;
101         struct cmdtab *ct;
102
103         if ((ctlr = edev->ctlr) == NULL)
104                 error(Enonexist);
105         cb = parsecmd(buf, n);
106         if (waserror()) {
107                 kfree(cb);
108                 nexterror();
109         }
110
111         /* TODO: handle ctl command somehow.  igbe did the following: */
112         //ct = lookupcmd(cb, igbectlmsg, ARRAY_SIZE(igbectlmsg));
113         
114         kfree(cb);
115         poperror();
116         return n;
117 }
118
119 static void bnx2x_promiscuous(void *arg, int on)
120 {
121         int rctl;
122         struct bnx2x *ctlr;
123         struct ether *edev;
124
125         edev = arg;
126         ctlr = edev->ctlr;
127         /* TODO: set promisc on/off */
128 }
129
130 static void bnx2x_multicast(void *arg, uint8_t * addr, int add)
131 {
132         int bit, x;
133         struct bnx2x *ctlr;
134         struct ether *edev;
135
136         edev = arg;
137         ctlr = edev->ctlr;
138         /* TODO: add or remove a multicast addr */
139 }
140
141 /* The poke function: we are guaranteed that only one copy of this func runs
142  * per poke tracker (per queue).  Both transmit and tx_int will poke, and after
143  * any pokes, the func will run at least once.
144  *
145  * Some notes for optimizing and synchronization:
146  *
147  * If we want a flag or something to keep us from checking the oq and attempting
148  * the xmit, all that will do is speed up xmit when the tx rings are full.
149  * You'd need to be careful.  The post/poke makes sure that this'll run after
150  * work was posted, but if this function sets an abort flag and later checks it,
151  * you need to check tx_avail *after* setting the flag (check, signal, check
152  * again).  Consider this:
153  *
154  * this func:
155  *              calls start_xmit, fails with BUSY.  wants to set ABORT flag
156  *
157  *      PAUSE - meanwhile:
158  *
159  * tx_int clears the ABORT flag, then pokes:
160  *              drain so there is room;
161  *              clear flag (combo of these is "post work");
162  *              poke;.  guaranteed that poke will happen after we cleared flag.
163  *                      but it is concurrent with this function
164  *
165  *              RESUME this func:
166  *
167  *              sets ABORT flag
168  *              returns.
169  *              tx_int's poke ensures we run again
170  *              we run again and see ABORT, then return
171  *              never try again til the next tx_int, if ever
172  *
173  * Instead, in this func, we must set ABORT flag, then check tx_avail.  Or
174  * have two flags, one set by us, another set by tx_int, where this func only
175  * clears the tx_int flag when it will attempt a start_xmit.
176  *
177  * It's probably easier to just check tx_avail before entering the while loop,
178  * if you're really concerned.  If you want to do the flag thing, probably use
179  * two flags (atomically), and be careful. */
180 void __bnx2x_tx_queue(void *txdata_arg)
181 {
182         struct bnx2x_fp_txdata *txdata = txdata_arg;
183         struct block *block;
184         struct queue *oq = txdata->oq;
185
186         /* TODO: avoid bugs til multi-queue is working */
187         assert(oq);
188         assert(txdata->txq_index == 0);
189
190         while ((block = qget(oq))) {
191                 if ((bnx2x_start_xmit(block, txdata) != NETDEV_TX_OK)) {
192                         /* all queue readers are sync'd by the poke, so we can putback
193                          * without fear of going out of order. */
194
195                         /* TODO: q code has methods that should be called with the spinlock
196                          * held, but no methods to do the locking... */
197                         //spin_unlock_irqsave(&oq->lock);
198                         qputback(oq, block);
199                         //spin_lock_irqsave(&oq->lock);
200
201                         /* device can't handle any more, we're done for now.  tx_int will
202                          * poke when space frees up.  it may be poking concurrently, and in
203                          * which case, we'll run again immediately. */
204                         break;
205                 }
206         }
207 }
208
209 static void bnx2x_transmit(struct ether *edev)
210 {
211         struct bnx2x *ctlr = edev->ctlr;
212         struct bnx2x_fp_txdata *txdata;
213         /* TODO: determine the tx queue we're supposed to work on */
214         int txq_index = 0;
215
216         txdata = &ctlr->bnx2x_txq[txq_index];
217         poke(&txdata->poker, txdata);
218 }
219
220 /* Not mandatory.  Called to make sure there are free blocks available for
221  * incoming packets */
222 static void bnx2x_replenish(struct bnx2x *ctlr)
223 {
224         struct block *bp;
225
226         while (1) {
227         //while (NEXT_RING(rdt, ctlr->nrd) != ctlr->rdh) {
228                 //if we want a new block
229                 {
230                         bp = iallocb(64); // TODO: use your block size, e.g. Rbsz
231                         if (bp == NULL) {
232                                 /* needs to be a safe print for interrupt level */
233                                 printk("#l%d bnx2x_replenish: no available buffers\n",
234                                            ctlr->edev->ctlrno);
235                                 break;
236                         }
237                         //ctlr->rb[rdt] = bp;
238                         //rd->addr[0] = paddr_low32(bp->rp);
239                         //rd->addr[1] = paddr_high32(bp->rp);
240                 }
241                 wmb();  /* ensure prev rd writes come before status = 0. */
242                 //rd->status = 0;
243         }
244 }
245
246 /* Not mandatory.  Device init. */
247 static void bnx2x_rxinit(struct bnx2x *ctlr)
248 {
249         bnx2x_replenish(ctlr);
250 }
251
252 static int bnx2x_rim(void* ctlr)
253 {
254         //return ((struct bnx2x*)ctlr)->rim != 0;
255         return 1;
256 }
257
258 /* Do we want a receive proc?  It is similar to softirq.  Or we can do the work
259  * in hard IRQ ctx. */
260 static void bnx2x_rproc(void *arg)
261 {
262         struct block *bp;
263         struct bnx2x *ctlr;
264         struct ether *edev;
265
266         edev = arg;
267         ctlr = edev->ctlr;
268
269         bnx2x_rxinit(ctlr);
270         /* TODO: one time RX init */
271
272
273         for (;;) {
274                 /* TODO: set up, once per sleep.  make sure we'll wake up */
275                 rendez_sleep(&ctlr->rrendez, bnx2x_rim, ctlr);
276
277                 for (;;) {
278                         /* if we can get a block, here's how to ram it up the stack */
279
280                         if (1) {
281                                 bp = (void*)0xdeadbeef;
282                                 //bp = ctlr->rb[rdh];
283                                 //bp->wp += rd->length;
284                                 //bp->next = NULL;
285                                 /* conditionally, set block flags */
286                                         //bp->flag |= Bipck; /* IP checksum done in HW */
287                                         //bp->flag |= Btcpck | Budpck;
288                                         //bp->checksum = rd->checksum;
289                                         //bp->flag |= Bpktck;   /* Packet checksum? */
290                                 etheriq(edev, bp, 1);
291                         } else {
292                                 //freeb(ctlr->rb[rdh]);
293                         }
294
295                 }
296                 // optionally
297                         bnx2x_replenish(ctlr);
298         }
299 }
300
301 static void bnx2x_attach(struct ether *edev)
302 {
303         ERRSTACK(1);
304         struct block *bp;
305         struct bnx2x *ctlr;
306         char *name;
307
308         ctlr = edev->ctlr;
309         ctlr->edev = edev;      /* point back to Ether* */
310
311         qlock(&ctlr->alock);
312         if (ctlr->attached) {
313                 qunlock(&ctlr->alock);
314                 return;
315         }
316
317         bnx2x_open(ctlr->edev);
318         bnx2x_set_rx_mode(edev);
319
320         /* shut it up for now.  too much stats output */
321         ctlr->msg_enable = 0;
322
323         ctlr->attached = TRUE;
324         qunlock(&ctlr->alock);
325         /* not sure if we'll need/want any of the other 9ns stuff */
326         return;
327
328         /* Alloc all your ctrl crap. */
329
330         /* the ktasks should free these names, if they ever exit */
331         name = kmalloc(KNAMELEN, KMALLOC_WAIT);
332         snprintf(name, KNAMELEN, "#l%d-bnx2x_rproc", edev->ctlrno);
333         ktask(name, bnx2x_rproc, edev);
334
335         qunlock(&ctlr->alock);
336 }
337
338 /* Hard IRQ */
339 static void bnx2x_interrupt(struct hw_trapframe *hw_tf, void *arg)
340 {
341         struct bnx2x *ctlr;
342         struct ether *edev;
343         int icr, im, txdw;
344
345         edev = arg;
346         ctlr = edev->ctlr;
347
348                         /* At some point, wake up the rproc */
349                         rendez_wakeup(&ctlr->rrendez);
350
351         /* optionally, might need to transmit (not sure if this is a good idea in
352          * hard irq or not) */
353         bnx2x_transmit(edev);
354 }
355
356 static void bnx2x_shutdown(struct ether *ether)
357 {
358         /*
359          * Perform a device reset to get the chip back to the
360          * power-on state, followed by an EEPROM reset to read
361          * the defaults for some internal registers.
362          */
363         /* igbe did: */
364         //igbedetach(ether->ctlr);
365 }
366
367 /* "reset", getting it back to the basic power-on state.  9ns drivers call this
368  * during the initial setup (from the PCI func) */
369 static int bnx2x_reset(struct bnx2x *ctlr)
370 {
371         int ctrl, i, pause, r, swdpio, txcw;
372
373         bnx2x_init_one(ctlr->edev, ctlr, ctlr->pcidev, ctlr->pci_id);
374         return 0;
375 }
376
377 static void bnx2x_pci(void)
378 {
379         int cls, id;
380         struct pci_device *pcidev;
381         struct bnx2x *ctlr;
382         const struct pci_device_id *pci_id;
383
384         bnx2x_init();
385
386         STAILQ_FOREACH(pcidev, &pci_devices, all_dev) {
387                 /* This checks that pcidev is a Network Controller for Ethernet */
388                 if (pcidev->class != 0x02 || pcidev->subclass != 0x00)
389                         continue;
390                 id = pcidev->dev_id << 16 | pcidev->ven_id;
391
392                 pci_id = srch_bnx2x_pci_tbl(pcidev);
393                 if (!pci_id)
394                         continue;
395
396                 printk("bnx2x driver found 0x%04x:%04x at %02x:%02x.%x\n",
397                            pcidev->ven_id, pcidev->dev_id,
398                            pcidev->bus, pcidev->dev, pcidev->func);
399
400                 /* MMIO, pci_bus_master, etc, are all done in bnx2x_attach */
401
402                 cls = pcidev_read8(pcidev, PCI_CLSZ_REG);
403                 switch (cls) {
404                         default:
405                                 printd("bnx2x: unexpected CLS - %d\n", cls * 4);
406                                 break;
407                         case 0x00:
408                         case 0xFF:
409                                 /* bogus value; use a sane default.  cls is set in DWORD (u32)
410                                  * units. */
411                                 cls = ARCH_CL_SIZE / sizeof(long);
412                                 pcidev_write8(pcidev, PCI_CLSZ_REG, cls);
413                                 break;
414                         case 0x08:
415                         case 0x10:
416                                 break;
417                 }
418
419                 ctlr = kzmalloc(sizeof(struct bnx2x), 0);
420                 if (ctlr == NULL)
421                         error(Enomem);
422
423                 spinlock_init_irqsave(&ctlr->imlock);
424                 spinlock_init_irqsave(&ctlr->tlock);
425                 qlock_init(&ctlr->alock);
426                 qlock_init(&ctlr->slock);
427                 rendez_init(&ctlr->rrendez);
428
429                 ctlr->pcidev = pcidev;
430                 ctlr->pci_id = pci_id;
431                 
432                 spin_lock(&bnx2x_tq_lock);
433                 TAILQ_INSERT_TAIL(&bnx2x_tq, ctlr, link9ns);
434                 spin_unlock(&bnx2x_tq_lock);
435         }
436 }
437
438 /* Called by devether's probe routines.  Return -1 if the edev does not match
439  * any of your ctlrs. */
440 static int bnx2x_pnp(struct ether *edev)
441 {
442         struct bnx2x *ctlr;
443
444         /* Allocs ctlrs for all PCI devices matching our IDs, does various PCI and
445          * MMIO/port setup */
446         run_once(bnx2x_pci());
447
448         spin_lock(&bnx2x_tq_lock);
449         TAILQ_FOREACH(ctlr, &bnx2x_tq, link9ns) {
450                 /* just take the first inactive ctlr on the list */
451                 if (ctlr->active)
452                         continue;
453                 ctlr->active = 1;
454                 break;
455         }
456         spin_unlock(&bnx2x_tq_lock);
457         if (ctlr == NULL)
458                 return -1;
459
460         edev->ctlr = ctlr;
461         ctlr->edev = edev;
462
463         //edev->port = ctlr->port;      /* might just remove this from devether */
464         edev->irq = ctlr->pcidev->irqline;
465         edev->tbdf = MKBUS(BusPCI, ctlr->pcidev->bus, ctlr->pcidev->dev,
466                            ctlr->pcidev->func);
467         edev->mbps = 1000;
468         memmove(edev->ea, ctlr->link_params.mac_addr, Eaddrlen);
469         
470         /*
471          * Linkage to the generic ethernet driver.
472          */
473         edev->attach = bnx2x_attach;
474         edev->transmit = bnx2x_transmit;
475         edev->ifstat = bnx2x_ifstat;
476         edev->ctl = bnx2x_ctl;
477         edev->shutdown = bnx2x_shutdown;
478
479         edev->arg = edev;
480         edev->promiscuous = bnx2x_promiscuous;
481         edev->multicast = bnx2x_multicast;
482
483         bnx2x_reset(ctlr);
484
485         return 0;
486 }
487
488 linker_func_3(etherbnx2x_link)
489 {
490         addethercard("bnx2x", bnx2x_pnp);
491 }