First checking of virtio-mmio.c from qemu.
[akaros.git] / tests / vmrunkernel.c
1 #include <stdio.h> 
2 #include <pthread.h>
3 #include <sys/types.h>
4 #include <sys/stat.h>
5 #include <fcntl.h>
6 #include <parlib/arch/arch.h>
7 #include <parlib/ros_debug.h>
8 #include <unistd.h>
9 #include <errno.h>
10 #include <dirent.h>
11 #include <stdlib.h>
12 #include <string.h>
13 #include <ros/syscall.h>
14 #include <sys/mman.h>
15 #include <vmm/coreboot_tables.h>
16 #include <ros/vmm.h>
17 #include <vmm/virtio.h>
18 #include <vmm/virtio_mmio.h>
19 #include <vmm/virtio_ids.h>
20
21 /* this test will run the "kernel" in the negative address space. We hope. */
22 int *mmap_blob;
23 unsigned long long stack[1024];
24 volatile int shared = 0;
25 volatile int quit = 0;
26 int mcp = 1;
27
28 #define MiB 0x100000u
29 #define GiB (1u<<30)
30 #define VIRTIOBASE (15*MiB)
31 #define GKERNBASE (16*MiB)
32 #define KERNSIZE (128*MiB+GKERNBASE)
33 uint8_t _kernel[KERNSIZE];
34
35 unsigned long long *p512, *p1, *p2m;
36
37 pthread_t *my_threads;
38 void **my_retvals;
39 int nr_threads = 2;
40 char *line, *consline, *outline;
41 struct scatterlist iov[32];
42 unsigned int inlen, outlen, conslen;
43 /* unlike Linux, this shared struct is for both host and guest. */
44 //      struct virtqueue *constoguest = 
45 //              vring_new_virtqueue(0, 512, 8192, 0, inpages, NULL, NULL, "test");
46 volatile int gaveit = 0, gotitback = 0;
47 struct virtqueue *guesttocons;
48 struct scatterlist out[] = { {NULL, sizeof(outline)}, };
49 struct scatterlist in[] = { {NULL, sizeof(line)}, };
50
51 static inline uint32_t read32(const volatile void *addr)
52 {
53         return *(const volatile uint32_t *)addr;
54 }
55
56 static inline void write32(volatile void *addr, uint32_t value)
57 {
58         *(volatile uint32_t *)addr = value;
59 }
60
61 void dumpvirtio_mmio(FILE *f, void *v)
62 {
63         fprintf(f, "VIRTIO_MMIO_MAGIC_VALUE: 0x%x\n", read32(v+VIRTIO_MMIO_MAGIC_VALUE));
64         fprintf(f, "VIRTIO_MMIO_VERSION: 0x%x\n", read32(v+VIRTIO_MMIO_VERSION));
65         fprintf(f, "VIRTIO_MMIO_DEVICE_ID: 0x%x\n", read32(v+VIRTIO_MMIO_DEVICE_ID));
66         fprintf(f, "VIRTIO_MMIO_VENDOR_ID: 0x%x\n", read32(v+VIRTIO_MMIO_VENDOR_ID));
67         fprintf(f, "VIRTIO_MMIO_DEVICE_FEATURES: 0x%x\n", read32(v+VIRTIO_MMIO_DEVICE_FEATURES));
68         fprintf(f, "VIRTIO_MMIO_DEVICE_FEATURES_SEL: 0x%x\n", read32(v+VIRTIO_MMIO_DEVICE_FEATURES_SEL));
69         fprintf(f, "VIRTIO_MMIO_DRIVER_FEATURES: 0x%x\n", read32(v+VIRTIO_MMIO_DRIVER_FEATURES));
70         fprintf(f, "VIRTIO_MMIO_DRIVER_FEATURES_SEL: 0x%x\n", read32(v+VIRTIO_MMIO_DRIVER_FEATURES_SEL));
71         fprintf(f, "VIRTIO_MMIO_GUEST_PAGE_SIZE: 0x%x\n", read32(v+VIRTIO_MMIO_GUEST_PAGE_SIZE));
72         fprintf(f, "VIRTIO_MMIO_QUEUE_SEL: 0x%x\n", read32(v+VIRTIO_MMIO_QUEUE_SEL));
73         fprintf(f, "VIRTIO_MMIO_QUEUE_NUM_MAX: 0x%x\n", read32(v+VIRTIO_MMIO_QUEUE_NUM_MAX));
74         fprintf(f, "VIRTIO_MMIO_QUEUE_NUM: 0x%x\n", read32(v+VIRTIO_MMIO_QUEUE_NUM));
75         fprintf(f, "VIRTIO_MMIO_QUEUE_ALIGN: 0x%x\n", read32(v+VIRTIO_MMIO_QUEUE_ALIGN));
76         fprintf(f, "VIRTIO_MMIO_QUEUE_PFN: 0x%x\n", read32(v+VIRTIO_MMIO_QUEUE_PFN));
77         fprintf(f, "VIRTIO_MMIO_QUEUE_READY: 0x%x\n", read32(v+VIRTIO_MMIO_QUEUE_READY));
78         fprintf(f, "VIRTIO_MMIO_QUEUE_NOTIFY: 0x%x\n", read32(v+VIRTIO_MMIO_QUEUE_NOTIFY));
79         fprintf(f, "VIRTIO_MMIO_INTERRUPT_STATUS: 0x%x\n", read32(v+VIRTIO_MMIO_INTERRUPT_STATUS));
80         fprintf(f, "VIRTIO_MMIO_INTERRUPT_ACK: 0x%x\n", read32(v+VIRTIO_MMIO_INTERRUPT_ACK));
81         fprintf(f, "VIRTIO_MMIO_STATUS: 0x%x\n", read32(v+VIRTIO_MMIO_STATUS));
82         fprintf(f, "VIRTIO_MMIO_QUEUE_DESC_LOW: 0x%x\n", read32(v+VIRTIO_MMIO_QUEUE_DESC_LOW));
83         fprintf(f, "VIRTIO_MMIO_QUEUE_DESC_HIGH: 0x%x\n", read32(v+VIRTIO_MMIO_QUEUE_DESC_HIGH));
84         fprintf(f, "VIRTIO_MMIO_QUEUE_AVAIL_LOW: 0x%x\n", read32(v+VIRTIO_MMIO_QUEUE_AVAIL_LOW));
85         fprintf(f, "VIRTIO_MMIO_QUEUE_AVAIL_HIGH: 0x%x\n", read32(v+VIRTIO_MMIO_QUEUE_AVAIL_HIGH));
86         fprintf(f, "VIRTIO_MMIO_QUEUE_USED_LOW: 0x%x\n", read32(v+VIRTIO_MMIO_QUEUE_USED_LOW));
87         fprintf(f, "VIRTIO_MMIO_QUEUE_USED_HIGH: 0x%x\n", read32(v+VIRTIO_MMIO_QUEUE_USED_HIGH));
88         fprintf(f, "VIRTIO_MMIO_CONFIG_GENERATION: 0x%x\n", read32(v+VIRTIO_MMIO_CONFIG_GENERATION));
89 }
90 static void setupconsole(void *v)
91 {
92         // try to make linux happy.
93         // this is not really endian safe but ... well ... WE'RE ON THE SAME MACHINE
94         write32(v+VIRTIO_MMIO_MAGIC_VALUE, ('v' | 'i' << 8 | 'r' << 16 | 't' << 24));
95         // no constant for this is defined anywhere. It's just 1.
96         write32(v+VIRTIO_MMIO_VERSION, 1);
97         write32(v+VIRTIO_MMIO_DEVICE_ID, VIRTIO_ID_CONSOLE);
98         write32(v+VIRTIO_MMIO_QUEUE_NUM_MAX, 1);
99         write32(v+VIRTIO_MMIO_QUEUE_PFN, 0);
100 }
101
102 int debug = 1;
103
104 struct ttargs {
105         void *virtio;
106 };
107
108 void *talk_thread(void *arg)
109 {
110         struct ttargs *a = arg;
111         void *v = a->virtio;
112         fprintf(stderr, "talk thread ..\n");
113         uint16_t head;
114         uint32_t vv;
115         int i;
116         int num;
117         printf("Sleep 15 seconds\n");
118         uthread_sleep(15);
119         printf("----------------------- TT a %p\n", a);
120         printf("talk thread ttargs %x v %x\n", a, v);
121         
122         if (debug) printf("Spin on console being read, print num queues, halt\n");
123         while ((vv = read32(v+VIRTIO_MMIO_DRIVER_FEATURES)) == 0) {
124                 printf("no ready ... \n");
125                 if (debug) {
126                         dumpvirtio_mmio(stdout, v);
127                 }
128                 printf("sleep 1 second\n");
129                 uthread_sleep(1);
130         }
131         if (debug)printf("vv %x, set selector %x\n", vv, read32(v + VIRTIO_MMIO_DRIVER_FEATURES_SEL));
132         if (debug) printf("loop forever");
133         while (! quit)
134                 ;
135         for(num = 0;;num++) {
136                 /* host: use any buffers we should have been sent. */
137                 head = wait_for_vq_desc(guesttocons, iov, &outlen, &inlen);
138                 if (debug)
139                         printf("vq desc head %d, gaveit %d gotitback %d\n", head, gaveit, gotitback);
140                 for(i = 0; debug && i < outlen + inlen; i++)
141                         printf("v[%d/%d] v %p len %d\n", i, outlen + inlen, iov[i].v, iov[i].length);
142                 /* host: if we got an output buffer, just output it. */
143                 for(i = 0; i < outlen; i++) {
144                         num++;
145                         printf("Host:%s:\n", (char *)iov[i].v);
146                 }
147                 
148                 if (debug)
149                         printf("outlen is %d; inlen is %d\n", outlen, inlen);
150                 /* host: fill in the writeable buffers. */
151                 for (i = outlen; i < outlen + inlen; i++) {
152                         /* host: read a line. */
153                         memset(consline, 0, 128);
154                         if (1) {
155                                 if (fgets(consline, 4096-256, stdin) == NULL) {
156                                         exit(0);
157                                 } 
158                                 if (debug) printf("GOT A LINE:%s:\n", consline);
159                         } else {
160                                 sprintf(consline, "hi there. %d\n", i);
161                         }
162                         memmove(iov[i].v, consline, strlen(consline)+ 1);
163                         iov[i].length = strlen(consline) + 1;
164                 }
165                 if (debug) printf("call add_used\n");
166                 /* host: now ack that we used them all. */
167                 add_used(guesttocons, head, outlen+inlen);
168                 if (debug) printf("DONE call add_used\n");
169         }
170         fprintf(stderr, "All done\n");
171         return NULL;
172 }
173
174 struct ttargs t;
175         
176
177 int main(int argc, char **argv)
178 {
179         struct vmctl vmctl;
180         int amt;
181         int vmmflags = VMM_VMCALL_PRINTF;
182         uint64_t entry = 0x1000000, kerneladdress = 0x1000000;
183         int nr_gpcs = 1;
184         int fd = open("#c/vmctl", O_RDWR), ret;
185         void * x;
186         int kfd = -1;
187         static char cmd[512];
188         void *coreboot_tables = (void *) 0x1165000;
189         /* kernel has to be in the range VIRTIOBASE to KERNSIZE+GKERNBASE for now. */
190         // mmap is not working for us at present.
191         if ((uint64_t)_kernel > VIRTIOBASE) {
192                 printf("kernel array @%p is above , VIRTIOBASE@%p sucks\n", _kernel, VIRTIOBASE);
193                 exit(1);
194         }
195         memset(_kernel, 0, sizeof(_kernel));
196
197         if (fd < 0) {
198                 perror("#c/sysctl");
199                 exit(1);
200         }
201         argc--,argv++;
202         // switches ...
203         // Sorry, I don't much like the gnu opt parsing code.
204         while (1) {
205                 if (*argv[0] != '-')
206                         break;
207                 switch(argv[0][1]) {
208                 case 'n':
209                         vmmflags &= ~VMM_VMCALL_PRINTF;
210                         break;
211                 default:
212                         printf("BMAFR\n");
213                         break;
214                 }
215                 argc--,argv++;
216         }
217         if (argc < 1) {
218                 fprintf(stderr, "Usage: %s vmimage [-n (no vmcall printf)] [coreboot_tables [loadaddress [entrypoint]]]\n", argv[0]);
219                 exit(1);
220         }
221         if (argc > 1)
222                 coreboot_tables = (void *) strtoull(argv[1], 0, 0);
223         if (argc > 2)
224                 kerneladdress = strtoull(argv[2], 0, 0);
225         if (argc > 3)
226                 entry = strtoull(argv[3], 0, 0);
227         kfd = open(argv[0], O_RDONLY);
228         if (kfd < 0) {
229                 perror(argv[0]);
230                 exit(1);
231         }
232         // read in the kernel.
233         x = (void *)kerneladdress;
234         for(;;) {
235                 amt = read(kfd, x, 1048576);
236                 if (amt < 0) {
237                         perror("read");
238                         exit(1);
239                 }
240                 if (amt == 0) {
241                         break;
242                 }
243                 x += amt;
244         }
245         fprintf(stderr, "Read in %d bytes\n", x-kerneladdress);
246
247         fprintf(stderr, "Run with %d cores and vmmflags 0x%x\n", nr_gpcs, vmmflags);
248         if (ros_syscall(SYS_setup_vmm, nr_gpcs, vmmflags, 0, 0, 0, 0) != nr_gpcs) {
249                 perror("Guest pcore setup failed");
250                 exit(1);
251         }
252         /* blob that is faulted in from the EPT first.  we need this to be in low
253          * memory (not above the normal mmap_break), so the EPT can look it up.
254          * Note that we won't get 4096.  The min is 1MB now, and ld is there. */
255         mmap_blob = mmap((int*)4096, PGSIZE, PROT_READ | PROT_WRITE,
256                          MAP_ANONYMOUS, -1, 0);
257         if (mmap_blob == MAP_FAILED) {
258                 perror("Unable to mmap");
259                 exit(1);
260         }
261
262         mcp = 1;
263         if (mcp) {
264                 my_threads = malloc(sizeof(pthread_t) * nr_threads);
265                 my_retvals = malloc(sizeof(void*) * nr_threads);
266                 if (!(my_retvals && my_threads))
267                         perror("Init threads/malloc");
268
269                 pthread_can_vcore_request(FALSE);       /* 2LS won't manage vcores */
270                 pthread_need_tls(FALSE);
271                 pthread_mcp_init();                                     /* gives us one vcore */
272                 vcore_request(nr_threads - 1);          /* ghetto incremental interface */
273                 for (int i = 0; i < nr_threads; i++) {
274                         x = __procinfo.vcoremap;
275                         printf("%p\n", __procinfo.vcoremap);
276                         printf("Vcore %d mapped to pcore %d\n", i,
277                                 __procinfo.vcoremap[i].pcoreid);
278                 }
279         }
280
281         t.virtio = (void *)VIRTIOBASE;
282
283         ret = syscall(33, 1);
284         if (ret < 0) {
285                 perror("vm setup");
286                 exit(1);
287         }
288         ret = posix_memalign((void **)&p512, 4096, 3*4096);
289         printf("memalign is %p\n", p512);
290         if (ret) {
291                 perror("ptp alloc");
292                 exit(1);
293         }
294         p1 = &p512[512];
295         p2m = &p512[1024];
296         uint64_t kernbase = 0; //0xffffffff80000000;
297         uint64_t highkernbase = 0xffffffff80000000;
298         p512[PML4(kernbase)] = (unsigned long long)p1 | 7;
299         p1[PML3(kernbase)] = /*0x87; */(unsigned long long)p2m | 7;
300         p512[PML4(highkernbase)] = (unsigned long long)p1 | 7;
301         p1[PML3(highkernbase)] = /*0x87; */(unsigned long long)p2m | 7;
302 #define _2MiB (0x200000)
303         int i;
304         for (i = 0; i < 512; i++) {
305                 p2m[PML2(kernbase + i * _2MiB)] = 0x87 | i * _2MiB;
306         }
307
308         kernbase >>= (0+12);
309         kernbase <<= (0 + 12);
310         uint8_t *kernel = (void *)GKERNBASE;
311         write_coreboot_table(coreboot_tables, ((void *)VIRTIOBASE) /*kernel*/, KERNSIZE + 1048576);
312         hexdump(stdout, coreboot_tables, 512);
313         setupconsole((void *)VIRTIOBASE);
314         hexdump(stdout, (void *)VIRTIOBASE, 128);
315         printf("kernbase for pml4 is 0x%llx and entry is %llx\n", kernbase, entry);
316         printf("p512 %p p512[0] is 0x%lx p1 %p p1[0] is 0x%x\n", p512, p512[0], p1, p1[0]);
317         vmctl.command = REG_RSP_RIP_CR3;
318         vmctl.cr3 = (uint64_t) p512;
319         vmctl.regs.tf_rip = entry;
320         vmctl.regs.tf_rsp = (uint64_t) &stack[1024];
321         if (mcp) {
322                 if (pthread_create(&my_threads[0], NULL, &talk_thread, &t))
323                         perror("pth_create failed");
324         }
325         printf("threads started\n");
326         printf("Writing command :%s:\n", cmd);
327         // sys_getpcoreid
328         while (1) {
329                 int c;
330                 ret = write(fd, &vmctl, sizeof(vmctl));
331                 if (ret != sizeof(vmctl)) {
332                         perror(cmd);
333                 }
334                 printf("RESUME?\n");
335                 c = getchar();
336                 if (c == 'q')
337                         break;
338                 printf("RIP %p\n", vmctl.regs.tf_rip);
339                 vmctl.command = RESUME;
340         }
341         dumpvirtio_mmio(stdout, (void *)VIRTIOBASE);
342         printf("shared is %d, blob is %d\n", shared, *mmap_blob);
343
344         quit = 1;
345         for (int i = 0; i < nr_threads-1; i++) {
346                 int ret;
347                 if (pthread_join(my_threads[i], &my_retvals[i]))
348                         perror("pth_join failed");
349                 printf("%d %d\n", i, ret);
350         }
351
352         return 0;
353 }