cons: Clamp the amount written to the console
[akaros.git] / tests / pthread_test.c
1 /* Copyright (c) 2010-14 The Regents of the University of California
2  * Barret Rhoden <brho@cs.berkeley.edu>
3  * See LICENSE for details.
4  *
5  * Basic test for pthreading.  Spawns a bunch of threads that yield.
6  *
7  * To build on linux, cd into tests and run:
8  * $ gcc -O2 -std=gnu99 -fno-stack-protector -g pthread_test.c -lpthread
9  *
10  * Make sure you run it with taskset to fix the number of vcores/cpus. */
11
12 #define _GNU_SOURCE /* for pth_yield on linux */
13
14 #include <stdio.h>
15 #include <pthread.h>
16 #include <stdlib.h>
17 #include <unistd.h>
18 #include <sys/time.h>
19 #include "misc-compat.h" /* OS dependent #incs */
20
21 /* These are here just to have the compiler test the _INITIALIZERS */
22 pthread_cond_t dummy_cond = PTHREAD_COND_INITIALIZER;
23 pthread_mutex_t dummy_mutex = PTHREAD_MUTEX_INITIALIZER;
24
25 pthread_mutex_t lock = PTHREAD_MUTEX_INITIALIZER;
26 #define printf_safe(...) {}
27 //#define printf_safe(...) \
28         pthread_mutex_lock(&lock); \
29         printf(__VA_ARGS__); \
30         pthread_mutex_unlock(&lock);
31
32 #define MAX_NR_TEST_THREADS 100000
33 int nr_yield_threads = 100;
34 int nr_yield_loops = 100;
35 int nr_vcores = 0;
36 int amt_fake_work = 0;
37
38 pthread_t my_threads[MAX_NR_TEST_THREADS];
39 void *my_retvals[MAX_NR_TEST_THREADS];
40
41 pthread_barrier_t barrier;
42
43 void *yield_thread(void* arg)
44 {       
45         /* Wait til all threads are created */
46         pthread_barrier_wait(&barrier);
47         for (int i = 0; i < nr_yield_loops; i++) {
48                 printf_safe("[A] pthread %d %p on vcore %d, itr: %d\n", pthread_id(),
49                             pthread_self(), vcore_id(), i);
50                 /* Fakes some work by spinning a bit.  Amount varies per uth/vcore,
51                  * scaled by fake_work */
52                 if (amt_fake_work)
53                         udelay(amt_fake_work * (pthread_id() * (vcore_id() + 2)));
54                 pthread_yield();
55                 printf_safe("[A] pthread %p returned from yield on vcore %d, itr: %d\n",
56                             pthread_self(), vcore_id(), i);
57         }
58         return (void*)(pthread_self());
59 }
60
61 int main(int argc, char** argv) 
62 {
63         struct timeval start_tv = {0};
64         struct timeval end_tv = {0};
65         long usec_diff;
66         long nr_ctx_switches;
67
68         if (argc > 1)
69                 nr_yield_threads = strtol(argv[1], 0, 10);
70         if (argc > 2)
71                 nr_yield_loops = strtol(argv[2], 0, 10);
72         if (argc > 3)
73                 nr_vcores = strtol(argv[3], 0, 10);
74         if (argc > 4)
75                 amt_fake_work = strtol(argv[4], 0, 10);
76         nr_yield_threads = MIN(nr_yield_threads, MAX_NR_TEST_THREADS);
77         printf("Making %d threads of %d loops each, on %d vcore(s), %d work\n",
78                nr_yield_threads, nr_yield_loops, nr_vcores, amt_fake_work);
79
80         /* OS dependent prep work */
81 #ifdef __ros__
82         if (nr_vcores) {
83                 /* Only do the vcore trickery if requested */
84                 parlib_never_yield = TRUE;
85                 pthread_need_tls(FALSE);
86                 pthread_mcp_init();                                     /* gives us one vcore */
87                 vcore_request_total(nr_vcores);
88                 parlib_never_vc_request = TRUE;
89                 for (int i = 0; i < nr_vcores; i++) {
90                         printf_safe("Vcore %d mapped to pcore %d\n", i,
91                                     __procinfo.vcoremap[i].pcoreid);
92                 }
93         }
94         struct uth_join_request *join_reqs;
95
96         join_reqs = malloc(nr_yield_threads * sizeof(struct uth_join_request));
97         for (int i = 0; i < nr_yield_threads; i++)
98                 join_reqs[i].retval_loc = &my_retvals[i];
99         assert(join_reqs);
100 #endif /* __ros__ */
101
102         pthread_barrier_init(&barrier, NULL, nr_yield_threads);
103         /* create and join on yield */
104         for (int i = 0; i < nr_yield_threads; i++) {
105                 printf_safe("[A] About to create thread %d\n", i);
106                 if (pthread_create(&my_threads[i], NULL, &yield_thread, NULL))
107                         perror("pth_create failed");
108         }
109         if (gettimeofday(&start_tv, 0))
110                 perror("Start time error...");
111         /* Akaros supports parallel join */
112 #ifdef __ros__
113         for (int i = 0; i < nr_yield_threads; i++)
114                 join_reqs[i].uth = (struct uthread*)my_threads[i];
115         uthread_join_arr(join_reqs, nr_yield_threads);
116 #else
117         for (int i = 0; i < nr_yield_threads; i++) {
118                 printf_safe("[A] About to join on thread %d(%p)\n", i, my_threads[i]);
119                 pthread_join(my_threads[i], &my_retvals[i]);
120                 printf_safe("[A] Successfully joined on thread %d (retval: %p)\n", i,
121                             my_retvals[i]);
122         }
123 #endif
124         if (gettimeofday(&end_tv, 0))
125                 perror("End time error...");
126         nr_ctx_switches = nr_yield_threads * nr_yield_loops;
127         usec_diff = (end_tv.tv_sec - start_tv.tv_sec) * 1000000 +
128                     (end_tv.tv_usec - start_tv.tv_usec);
129         printf("Done: %d uthreads, %d loops, %d vcores, %d work\n",
130                nr_yield_threads, nr_yield_loops, nr_vcores, amt_fake_work);
131         printf("Nr context switches: %ld\n", nr_ctx_switches);
132         printf("Time to run: %ld usec\n", usec_diff);
133         if (nr_vcores == 1)
134                 printf("Context switch latency: %d nsec\n",
135                        (int)(1000LL*usec_diff / nr_ctx_switches));
136         printf("Context switches / sec: %d\n\n",
137                (int)(1000000LL*nr_ctx_switches / usec_diff));
138