]> git.openfabrics.org - ~shefty/rdma-dev.git/blob - arch/arm/kernel/smp.c
f34514a0834e53b13a177a49a9d178153ff9088e
[~shefty/rdma-dev.git] / arch / arm / kernel / smp.c
1 /*
2  *  linux/arch/arm/kernel/smp.c
3  *
4  *  Copyright (C) 2002 ARM Limited, All Rights Reserved.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 as
8  * published by the Free Software Foundation.
9  */
10 #include <linux/module.h>
11 #include <linux/delay.h>
12 #include <linux/init.h>
13 #include <linux/spinlock.h>
14 #include <linux/sched.h>
15 #include <linux/interrupt.h>
16 #include <linux/cache.h>
17 #include <linux/profile.h>
18 #include <linux/errno.h>
19 #include <linux/mm.h>
20 #include <linux/err.h>
21 #include <linux/cpu.h>
22 #include <linux/smp.h>
23 #include <linux/seq_file.h>
24 #include <linux/irq.h>
25 #include <linux/percpu.h>
26 #include <linux/clockchips.h>
27 #include <linux/completion.h>
28
29 #include <linux/atomic.h>
30 #include <asm/cacheflush.h>
31 #include <asm/cpu.h>
32 #include <asm/cputype.h>
33 #include <asm/exception.h>
34 #include <asm/idmap.h>
35 #include <asm/topology.h>
36 #include <asm/mmu_context.h>
37 #include <asm/pgtable.h>
38 #include <asm/pgalloc.h>
39 #include <asm/processor.h>
40 #include <asm/sections.h>
41 #include <asm/tlbflush.h>
42 #include <asm/ptrace.h>
43 #include <asm/localtimer.h>
44 #include <asm/smp_plat.h>
45 #include <asm/virt.h>
46
47 /*
48  * as from 2.5, kernels no longer have an init_tasks structure
49  * so we need some other way of telling a new secondary core
50  * where to place its SVC stack
51  */
52 struct secondary_data secondary_data;
53
54 enum ipi_msg_type {
55         IPI_TIMER = 2,
56         IPI_RESCHEDULE,
57         IPI_CALL_FUNC,
58         IPI_CALL_FUNC_SINGLE,
59         IPI_CPU_STOP,
60 };
61
62 static DECLARE_COMPLETION(cpu_running);
63
64 int __cpuinit __cpu_up(unsigned int cpu, struct task_struct *idle)
65 {
66         int ret;
67
68         /*
69          * We need to tell the secondary core where to find
70          * its stack and the page tables.
71          */
72         secondary_data.stack = task_stack_page(idle) + THREAD_START_SP;
73         secondary_data.pgdir = virt_to_phys(idmap_pgd);
74         secondary_data.swapper_pg_dir = virt_to_phys(swapper_pg_dir);
75         __cpuc_flush_dcache_area(&secondary_data, sizeof(secondary_data));
76         outer_clean_range(__pa(&secondary_data), __pa(&secondary_data + 1));
77
78         /*
79          * Now bring the CPU into our world.
80          */
81         ret = boot_secondary(cpu, idle);
82         if (ret == 0) {
83                 /*
84                  * CPU was successfully started, wait for it
85                  * to come online or time out.
86                  */
87                 wait_for_completion_timeout(&cpu_running,
88                                                  msecs_to_jiffies(1000));
89
90                 if (!cpu_online(cpu)) {
91                         pr_crit("CPU%u: failed to come online\n", cpu);
92                         ret = -EIO;
93                 }
94         } else {
95                 pr_err("CPU%u: failed to boot: %d\n", cpu, ret);
96         }
97
98         secondary_data.stack = NULL;
99         secondary_data.pgdir = 0;
100
101         return ret;
102 }
103
104 #ifdef CONFIG_HOTPLUG_CPU
105 static void percpu_timer_stop(void);
106
107 /*
108  * __cpu_disable runs on the processor to be shutdown.
109  */
110 int __cpu_disable(void)
111 {
112         unsigned int cpu = smp_processor_id();
113         int ret;
114
115         ret = platform_cpu_disable(cpu);
116         if (ret)
117                 return ret;
118
119         /*
120          * Take this CPU offline.  Once we clear this, we can't return,
121          * and we must not schedule until we're ready to give up the cpu.
122          */
123         set_cpu_online(cpu, false);
124
125         /*
126          * OK - migrate IRQs away from this CPU
127          */
128         migrate_irqs();
129
130         /*
131          * Stop the local timer for this CPU.
132          */
133         percpu_timer_stop();
134
135         /*
136          * Flush user cache and TLB mappings, and then remove this CPU
137          * from the vm mask set of all processes.
138          *
139          * Caches are flushed to the Level of Unification Inner Shareable
140          * to write-back dirty lines to unified caches shared by all CPUs.
141          */
142         flush_cache_louis();
143         local_flush_tlb_all();
144
145         clear_tasks_mm_cpumask(cpu);
146
147         return 0;
148 }
149
150 static DECLARE_COMPLETION(cpu_died);
151
152 /*
153  * called on the thread which is asking for a CPU to be shutdown -
154  * waits until shutdown has completed, or it is timed out.
155  */
156 void __cpu_die(unsigned int cpu)
157 {
158         if (!wait_for_completion_timeout(&cpu_died, msecs_to_jiffies(5000))) {
159                 pr_err("CPU%u: cpu didn't die\n", cpu);
160                 return;
161         }
162         printk(KERN_NOTICE "CPU%u: shutdown\n", cpu);
163
164         if (!platform_cpu_kill(cpu))
165                 printk("CPU%u: unable to kill\n", cpu);
166 }
167
168 /*
169  * Called from the idle thread for the CPU which has been shutdown.
170  *
171  * Note that we disable IRQs here, but do not re-enable them
172  * before returning to the caller. This is also the behaviour
173  * of the other hotplug-cpu capable cores, so presumably coming
174  * out of idle fixes this.
175  */
176 void __ref cpu_die(void)
177 {
178         unsigned int cpu = smp_processor_id();
179
180         idle_task_exit();
181
182         local_irq_disable();
183         mb();
184
185         /* Tell __cpu_die() that this CPU is now safe to dispose of */
186         RCU_NONIDLE(complete(&cpu_died));
187
188         /*
189          * actual CPU shutdown procedure is at least platform (if not
190          * CPU) specific.
191          */
192         platform_cpu_die(cpu);
193
194         /*
195          * Do not return to the idle loop - jump back to the secondary
196          * cpu initialisation.  There's some initialisation which needs
197          * to be repeated to undo the effects of taking the CPU offline.
198          */
199         __asm__("mov    sp, %0\n"
200         "       mov     fp, #0\n"
201         "       b       secondary_start_kernel"
202                 :
203                 : "r" (task_stack_page(current) + THREAD_SIZE - 8));
204 }
205 #endif /* CONFIG_HOTPLUG_CPU */
206
207 /*
208  * Called by both boot and secondaries to move global data into
209  * per-processor storage.
210  */
211 static void __cpuinit smp_store_cpu_info(unsigned int cpuid)
212 {
213         struct cpuinfo_arm *cpu_info = &per_cpu(cpu_data, cpuid);
214
215         cpu_info->loops_per_jiffy = loops_per_jiffy;
216
217         store_cpu_topology(cpuid);
218 }
219
220 static void percpu_timer_setup(void);
221
222 /*
223  * This is the secondary CPU boot entry.  We're using this CPUs
224  * idle thread stack, but a set of temporary page tables.
225  */
226 asmlinkage void __cpuinit secondary_start_kernel(void)
227 {
228         struct mm_struct *mm = &init_mm;
229         unsigned int cpu = smp_processor_id();
230
231         /*
232          * All kernel threads share the same mm context; grab a
233          * reference and switch to it.
234          */
235         atomic_inc(&mm->mm_count);
236         current->active_mm = mm;
237         cpumask_set_cpu(cpu, mm_cpumask(mm));
238         cpu_switch_mm(mm->pgd, mm);
239         enter_lazy_tlb(mm, current);
240         local_flush_tlb_all();
241
242         printk("CPU%u: Booted secondary processor\n", cpu);
243
244         cpu_init();
245         preempt_disable();
246         trace_hardirqs_off();
247
248         /*
249          * Give the platform a chance to do its own initialisation.
250          */
251         platform_secondary_init(cpu);
252
253         notify_cpu_starting(cpu);
254
255         calibrate_delay();
256
257         smp_store_cpu_info(cpu);
258
259         /*
260          * OK, now it's safe to let the boot CPU continue.  Wait for
261          * the CPU migration code to notice that the CPU is online
262          * before we continue - which happens after __cpu_up returns.
263          */
264         set_cpu_online(cpu, true);
265         complete(&cpu_running);
266
267         /*
268          * Setup the percpu timer for this CPU.
269          */
270         percpu_timer_setup();
271
272         local_irq_enable();
273         local_fiq_enable();
274
275         /*
276          * OK, it's off to the idle thread for us
277          */
278         cpu_idle();
279 }
280
281 void __init smp_cpus_done(unsigned int max_cpus)
282 {
283         int cpu;
284         unsigned long bogosum = 0;
285
286         for_each_online_cpu(cpu)
287                 bogosum += per_cpu(cpu_data, cpu).loops_per_jiffy;
288
289         printk(KERN_INFO "SMP: Total of %d processors activated "
290                "(%lu.%02lu BogoMIPS).\n",
291                num_online_cpus(),
292                bogosum / (500000/HZ),
293                (bogosum / (5000/HZ)) % 100);
294
295         hyp_mode_check();
296 }
297
298 void __init smp_prepare_boot_cpu(void)
299 {
300 }
301
302 void __init smp_prepare_cpus(unsigned int max_cpus)
303 {
304         unsigned int ncores = num_possible_cpus();
305
306         init_cpu_topology();
307
308         smp_store_cpu_info(smp_processor_id());
309
310         /*
311          * are we trying to boot more cores than exist?
312          */
313         if (max_cpus > ncores)
314                 max_cpus = ncores;
315         if (ncores > 1 && max_cpus) {
316                 /*
317                  * Enable the local timer or broadcast device for the
318                  * boot CPU, but only if we have more than one CPU.
319                  */
320                 percpu_timer_setup();
321
322                 /*
323                  * Initialise the present map, which describes the set of CPUs
324                  * actually populated at the present time. A platform should
325                  * re-initialize the map in platform_smp_prepare_cpus() if
326                  * present != possible (e.g. physical hotplug).
327                  */
328                 init_cpu_present(cpu_possible_mask);
329
330                 /*
331                  * Initialise the SCU if there are more than one CPU
332                  * and let them know where to start.
333                  */
334                 platform_smp_prepare_cpus(max_cpus);
335         }
336 }
337
338 static void (*smp_cross_call)(const struct cpumask *, unsigned int);
339
340 void __init set_smp_cross_call(void (*fn)(const struct cpumask *, unsigned int))
341 {
342         smp_cross_call = fn;
343 }
344
345 void arch_send_call_function_ipi_mask(const struct cpumask *mask)
346 {
347         smp_cross_call(mask, IPI_CALL_FUNC);
348 }
349
350 void arch_send_call_function_single_ipi(int cpu)
351 {
352         smp_cross_call(cpumask_of(cpu), IPI_CALL_FUNC_SINGLE);
353 }
354
355 static const char *ipi_types[NR_IPI] = {
356 #define S(x,s)  [x - IPI_TIMER] = s
357         S(IPI_TIMER, "Timer broadcast interrupts"),
358         S(IPI_RESCHEDULE, "Rescheduling interrupts"),
359         S(IPI_CALL_FUNC, "Function call interrupts"),
360         S(IPI_CALL_FUNC_SINGLE, "Single function call interrupts"),
361         S(IPI_CPU_STOP, "CPU stop interrupts"),
362 };
363
364 void show_ipi_list(struct seq_file *p, int prec)
365 {
366         unsigned int cpu, i;
367
368         for (i = 0; i < NR_IPI; i++) {
369                 seq_printf(p, "%*s%u: ", prec - 1, "IPI", i);
370
371                 for_each_present_cpu(cpu)
372                         seq_printf(p, "%10u ",
373                                    __get_irq_stat(cpu, ipi_irqs[i]));
374
375                 seq_printf(p, " %s\n", ipi_types[i]);
376         }
377 }
378
379 u64 smp_irq_stat_cpu(unsigned int cpu)
380 {
381         u64 sum = 0;
382         int i;
383
384         for (i = 0; i < NR_IPI; i++)
385                 sum += __get_irq_stat(cpu, ipi_irqs[i]);
386
387         return sum;
388 }
389
390 /*
391  * Timer (local or broadcast) support
392  */
393 static DEFINE_PER_CPU(struct clock_event_device, percpu_clockevent);
394
395 static void ipi_timer(void)
396 {
397         struct clock_event_device *evt = &__get_cpu_var(percpu_clockevent);
398         evt->event_handler(evt);
399 }
400
401 #ifdef CONFIG_GENERIC_CLOCKEVENTS_BROADCAST
402 static void smp_timer_broadcast(const struct cpumask *mask)
403 {
404         smp_cross_call(mask, IPI_TIMER);
405 }
406 #else
407 #define smp_timer_broadcast     NULL
408 #endif
409
410 static void broadcast_timer_set_mode(enum clock_event_mode mode,
411         struct clock_event_device *evt)
412 {
413 }
414
415 static void __cpuinit broadcast_timer_setup(struct clock_event_device *evt)
416 {
417         evt->name       = "dummy_timer";
418         evt->features   = CLOCK_EVT_FEAT_ONESHOT |
419                           CLOCK_EVT_FEAT_PERIODIC |
420                           CLOCK_EVT_FEAT_DUMMY;
421         evt->rating     = 400;
422         evt->mult       = 1;
423         evt->set_mode   = broadcast_timer_set_mode;
424
425         clockevents_register_device(evt);
426 }
427
428 static struct local_timer_ops *lt_ops;
429
430 #ifdef CONFIG_LOCAL_TIMERS
431 int local_timer_register(struct local_timer_ops *ops)
432 {
433         if (!is_smp() || !setup_max_cpus)
434                 return -ENXIO;
435
436         if (lt_ops)
437                 return -EBUSY;
438
439         lt_ops = ops;
440         return 0;
441 }
442 #endif
443
444 static void __cpuinit percpu_timer_setup(void)
445 {
446         unsigned int cpu = smp_processor_id();
447         struct clock_event_device *evt = &per_cpu(percpu_clockevent, cpu);
448
449         evt->cpumask = cpumask_of(cpu);
450         evt->broadcast = smp_timer_broadcast;
451
452         if (!lt_ops || lt_ops->setup(evt))
453                 broadcast_timer_setup(evt);
454 }
455
456 #ifdef CONFIG_HOTPLUG_CPU
457 /*
458  * The generic clock events code purposely does not stop the local timer
459  * on CPU_DEAD/CPU_DEAD_FROZEN hotplug events, so we have to do it
460  * manually here.
461  */
462 static void percpu_timer_stop(void)
463 {
464         unsigned int cpu = smp_processor_id();
465         struct clock_event_device *evt = &per_cpu(percpu_clockevent, cpu);
466
467         if (lt_ops)
468                 lt_ops->stop(evt);
469 }
470 #endif
471
472 static DEFINE_RAW_SPINLOCK(stop_lock);
473
474 /*
475  * ipi_cpu_stop - handle IPI from smp_send_stop()
476  */
477 static void ipi_cpu_stop(unsigned int cpu)
478 {
479         if (system_state == SYSTEM_BOOTING ||
480             system_state == SYSTEM_RUNNING) {
481                 raw_spin_lock(&stop_lock);
482                 printk(KERN_CRIT "CPU%u: stopping\n", cpu);
483                 dump_stack();
484                 raw_spin_unlock(&stop_lock);
485         }
486
487         set_cpu_online(cpu, false);
488
489         local_fiq_disable();
490         local_irq_disable();
491
492         while (1)
493                 cpu_relax();
494 }
495
496 /*
497  * Main handler for inter-processor interrupts
498  */
499 asmlinkage void __exception_irq_entry do_IPI(int ipinr, struct pt_regs *regs)
500 {
501         handle_IPI(ipinr, regs);
502 }
503
504 void handle_IPI(int ipinr, struct pt_regs *regs)
505 {
506         unsigned int cpu = smp_processor_id();
507         struct pt_regs *old_regs = set_irq_regs(regs);
508
509         if (ipinr >= IPI_TIMER && ipinr < IPI_TIMER + NR_IPI)
510                 __inc_irq_stat(cpu, ipi_irqs[ipinr - IPI_TIMER]);
511
512         switch (ipinr) {
513         case IPI_TIMER:
514                 irq_enter();
515                 ipi_timer();
516                 irq_exit();
517                 break;
518
519         case IPI_RESCHEDULE:
520                 scheduler_ipi();
521                 break;
522
523         case IPI_CALL_FUNC:
524                 irq_enter();
525                 generic_smp_call_function_interrupt();
526                 irq_exit();
527                 break;
528
529         case IPI_CALL_FUNC_SINGLE:
530                 irq_enter();
531                 generic_smp_call_function_single_interrupt();
532                 irq_exit();
533                 break;
534
535         case IPI_CPU_STOP:
536                 irq_enter();
537                 ipi_cpu_stop(cpu);
538                 irq_exit();
539                 break;
540
541         default:
542                 printk(KERN_CRIT "CPU%u: Unknown IPI message 0x%x\n",
543                        cpu, ipinr);
544                 break;
545         }
546         set_irq_regs(old_regs);
547 }
548
549 void smp_send_reschedule(int cpu)
550 {
551         smp_cross_call(cpumask_of(cpu), IPI_RESCHEDULE);
552 }
553
554 #ifdef CONFIG_HOTPLUG_CPU
555 static void smp_kill_cpus(cpumask_t *mask)
556 {
557         unsigned int cpu;
558         for_each_cpu(cpu, mask)
559                 platform_cpu_kill(cpu);
560 }
561 #else
562 static void smp_kill_cpus(cpumask_t *mask) { }
563 #endif
564
565 void smp_send_stop(void)
566 {
567         unsigned long timeout;
568         struct cpumask mask;
569
570         cpumask_copy(&mask, cpu_online_mask);
571         cpumask_clear_cpu(smp_processor_id(), &mask);
572         if (!cpumask_empty(&mask))
573                 smp_cross_call(&mask, IPI_CPU_STOP);
574
575         /* Wait up to one second for other CPUs to stop */
576         timeout = USEC_PER_SEC;
577         while (num_online_cpus() > 1 && timeout--)
578                 udelay(1);
579
580         if (num_online_cpus() > 1)
581                 pr_warning("SMP: failed to stop secondary CPUs\n");
582
583         smp_kill_cpus(&mask);
584 }
585
586 /*
587  * not supported here
588  */
589 int setup_profiling_timer(unsigned int multiplier)
590 {
591         return -EINVAL;
592 }