]> git.openfabrics.org - ~shefty/rdma-dev.git/blob - arch/x86/kernel/trampoline_64.S
x86: cpuinit-annotate SMP boot trampolines properly
[~shefty/rdma-dev.git] / arch / x86 / kernel / trampoline_64.S
1 /*
2  *
3  *      Trampoline.S    Derived from Setup.S by Linus Torvalds
4  *
5  *      4 Jan 1997 Michael Chastain: changed to gnu as.
6  *      15 Sept 2005 Eric Biederman: 64bit PIC support
7  *
8  *      Entry: CS:IP point to the start of our code, we are 
9  *      in real mode with no stack, but the rest of the 
10  *      trampoline page to make our stack and everything else
11  *      is a mystery.
12  *
13  *      On entry to trampoline_data, the processor is in real mode
14  *      with 16-bit addressing and 16-bit data.  CS has some value
15  *      and IP is zero.  Thus, data addresses need to be absolute
16  *      (no relocation) and are taken with regard to r_base.
17  *
18  *      With the addition of trampoline_level4_pgt this code can
19  *      now enter a 64bit kernel that lives at arbitrary 64bit
20  *      physical addresses.
21  *
22  *      If you work on this file, check the object module with objdump
23  *      --full-contents --reloc to make sure there are no relocation
24  *      entries.
25  */
26
27 #include <linux/linkage.h>
28 #include <linux/init.h>
29 #include <asm/pgtable_types.h>
30 #include <asm/page_types.h>
31 #include <asm/msr.h>
32 #include <asm/segment.h>
33 #include <asm/processor-flags.h>
34
35 /* We can free up the trampoline after bootup if cpu hotplug is not supported. */
36 __CPUINITRODATA
37 .code16
38
39 ENTRY(trampoline_data)
40 r_base = .
41         cli                     # We should be safe anyway
42         wbinvd
43         mov     %cs, %ax        # Code and data in the same place
44         mov     %ax, %ds
45         mov     %ax, %es
46         mov     %ax, %ss
47
48
49         movl    $0xA5A5A5A5, trampoline_data - r_base
50                                 # write marker for master knows we're running
51
52                                         # Setup stack
53         movw    $(trampoline_stack_end - r_base), %sp
54
55         call    verify_cpu              # Verify the cpu supports long mode
56         testl   %eax, %eax              # Check for return code
57         jnz     no_longmode
58
59         mov     %cs, %ax
60         movzx   %ax, %esi               # Find the 32bit trampoline location
61         shll    $4, %esi
62
63                                         # Fixup the vectors
64         addl    %esi, startup_32_vector - r_base
65         addl    %esi, startup_64_vector - r_base
66         addl    %esi, tgdt + 2 - r_base # Fixup the gdt pointer
67
68         /*
69          * GDT tables in non default location kernel can be beyond 16MB and
70          * lgdt will not be able to load the address as in real mode default
71          * operand size is 16bit. Use lgdtl instead to force operand size
72          * to 32 bit.
73          */
74
75         lidtl   tidt - r_base   # load idt with 0, 0
76         lgdtl   tgdt - r_base   # load gdt with whatever is appropriate
77
78         mov     $X86_CR0_PE, %ax        # protected mode (PE) bit
79         lmsw    %ax                     # into protected mode
80
81         # flush prefetch and jump to startup_32
82         ljmpl   *(startup_32_vector - r_base)
83
84         .code32
85         .balign 4
86 startup_32:
87         movl    $__KERNEL_DS, %eax      # Initialize the %ds segment register
88         movl    %eax, %ds
89
90         movl    $X86_CR4_PAE, %eax
91         movl    %eax, %cr4              # Enable PAE mode
92
93                                         # Setup trampoline 4 level pagetables
94         leal    (trampoline_level4_pgt - r_base)(%esi), %eax
95         movl    %eax, %cr3
96
97         movl    $MSR_EFER, %ecx
98         movl    $(1 << _EFER_LME), %eax # Enable Long Mode
99         xorl    %edx, %edx
100         wrmsr
101
102         # Enable paging and in turn activate Long Mode
103         # Enable protected mode
104         movl    $(X86_CR0_PG | X86_CR0_PE), %eax
105         movl    %eax, %cr0
106
107         /*
108          * At this point we're in long mode but in 32bit compatibility mode
109          * with EFER.LME = 1, CS.L = 0, CS.D = 1 (and in turn
110          * EFER.LMA = 1). Now we want to jump in 64bit mode, to do that we use
111          * the new gdt/idt that has __KERNEL_CS with CS.L = 1.
112          */
113         ljmp    *(startup_64_vector - r_base)(%esi)
114
115         .code64
116         .balign 4
117 startup_64:
118         # Now jump into the kernel using virtual addresses
119         movq    $secondary_startup_64, %rax
120         jmp     *%rax
121
122         .code16
123 no_longmode:
124         hlt
125         jmp no_longmode
126 #include "verify_cpu_64.S"
127
128         # Careful these need to be in the same 64K segment as the above;
129 tidt:
130         .word   0                       # idt limit = 0
131         .word   0, 0                    # idt base = 0L
132
133         # Duplicate the global descriptor table
134         # so the kernel can live anywhere
135         .balign 4
136 tgdt:
137         .short  tgdt_end - tgdt         # gdt limit
138         .long   tgdt - r_base
139         .short 0
140         .quad   0x00cf9b000000ffff      # __KERNEL32_CS
141         .quad   0x00af9b000000ffff      # __KERNEL_CS
142         .quad   0x00cf93000000ffff      # __KERNEL_DS
143 tgdt_end:
144
145         .balign 4
146 startup_32_vector:
147         .long   startup_32 - r_base
148         .word   __KERNEL32_CS, 0
149
150         .balign 4
151 startup_64_vector:
152         .long   startup_64 - r_base
153         .word   __KERNEL_CS, 0
154
155 trampoline_stack:
156         .org 0x1000
157 trampoline_stack_end:
158 ENTRY(trampoline_level4_pgt)
159         .quad   level3_ident_pgt - __START_KERNEL_map + _KERNPG_TABLE
160         .fill   510,8,0
161         .quad   level3_kernel_pgt - __START_KERNEL_map + _KERNPG_TABLE
162
163 ENTRY(trampoline_end)