xv6的memory layout

隔离 (Isolation): 保护内核免受用户进程的干扰，并保护进程之间互相独立。
方便 (Convenience): 让内核能够轻松地访问所有物理内存和 I/O 设备。
高效 (Efficiency): 尽量减少地址转换带来的开销。

我们将从物理内存布局和虚拟内存布局两个层面来分析。

1. 物理内存布局 (Physical Memory Layout)

物理内存布局是指 RAM 和硬件设备在物理地址空间中的实际排列方式。在 QEMU 模拟的 RISC-V 环境中，物理地址从 0x0 开始。

这是一个简化的物理内存图：

 |------------------| <- 0x88000000 (PHYSTOP, QEMU 默认有 128MB RAM)
 |                  |
 |    Free Memory   |
 | (由 kalloc 管理) |
 |                  |
 |------------------| <- end (内核结束后)
 | Kernel's .bss    |
 | Kernel's .data   |
 | Kernel's .rodata |
 | Kernel's .text   |
 |------------------| <- 0x80000000 (KERNBASE, 内核加载地址)
 |      ...         |
 | (Unused)         |
 |------------------| <- 0x10000000 (UART0, I/O 设备)
 |      ...         |
 | (I/O Devices)    |
 |------------------|
 | (Unused)         |
 |------------------| <- 0x00000000

I/O 设备区域: 从 0x0 开始的低地址空间主要留给内存映射的 I/O 设备，例如 CLINT (Core Local Interruptor), PLIC (Platform-Level Interrupt Controller), UART (串口) 和 VIRTIO (虚拟化 I/O 磁盘)。内核通过读写这些特定的物理地址来与硬件交互。
0x80000000 (KERNBASE): 这是 QEMU 将 xv6 内核加载到 RAM 的起始物理地址。内核的代码 (.text)、只读数据 (.rodata)、已初始化数据 (.data) 和未初始化数据 (.bss) 都从这里开始向上排列。这些节区的位置由链接器脚本 kernel/kernel.ld 决定。
end: 这是一个由链接器脚本提供的符号，标记了内核所有静态数据的末尾。
Free Memory: 从 end 到 PHYSTOP (Physical Stop, 物理内存顶端) 的所有 RAM 构成了空闲内存池。内核启动后，kinit() 函数会初始化这个区域，并由 kalloc.c 中的函数 (kalloc, kfree) 以 4KB 页 (Page) 为单位进行管理。

2. 虚拟内存布局 (Virtual Memory Layout)

虚拟内存是现代操作系统的精髓。xv6 为每个进程（包括内核自身）都提供了一个独立的、私有的虚拟地址空间。RISC-V 硬件的内存管理单元 (MMU) 负责将虚拟地址转换为物理地址，这个转换过程由页表 (Page Table) 控制。

xv6-riscv 使用 Sv39 分页模式，这意味着虚拟地址是 39 位，总共可以寻址 2^39 = 512 GB 的空间。

a. 内核的虚拟地址空间 (Kernel Virtual Address Space)

内核的地址空间设计得非常特殊，它需要同时映射内核自身的代码/数据，以及能够访问整个物理内存。

(高地址)
|------------------| <- MAXVA (2^39 - 1)
|   TRAMPOLINE     | (用户/内核切换的跳板)
|------------------|
|   TRAPFRAME      | (保存用户寄存器的地方)
|      ...         |
| (Per-process)    |
|------------------|
|                  |
|   Kernel Stack   | (每个进程一个)
|                  |
|------------------|
|      ...         |
| (Guard Page)     |
|------------------|
|                  |
|   Direct Mapping | (物理内存的直接映射)
|   of all RAM &   |
|   I/O Devices    |
|                  |
|------------------| <- KERNBASE (0x80000000)
| Kernel .text,    |
| .data, etc.      |
|------------------|
|      ...         |
| (Unused)         |
|------------------| <- 0x0 (低地址)

关键区域解析 (参考 kernel/memlayout.h):

KERNBASE (0x80000000): 内核的基地址。物理地址 0x80000000 被映射到虚拟地址 0x80000000。
直接映射区域 (Direct Mapping): 这是内核布局最巧妙的地方。从 KERNBASE 到 PHYSTOP 的整个物理内存，被直接映射到从 KERNBASE 开始的虚拟地址空间。
- 虚拟地址 = 物理地址。
- 好处: 内核想要访问任何一个物理页时，不需要复杂的页表查找，直接使用相同的地址即可。例如，kalloc() 返回一个物理地址 pa，内核可以直接通过虚拟地址 pa 来使用这块内存。
- I/O 设备区域也被映射到这个空间，所以 UART 驱动可以直接访问 0x10000000 这个虚拟地址来操作硬件。
TRAMPOLINE: 位于虚拟地址空间的顶端。这是一个非常关键的页面，用于实现用户态和内核态之间的安全切换。
- 它被同时映射到所有用户进程的地址空间和内核地址空间中，且指向同一块物理内存。
- 当发生系统调用或中断时，CPU 会跳转到 trampoline 页面的代码，这段代码负责保存用户上下文，切换到内核页表，然后才能安全地跳转到内核的 C 代码处理函数。
TRAPFRAME: 紧邻 TRAMPOLINE 之下。每个进程都有一个 trapframe 页，用于在发生 trap (陷阱) 时保存其所有的用户寄存器。

b. 用户进程的虚拟地址空间 (User Process Virtual Address Space)

用户进程的地址空间相对简单，从虚拟地址 0 开始。

(高地址)
|------------------| <- MAXVA (2^39 - 1)
|   TRAMPOLINE     | (与内核共享，用于 trap)
|------------------|
|   TRAPFRAME      | (保存该进程的用户寄存器)
|------------------|
|      ...         |
| (Unused)         |
|------------------|
|       Stack      | (用户栈，向下增长)
| (Guard Page)     | (防止栈溢出覆盖堆)
|       Heap       | (动态内存，sbrk() 分配，向上增长)
|------------------|
| .bss / .data     |
| .rodata          |
| .text (code)     |
|------------------| <- 0x0 (低地址)

Text, Data, BSS: 程序的代码和静态数据，从虚拟地址 0 开始加载。
Heap: 堆区，紧随 BSS 之后。当程序调用 sbrk() (在 xv6 中通过 malloc 间接调用) 申请内存时，堆会向上增长。
Stack: 用户栈，位于高地址区域（但在 TRAPFRAME 之下）。它是一个固定大小的页面（或多个页面），并且向下增长。
Guard Page: 在栈和堆之间有一个未被映射的“警戒页”。如果栈无限增长，或者堆无限增长，试图访问这个页面的地址会立即触发一个页错误 (Page Fault)，从而使内核能够捕获到这种栈/堆溢出的错误，而不是让它们悄无声息地破坏数据。
TRAMPOLINE / TRAPFRAME: 和内核一样，用户地址空间的顶端也映射了这两个特殊的页面，这是进入内核的“大门”。

总结与关键点

物理 vs 虚拟: 物理内存是实际的硬件资源，布局相对固定。虚拟内存是操作系统为每个进程创建的抽象，布局灵活且独立。
内核的特权: 内核的虚拟地址空间通过直接映射，可以方便地访问所有物理内存，这是它管理整个系统的基础。
用户进程的隔离: 每个用户进程都有自己独立的页表和地址空间，一个进程的内存访问不会影响到其他进程或内核。
TRAMPOLINE 的桥梁作用: trampoline 页面是连接用户空间和内核空间的关键桥梁，它解决了在切换页表时“脚下没地”的难题，是 xv6-riscv 实现中非常优雅的一点。