堆和栈的区别_C/C++基础

最近太过执着于一些底层概念，《堆和栈的区别》这篇经典的博文已经被转载过N次，今搬运至此，以便日后查阅。

一、预备知识—程序的内存分配

一个由 C/C++ 编译的程序占用的内存分为以下几个部分：

1、栈区（stack）— 由编译器自动分配释放，存放函数的参数值，局部变量的值等。

在执行函数时，函数内局部变量的存储单元都可以在栈上创建，函数执行结束时这些存储单元自动被释放。

栈内存分配运算内置于处理器的指令集中，效率很高，但是分配的内存容量有限。

其操作方式类似于数据结构中的栈。

2、堆区（heap） —从堆上分配，亦称动态内存分配。

程序在运行的时候调用 malloc 或 new 申请任意多少的内存，程序员自己负责在何时用 free 或 delete 释放内存。

动态内存的生存期由我们决定，使用非常灵活，但问题也最多。

一般由程序员分配释放，若程序员不释放，程序（进程）结束时可能由 OS 回收。

注意：它与数据结构中的堆是两回事，分配方式倒是类似于链表。

3、全局区（静态区）（static）—从静态存储区域分配。

内存在程序编译的时候就已经分配好，这块内存在程序的整个运行期间都存在。例如全局变量，static 变量。

全局变量和静态变量的存储是放在一块的，初始化的全局变量和静态变量在一块区域，未初始化的全局变量和未初始化的静态变量在相邻的另一块区域，程序（进程）结束后有系统释放。

4、文字常量区—常量字符串就是放在这里的，程序（进程）结束后由系统释放。

5、程序代码区—存放函数体的二进制代码。

示例程序（这是一个前辈写的，非常详细）

#include <cstdlib>
#include <iostream>

int a = 0;  // 全局初始化区
char *p1;   // 全局未初始化区

int main(int argc, char* argv[])
{
    std::cout << "Hello, World!" << std::endl;
    
    int b;              // 栈
    char s[] = "abc";   // 栈
    char *p2;           // 栈
    
    // 123456/0在常量区，p3在栈上。
    char *p3 = "123456";
    
    // 全局（静态）初始化区
    static int c = 0;
    
    // 分配得来得10和20字节的区域就在堆区
    p1 = (char*)malloc(10);
    p2 = (char*)malloc(20);
    
    // 123456/0放在常量区，编译器可能会将它与p3所指向的"123456"，优化成一个地方。
    strcpy(p1, "123456");
    
    return EXIT_SUCCESS;
}

二、堆和栈的理论知识

2.1 申请方式

栈: 由系统自动分配。例如，声明在函数中一个局部变量 int b; 系统自动在栈中为b开辟空间。

堆: 需要程序员自己申请，并指明大小。

在 C 中用 malloc 函数：p1 = (char *)malloc(10);

在 C++ 中用 new 运算符，如p2 = (char *)malloc(10);

但是注意指针变量 p1、p2 本身是在栈中的。

2.2 申请后系统的响应

栈：只要栈的剩余空间大于所申请空间，系统将为程序提供内存，否则将报异常提示栈溢出。

堆：首先应该知道操作系统有一个记录空闲内存地址的链表。

当系统收到程序的申请时，会遍历该链表，寻找第一个空间大于所申请空间的堆结点，然后将该结点从空闲结点链表中删除，并将该结点的空间分配给程序。

对于大多数系统，会在这块内存空间中的首地址处记录本次分配的大小。这样，代码中的delete语句才能正确的释放本内存空间。

另外，由于找到的堆结点的大小不一定正好等于申请的大小，系统会自动的将多余的那部分重新放入空闲链表中。

2.3 申请大小的限制

栈：在Windows下,栈是向低地址扩展的数据结构，是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的，在WINDOWS下，栈的大小是2M（也有的说是1M，总之是一个编译时就确定的常数），如果申请的空间超过栈的剩余空间时，将提示overflow。因此，能从栈获得的空间较小。

堆：堆是向高地址扩展的数据结构，是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的，自然是不连续的，而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见，堆获得的空间比较灵活，也比较大。

2.4 申请效率的比较

栈：由系统自动分配，速度较快。但程序员是无法控制的。

堆：由 malloc/new 分配的内存，一般速度比较慢，而且容易产生内存碎片,不过用起来最方便.

另外，在 WINDOWS 下，最好的方式是用 VirtualAlloc 分配内存。它不是在堆，也不是在栈，而是直接在进程的地址空间中保留一快内存，虽然用起来最不方便。但是速度快，也最灵活。

2.5 堆和栈中的存储内容

栈：在函数调用时，第一个进栈的是主函数中后的下一条指令（函数调用语句的下一条可执行语句）的地址，然后是函数的各个参数，在大多数的C编译器中，参数是由右往左入栈的，然后是函数中的局部变量。注意静态变量是不入栈的。

当本次函数调用结束后，局部变量先出栈，然后是参数，最后栈顶指针指向最开始存的地址，也就是主函数中的下一条指令，程序由该点继续运行。

堆：一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容有程序员安排。

2.6 存取效率的比较

char s1[] = “aaaaaaaaaaaaaaa”;

char *s2 = “bbbbbbbbbbbbbbbbb”;

aaaaaaaaaaa是在运行时刻赋值的，而bbbbbbbbbbb是在编译时就确定的。

在以后的存取中，在栈上的数组比指针所指向的字符串(例如堆)快。

比如：

#include <cstdlib>
#include <iostream>

int main(int argc, char* argv[])
{
    char a      = 1;
    char c[]    = "1234567890";
    char *p     = "1234567890";
    
    a = c[1];
    a = p[1];
    
    return EXIT_SUCCESS;
}

对应的汇编代码

10: a = c[1];
00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]
0040106A 88 4D FC mov byte ptr [ebp-4],cl
11: a = p[1];
0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]
00401070 8A 42 01 mov al,byte ptr [edx+1]
00401073 88 45 FC mov byte ptr [ebp-4],al

第一种在读取时直接就把字符串中的元素读到寄存器cl中，而第二种则要先把指针值读到edx中，在根据edx读取字符，显然慢了。

2.7小结

堆和栈的区别可以用如下的比喻来看出：使用栈就象我们去饭馆里吃饭，只管点菜（发出申请）、付钱、和吃（使用），吃饱了就走，不必理会切菜、洗菜等准备工作和洗碗、刷锅等扫尾工作，他的好处是快捷，但是自由度小。

使用堆就象是自己动手做喜欢吃的菜肴，比较麻烦，但是比较符合自己的口味，而且自由度大。

而我们常说的“堆栈”是数据结构中的概念，是一种允许在其一端进行插入或删除的线性表，其基本操作是push入栈和pop出栈。

heap：是由malloc之类函数分配的空间所在地。地址是由低向高增长的。

stack：是自动分配变量，以及函数调用的时候所使用的一些空间。地址是由高向低减少的。

堆和栈的区别

三、测试程序

#include <iostream>
#include <cstdlib>
#include <cstdint>
#include <pthread.h>

// [What is the direction of stack growth in most modern systems?](https://stackoverflow.com/questions/664744/what-is-the-direction-of-stack-growth-in-most-modern-systems)

typedef enum
{
    _STACK_GROWS_DOWN,
    _STACK_GROWS_UP
}STACK_DIR;

static STACK_DIR
test_stack_direction()
{
    static char *addr = 0;
    char dummy;
    if (addr == 0)
    {
        addr = &dummy;
        return test_stack_direction();
    }
    else
    {
        return ((&dummy > addr) ? _STACK_GROWS_UP : _STACK_GROWS_DOWN);
    }
}

int main(int argc, const char * argv[]) {
    // insert code here...
    int i = 0; // dummy
    pthread_t tid = pthread_self();
    
    void* stackaddr = pthread_get_stackaddr_np(tid);
    std::cout << "stackaddr = " << stackaddr << std::endl;
    
    size_t stacksize = pthread_get_stacksize_np(tid);
    std::cout << "stacksize = " << stacksize << std::endl; // PTHREAD_STACK_MIN = 8K
    
    // 打印局部变量地址
    std::cout << "&i = " << static_cast<const void *>(&i) << std::endl;
    std::cout << "&tid = " << static_cast<const void *>(&tid) << std::endl; // struct
    
    int year = 2017;
    short month = 8;
    char day = 19;
    char wish[4]{0x11, 0x22, 0x33, 0x44};
    
    // 打印局部变量地址
    std::cout << "&year = " << static_cast<const void *>(&year) << std::endl;
    std::cout << "&month = " << static_cast<const void *>(&month) << std::endl;
    std::cout << "&day = " << static_cast<const void *>(&day) << std::endl;
    
    for (i=0; i<4; i++){
        std::cout << "&wish[" << i << "]" << " = " << static_cast<const void *>(&wish[i]) << std::endl;
    }
    std::cout << "wish as int = " << std::hex << "0x" << *reinterpret_cast<int*>(wish) << std::endl;
    
    // 测试栈增长方向
    STACK_DIR stack_growth_dir = test_stack_direction();
    std::cout << "stack_growth_dir = " << stack_growth_dir << std::endl;
    
    // 验证动态分配堆的增长（向高地址增长）
    void* ca = malloc(4);   // new?
    std::cout << "ca = " << std::hex << "0x" << (uintptr_t)ca << std::endl;
    void* cb = malloc(4);   // new?
    std::cout << "cb = " << std::hex << "0x" << (uintptr_t)cb << std::endl;
    
    return EXIT_SUCCESS;
}

参考：

《白话C++》南郁

《高质量C++编程指南》林锐

《深入探讨常量、指向常量的指针，常量与变量的区别》

[为什么要有堆区和栈区呢？](https://www.zhihu.com/question/49927441)
[堆和栈的区别(内存和数据结构)](http://blog.csdn.net/wolenski/article/details/7951961)
[地址、内存、堆、栈总结](http://blog.csdn.net/mishifangxiangdefeng/article/details/7200730)
[静态存储区、堆、栈的内存空间分配](http://blog.csdn.net/huqinwei987/article/details/23362705)
[arm堆栈操作](http://blog.163.com/hongtao_xm/blog/static/44451487200948101952460/)