我们申请一块内存时计算机内部发生了什么?看下这句代码:
这里有两部分,一个是 malloc,再一个是你写的代码。
标准库
malloc 实际上属于标准库,标准库里有什么呢?
数学相关的函数,sin、cos、绝对值、数幂函数等;字符相关函数,判断大小写等;字符串操作函数、字符串拷贝、拼接比较等;还有内存管理函数,就是这里提到的 malloc/free,当然还有很多其它函数,这就是标准库。
代码
再来看你写的代码,什么是你写的代码呢?
以 C 语言为例,.c 文件就是你写的代码,这包括你写的 hello world 程序、充满 bug 的练习程序,当然还有各种项目。
这些代码怎么变成最终的可执行程序呢?当然是借助编译器。
编译器
编译器会把你的代码编译成目标文件。
接着链接器出场,连接器会把目标文件和标准库打包成可执行程序。
这就是代码部分,接下来我们看内存分配。
内存
到底什么是内存呢?
内存实际上和储物柜非常相似,储物柜会划分成了一个一个大小相同的隔间,每个隔间可以存储东西,内存的道理也一样,内存也被划分成了一个一个大小相同的隔间,我们来仔细看一下。
内存中的每个隔间存储的是一个字节,8 比特位一字节。
比如这里申请的一块 int 大小的内存,一个 int 占据 4 个字节。
和储物柜一样,内存中的每个隔间也有一个编号,这个编号叫做内存地址。
在我们的实例中,申请的这块内存位于内存地址 2 这个位置,这意味着什么嗯?这意味着变量 p 等于数字 2,或者说等于内存地址 2,这里的 p 就是所谓的指针。
接着我们看内存分配过程。
内存分配
这段代码当然属于编译后生成的可执行程序,可执行程序是在内存中运行的,当然我们需要为整个程序分配一块内存。
栈区 堆区 代码区 数据区
程序的运行依赖栈区,这里存放着局部变量等信息;依赖堆区,这里存放着程序员自己管理的动态申请的内存,关于堆区和栈区之前的视频也有讲解;除此之外还依赖代码区,这里保存的就是编译后的之类;还有数据区,这里保存着全局变量等信息。
这些区域在内存中的布局是这样的:
再次强调下,编译后的代码位于代码区,malloc 动态申请的内存位于堆区,接下来我们只关注堆区。
在程序开始运行时堆区当然是空的,那么所谓的内存分配到底是什么呢?
内存分配
如果让你实现内存分配器该怎么做到呢?很简单,其实内存分配就是划分地盘。
此时要分配第一块大小为A的内存,那么你应该把A放在哪里呢?
因为此时堆区是空的,显然你可以把开始这个位置划分给 A,作为 A 的地盘,找到A的地盘后 malloc 这个函数返回,内存分配过程结束,是不是很简单。
接着程序员又开始申请大小为B的内存,道理和 A 一样,把 A 之后的地盘给 B 即可。
程序员又开始申请大小为 C 的内存,同理。
内存释放
接着程序员说 A 占用的这块内存使用完毕,调用 free 释放,所谓释放就是把 A 占据的地盘重新标记为空闲,这时堆区里还有两块空闲内存。
内存碎片
接着程序员开始申请大小为 D,这时问题来了,你该从哪里给 D 划分地盘呢?
放到第一个空闲块吗?显然第一个空闲块大小不够。
第二个呢,第二个也不够。
但是你发现了一个问题,仔细看着两个空闲块,这两个空闲块的总大小实际上是超过 D 的。
我们把这种空闲的但是不能用来分配出去的内存称之为内存碎片。
你可以想象一下经过不断的内存申请和释放,堆区中会存在无数这样空闲内存碎片。
碎片化的内存显然不利于内存的充分利用,计算机科学历史上有无数论文试图来解决这个问题。
现在堆区已经不足以为 D 申请出内存,该怎么办呢?
堆区扩容
让我们回到最初的布局,注意看堆区和栈区中间实际上还有一段空闲内存区域,这块区域就是为堆区或栈区来扩大地盘用的,那么该怎么扩大堆区呢?
这就要借助操作系统的帮助了。
在linux等系统中可以借助 brk 等系统调用向操作系统申请来扩大堆区。
现在堆区扩容完毕,此时就可以在堆区中找出一块合适的空闲内存分配给 D,到这时 malloc 过程才真正结束,这实际上是一个相当复杂的过程。
—
via:
内存是怎样一步步被分配出来的?- 51CTO.COM 2024-06-27 08:30:36
https://www.51cto.com/article/791524.html