首页 > 资讯 > > 正文

core dump 路径定义以及监控

2023-06-13 14:57:44 来源: 哔哩哔哩

Core Dump 是什么？

Core Dump 是指进程异常退出时，操作系统将进程的内存状态保存到文件中，这个文件就是 Core Dump 文件，中文一般翻译为“核心转储”，哈，看起来还不如不翻译。

我们可以认为 Core Dump 是“内存快照”，但实际上，除了内存信息之外，还有些关键的程序运行状态也会同时 dump 下来，例如寄存器信息（包括程序指针、栈指针等）、内存管理信息、其他处理器和操作系统状态和信息。

(相关资料图)

Core Dump 有什么用？

一个是用于排查问题，例如程序 crash 了，我们可以通过 gdb 等工具来分析 core dump 文件，找到问题的原因。另一个是监控，我们可以通过监控手段及时发现程序 crash 了，及时处理。

程序自身产生的 Core Dump 文件一般可以用来分析程序运行到哪里出错了。

Linux 平台常用的 coredump 文件分析工具是 gdb；Solaris 平台用 pstack 和 pflags；Windows 平台用 userdump 和 windbg。

测试生成 Core Dump 文件

这将会在你当前的 shell 下触发一个段错误，进而生成一个 core dump 文件，文件名为 core 或 core.pid，pid 是当前 shell 的进程号。

注意，ulimit -c unlimited是告诉操作系统，不要限制 core dump 文件的大小，如果你执行 ulimit -c看到输出 0，就表示 core dump 文件大小限制为 0 了，也就不会生成。比如我的机器环境：

注意 core file size 那一行，我的环境是 0，就表示限制了 core dump 文件的生成。

Core Dump 文件路径定义

在 Linux 下，core dump 文件的路径是由 /proc/sys/kernel/core_pattern定义的，如果这个文件不存在，或者内容为空，那么 core dump 文件就会生成在当前目录下。

上面的输出表示，core dump 文件会生成在当前目录下，文件名为 core。

我们可以通过修改 /proc/sys/kernel/core_pattern来定义 core dump 文件的路径和文件名，例如：

然后，我们重新生成 core dump 文件：

此时，我们会生成一个类似这样的文件：/tmp/cores/core.bash.8539.VM-0-33-debian.1236975953。其中，bash 是进程名，8539 是进程号，VM-0-33-debian 是主机名，1236975953 是时间戳。文件存储在 /tmp/cores 目录下。

对于 core_pattern 的定义，可以使用如下的占位符：

其中，%hhostname 最好加上，假如我们把 core dump 文件存放在 NFS 上，就可以用 %h来区分 core dump 文件来自哪个机器了。

echo "/tmp/cores/core.%e.%p.%h.%t" > /proc/sys/kernel/core_pattern这种设置方式，是临时生效，如果机器重启，就会失效。如果想要永久生效，可以修改 /etc/sysctl.conf文件，添加一行：

然后执行 sysctl -p命令，使配置生效。