在第一篇的01最小实现中,我们实现了一个断点调试的最小实现,在设置钩子函数时只加了line事件,显然这会对性能有很大的影响。而后来两篇02通用变量打印和03通用变量修改及调用栈回溯则是提供了一些辅助的调试接口,并没有对钩子函数进行修改。
我们本篇将在钩子中引入call和return事件的处理,尝试对性能进行优化。
源码已经上传Github,欢迎watch/star😘。
实现分析
当前的实现因为只加了line事件,执行每一行代码都会执行钩子函数去查看是否有断点,这是没有必要的。我们可以在call事件时检查当前函数是否有断点,只有当有断点的时候才加入line事件。那我们什么时候去掉line事件呢?是不是遇到return事件就去掉呢?
考虑如下场景
考虑如下场景:假设f1调用f2,f2又调用f3。f1中有断点,f2没有断点,f3有断点。如果遇到return就去掉line事件,那么从f2返回到f1之后,就无法再停到f1后面的断点上了。
1 | b b |
正确的做法
所以正确的做法应该是:call事件时,根据被调函数是否有断点,决定是否加line事件;return事件时,则根据主调函数是否有断点,决定是否加line事件。那么return时如何获取到主调函数的信息呢?我们就需要在call的时候保存函数的相关信息,组成一个链表。call的时候在尾部增加一个节点,return的时候则去掉一个节点。
数据结构
首先,在status数据结构中增加3个成员,stackinfos
相当于我们前面提到的链表(只不过这里以数组的形式实现),维护了调用栈中每个函数的信息,记录其中是否有断点,stackdepth
记录了链表的长度,或者说栈的深度。funcinfos
用于缓存一些函数调试信息,不用每次都调用debug.getinfo
去获取。
1 | status.stackinfos = {} -- table for saving stack infos |
钩子函数
我们本篇最主要的改动是钩子函数,除了line事件,我们还增加了call(或tail call)事件和return(或tail return)事件的处理。为了代码的简洁,用局部变量s来表示status
。接下来我们分别来看这三个部分。
1 | local function hook (event, line) |
call事件
如果是call事件(或tail call事件),那么先获取当前函数,查看是否在断点表中有断点。
如果有则在s.stackinfos
表尾部插入一个元素,其中hasbreak
字段为true
指示该函数有断点。注意,这里我们对tail call
进行了一个优化,直接覆盖上一层的节点,在递归尾调用时可以防止空间无限膨胀。(Lua5.1上因为没有tail call就无能为力了:)。然后重新设置钩子函数的事件,将call、return和line事件全加上了。
如果当前函数没有断点,同样在s.stackinfos
表尾部插入一个节点,不过其中hasbreak
字段为false
指示该层没有断点。在设置的钩子事件中,则只保留了cr
,将line事件移除了。这样就只有断点所在的函数内才会触发line事件,可以大幅提升性能。
1 | local function hook (event, line) |
return事件
接下来,我们来看return事件的处理。它首先删除s.stackinfos
表尾部的节点,然后检查前一个节点的函数是否有断点,如果有则恢复line事件,否则移除line事件。
1 | local function hook (event, line) |
line事件
最后一部分是line事件的处理,跟之前没有太大的变化。它遍历断点表,如果匹配到断点则打印提示信息,然后进入用户交互模式。不过这里也做了一个小优化,将debug.getinfo
获取的函数信息缓存到了status.funcinfos
中,下一次就可以直接从缓存中获取到该函数的信息。
1 | local function hook (event, line) |
初始事件设置
hook函数已经修改好了,我们再调整一下setbreakpoint
函数中第一次设置钩子时的行为。初始只设置call事件。
1 | local function setbreakpoint(func, line) |
复杂度分析
我们假设代码执行的总行数为L
,断点数N=n*b
,其中n
为有断点的函数个数,b
为平均每个函数的断点数,断点所在函数平均行数为l
,断点所在函数平均调用次数为c
,总的函数调用次数C
。
那么优化前复杂度为O(L*N)
,优化后的复杂度为O(C*N+c*l*N)
一般情况下(C+c*I) << L
,因为右边L
代码执行总行数可以分成有断点的函数执行总行数+没有断点的函数执行总行数,而左边的c*I
就是有断点的函数执行总行数,C
为函数调用总次数。正常情况下函数调用总次数肯定是远远小于没有断点的函数执行的总行数的,有断点的函数执行总行数也是远远小于没有断点的函数执行总行数的。
测试断点是否正常
我们编写如下测试脚本,来测试下之前提到的那种场景:f1调用f2,f2又调用f3,f1中加了两个断点,在调用f2前后各有一个,f2没有断点,f3有断点。
1 | local ldb = require "luadebug" |
然后来运行测试脚本验证一下。首先停在了f1函数第16行(调用f2之前),然后cont
继续执行,停在了函数f3的断点处,再次cont
继续,函数停在了f1函数第17行(调用f2之后)。可见断点能正常工作
1 | $ lua test.lua |
测试tail call优化
我们再来测试下tail call的优化,编写如下测试脚本。我们定义了一个尾调用递归的函数foo,然后再其他函数上随便加了一个断点(为了设置hook)。然后我们foo函数一直递归调用。
1 | local ldb = require "luadebug" |
Lua5.1测试
1 | $ lua5.1 test2.lua |
用Lua5.1运行上面的测试脚本,内存占用一直在飙升,我只测试了一小会,就已经飙到8G了。
Lua5.3测试
1 | $ lua5.3 test2.lua |
用Lua5.3运行上面的测试脚本,因为有尾调用的优化,内存占用一直保持在720KB。
细心的同学可能已经发现了,我们的hook函数中call事件和line都需要对整个断点表进行遍历,这其中其实是存在着一些冗余的。因为篇幅原因,我们放到下回分解。