发现一个开源项目优化点，点进来就是你的了

文章目录 显示

? 优质资源分享 ?

学习路线指引（点击解锁）	知识定位	人群定位
? Python实战微信订餐小程序 ?	进阶级	本课程是python flask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。
?Python量化交易实战?	入门级	手把手带你打造一个易扩展、更安全、效率更高的量化交易系统

hello，大家好呀，我是小楼。

最近无聊（摸）闲逛（鱼）github时，发现了一个阿里开源项目可以贡献代码的地方。

不是写单测、改代码格式那种，而是比较有挑战的性能优化，最关键的是还不难，仔细看完本文后，有点基础就能写出来的那种，话不多说，发车！

f7724ea2d55a6a6884d732c81d7e3ec8 - 发现一个开源项目优化点，点进来就是你的了

相信大家在日常写代码获取时间戳时，会写出如下代码:

long ts = System.currentTimeMillis();

读者中还有一些Gopher，我们用Go也写一遍：

UnixTimeUnitOffset = uint64(time.Millisecond / time.Nanosecond)
ts := uint64(time.Now().UnixNano()) / UnixTimeUnitOffset

在一般情况下这么写，或者说在99%的情况下这么写一点问题都没有，但有位大佬研究了Java下时间戳的获取：

http://pzemtsov.github.io/2017/07/23/the-slow-currenttimemillis.html

他得出了一个结论：并发越高，获取时间戳越慢！

68fcf99a1ec0a35b1247f6c35d9cfc24 - 发现一个开源项目优化点，点进来就是你的了

a3d0d6642b82735342370b9f6878ff2d - 发现一个开源项目优化点，点进来就是你的了

具体到细节咱也不是很懂，大概原因是由于只有一个全局时钟源，高并发或频繁访问会造成严重的争用。

缓存时间戳

我最早接触到用缓存时间戳的方式来优化是在Cobar这个项目中：

https://github.com/alibaba/cobar

由于Cobar是一款数据库中间件，它的QPS可能会非常高，所以才有了这个优化，我们瞅一眼他的实现：

起一个单独的线程每隔20ms获取一次时间戳并缓存起来
使用时间戳时直接取缓存

https://github.com/alibaba/cobar/blob/master/server/src/main/server/com/alibaba/cobar/util/TimeUtil.java

/**
 * 弱精度的计时器，考虑性能不使用同步策略。
 * 
 * @author xianmao.hexm 2011-1-18 下午06:10:55
 */
public class TimeUtil {
    private static long CURRENT\_TIME = System.currentTimeMillis();

    public static final long currentTimeMillis() {
        return CURRENT_TIME;
    }

    public static final void update() {
        CURRENT_TIME = System.currentTimeMillis();
    }
}

https://github.com/alibaba/cobar/blob/master/server/src/main/server/com/alibaba/cobar/CobarServer.java

timer.schedule(updateTime(), 0L, TIME_UPDATE_PERIOD); // TIME\_UPDATE\_PERIOD 是 20ms
...
// 系统时间定时更新任务
private TimerTask updateTime() {
    return new TimerTask() {
        @Override
        public void run() {
            TimeUtil.update();
        }
    };
}

Cobar之所以这么干，一是因为往往他的QPS非常高，这样可以减少获取时间戳的CPU消耗或者耗时；其次是这个时间戳在Cobar内部只做统计使用，就算不准确也并无大碍，从实现上看也确实是弱精度。

后来我也在其他的代码中看到了类似的实现，比如Sentinel（不是Redis的Sentinel，而是阿里开源的限流熔断利器Sentinel）。

Sentinel作为一款限流熔断的工具，自然是自身的开销越小越好，于是同样都是出自阿里的Sentinel也用了和Cobar类似的实现：缓存时间戳。

原因也很简单，尽可能减少对系统资源的消耗，获取时间戳的性能要更优秀，但又不能和Cobar那样搞个弱精度的时间戳，因为Sentinel获取到的时间戳很可能就决定了一次请求是否被限流、熔断。

所以解决办法也很简单，直接将缓存时间戳的间隔改成1毫秒

去年我还写过一篇文章《低开销获取时间戳》，里面有Sentinel这段代码：

034cdb744d4e3b14962e9722531aa36d - 发现一个开源项目优化点，点进来就是你的了

甚至后来的Sentinel-Go也采取了一模一样的逻辑：

85e6dc0f4720574dfd805aab815805ec - 发现一个开源项目优化点，点进来就是你的了

以前没有多想，认为这样并没有什么不妥。

直到前两天晚上，没事在Sentinel-Go社区中瞎逛，看到了一个issue，大受震撼：

https://github.com/alibaba/sentinel-golang/issues/441

提出这位issue的大佬在第一段就给出了非常有见解的观点：

eb5eb11a3d629fd01219ea53413b6246 - 发现一个开源项目优化点，点进来就是你的了

说的比较委婉，什么叫「负向收益」？

我又搜索了一下，找到了这个issue：

https://github.com/alibaba/Sentinel/issues/1702

e37ed9ab482d818900e6af77b7960c0d - 发现一个开源项目优化点，点进来就是你的了

TimeUtil吃掉了50%的CPU，这就是「负向收益」，还是比较震惊的！

79e812ed31324aa296d3be594c2f169a - 发现一个开源项目优化点，点进来就是你的了

看到这个issue，我简单地想了下：

耗时：获取时间戳在一般情况下耗时几乎都不会影响到系统，尤其是我们常写的业务系统
CPU：假设每毫秒缓存一次时间戳，抛开其他开销不说，每秒就有1000次获取时间戳的调用，如果每次请求中只有1次获取时间戳的操作，那么至少得有1000QPS的请求，才能填平缓存时间戳的开销，况且还有其他开销

但这只是我们的想当然，如果有数据支撑就又说服力了。为此前面提出「负向收益」的大佬做了一系列分析和测试，我们白嫖一下他的成果：

8430f695579117b53af7618f0ce74688 - 发现一个开源项目优化点，点进来就是你的了

82ea9982320044a5092d0b4f7da7aa4d - 发现一个开源项目优化点，点进来就是你的了

183ad3e1f397489e2cc1cee787a4ff69 - 发现一个开源项目优化点，点进来就是你的了

eda552f8e007ab162853f856fa9e84c7 - 发现一个开源项目优化点，点进来就是你的了

看完后我跪在原地，久久不能起身。

d9079b668679362ae986b2aa54bab04b - 发现一个开源项目优化点，点进来就是你的了

课代表来做个总结：

缓存时间戳开销最大的地方是sleep和获取时间戳
理论上来说单机QPS需要大于4800才会有正向收益，真实测试结果也是在4000QPS以内都没有正向收益
如果不要这个缓存时间戳，获取时间戳耗时会增加，但这在可接受范围内
鉴于常规情况下QPS很少会达到4K，所以最后结论是在Sentinel-Go中默认禁用这个特性

这一顿操作下来，连Sentinel社区的大佬也觉得很棒，竖起来大拇指：

7b1fc9b82266794985b4a84a35a01a4e - 发现一个开源项目优化点，点进来就是你的了

然而做了这么多测试，最后的修改就只是把true改成false：

67f673df6a7679519576ed1603df2adf - 发现一个开源项目优化点，点进来就是你的了

自适应算法

本来我以为看到这位大佬的测试已经是非常有收获了，没想到接下去的闲逛又让我发现了一个更了不得的东西。

既然上面分析出来，在QPS比较高的情况下，收益才能抵消被抵消，那么有没有可能实现一个自适应的算法，在QPS较低的时候直接从系统获取，QPS较高时，从缓存获取。

果不其然，Sentinel（Java版，版本>=1.8.2）已经实现了！

issue参考：https://github.com/alibaba/Sentinel/pull/1746

我们捋一下它的实现：

bff036e00bf225d2c3127262dab18325 - 发现一个开源项目优化点，点进来就是你的了

我们首先看最核心的缓存时间戳的循环（每毫秒执行1次），在这个循环中，它将缓存时间戳分成了三个状态：

RUNNING：运行态，执行缓存时间戳策略，并统计写时间戳的QPS（把对缓存时间戳的读写QPS分开统计）
IDLE：空闲态（初始状态），什么都不做，只休眠300毫秒
PREPARE：准备态，缓存时间戳，但不统计QPS

这三个状态怎么流转呢？答案在开头调用的check方法中：

ddd175b614c3bd757f32ff8f4f10ebf6 - 发现一个开源项目优化点，点进来就是你的了

首先check逻辑有个间隔，也就是每隔一段时间（3秒）来做一次状态转换；

其次如果当前状态是空闲态并且读QPS大于HITS_UPPER_BOUNDARY（1200），则切换为准备态。

如果当前状态是运行态且读QPS小于HITS_LOWER_BOUNDARY（800），则切换为空闲态。

发现似乎少了切换到运行态的分支，看上面的循环中，第三个准备态的分支运行一次就将状态切换为运行态了。

这是为啥？其实准备态只是为了让程序从空闲态切换到运行态时过渡的更平滑，因为空闲态下缓存时间戳不再更新，如果没有过渡直接切换到运行态，那可能切换后获取的时间戳是有误差的。

文字可能不直观，我们画一个状态流转图：

cd6065f5aeb33a405773feb1fbeb6eab - 发现一个开源项目优化点，点进来就是你的了

最后这些准备好了，获取时需要做两件事：一是统计读时间戳的QPS，二是获取时间戳；如果是空闲态或准备态则直接获取系统时间返回，如果是运行态则从缓存中拿时间戳。

938ea3246a00732f6c44f1439663fcfd - 发现一个开源项目优化点，点进来就是你的了

当程序比较空闲时，不会缓存时间戳，降低CPU的消耗，QPS较高时缓存时间戳，也能降低CPU的消耗，并且能降低获取时间戳的时延，可谓是一举两得。

但这中间我有个疑问，这里QPS的高低边界不知道是如何得出的，是拍脑袋还是压测出来的，不过这个数值似乎并不一定绝对准确，可能和机器的配置也有关系，所以我倾向这个值可以配置，而不是在代码中写死，关于这点，这段代码的作者也解释了原因：

0af10126f9bf6662ab0b4e8da8f167c7 - 发现一个开源项目优化点，点进来就是你的了

最后可能你会问，这QPS咋统计呀？

这可是Sentinel的强项，利用LeapArray统计，由于这不是本文重点，就不展开了，有兴趣可以参考我之前的文章《Sentinel-Go 源码系列（三）滑动时间窗口算法的工程实现》，虽然文章是Go的，但算法和Java的是一模一样，甚至实现都是照搬。

有没有测试数据支撑呢？有另一位大佬在评论区贴出了他的测试数据，我们看一下：

a103fa32550179eb940111995a2cb519 - 发现一个开源项目优化点，点进来就是你的了

在低负载下，CPU消耗降低的特别明显，高负载则没什么变化，这也符合我们的预期。

看到这里你是不是觉得该点题了？没错，Sentinel-Go还没实现上述的自适应算法，这是个绝佳的机会，有技术含量，又有参考（Java版），是不是心动了？

社区中也有该issue：

https://github.com/alibaba/sentinel-golang/issues/419

9b606ff580c9577ba6966d25b006faba - 发现一个开源项目优化点，点进来就是你的了

这个issue在2021年8月有个哥们认领了，但截止目前还没贡献代码，四舍五入等于他放弃了，所以你懂我意思吧？

最后说一句

如果你觉得文章还可以，麻烦动动小手，点个关注、在看、赞，你的鼓励是我持续创作的动力！

对了，如果觉得还不过瘾，可以再看看这些相关文章：

感谢阅读，我们下期再见~

搜索关注微信公众号"捉虫大师"，后端技术分享，架构设计、性能优化、源码阅读、问题排查、踩坑实践。

转载请注明：xuhss » 发现一个开源项目优化点，点进来就是你的了

xuhss 简单、充实的学习

发现一个开源项目优化点，点进来就是你的了

? 优质资源分享 ?

缓存时间戳

自适应算法

最后说一句

您必须登录才能发表评论！

? 优质资源分享 ?

缓存时间戳

自适应算法

最后说一句

您必须 登录 才能发表评论！

您必须登录才能发表评论！