文章目录 显示

Python微信订餐小程序课程视频

https://edu.csdn.net/course/detail/36074

Python实战量化交易理财系统

https://edu.csdn.net/course/detail/35475
这是Facebook在FlinkForward2021上的一个talk, 主题如下
6d3ee280215c6be75158e68345ea60c1 - XStream: Stream Processing Platform at Facebook
在前面的论文中分析了Facebook的实时计算引擎的设计和选型的考量，里面提到了Facebook的实时计算引擎为了满足易用性和性能不同维度的需求，研发了多套实时计算系统如PumaStylusSwift分别使用SQL，C++，Swift来进行研发。但是多套引擎也带来了很多问题，可选择的引擎太多，不同的引擎的功能重叠，对用户和对于引擎维度都有很大的成本。为了能让用户获得一致性的体验，其内部选择将多套引擎整合成一套也就是XStream。
e9d23cbfe65ba4e6425655894e64a542 - XStream: Stream Processing Platform at Facebook
XStream架构分层
798346811d316042bef21d23aae4a050 - XStream: Stream Processing Platform at Facebook
他有以下的一些特点

基于Stylus的一个Native C++的执行引擎
基于统一的SQL语言，统一的流，批，交互式的查询语言
使用解释执行而不是编译执行的模式
和presto/spark 共享使用了向量化的SQL执行引擎

1d572717ba01d4f6da5c8d8383adce56 - XStream: Stream Processing Platform at Facebook
e0e3cb3e7bbce33c9f73bd9ffbfab9e3 - XStream: Stream Processing Platform at Facebook
SQL上使用标准的SQL2016的语法和Presto统一，并且做了Multi-tumble 和 Mulit-slide window的拓展工作
bfdc151a437e15d82b29f7c342458a68 - XStream: Stream Processing Platform at Facebook
编译执行的方式就是根据SQL生成的AST tree进行codegen，然后进行编译执行。编译执行的坏处主要是

每个pipeline都会生成一个binary文件
scale up down不友好
依赖问题
编译时间较长

06f8f44f9c126b3be3ed094951bf3603 - XStream: Stream Processing Platform at Facebook
最终他们采用的是解释执行的模式。由C++ worker解释执行，一个作业只有一个binary，但是解释执行的效率肯定没有编译执行的效率高，因此他们使用了以下手段来提速

使用列式存储+向量化处理模式
利用simd指令加速

b55eeb1a07f8d1cecf68cd1ef989bd9e - XStream: Stream Processing Platform at Facebook
向量化提速用到了最近新起的velox的项目，它是一个C++向量化的SQL执行引擎，由Facebook开源，并在其内部用于Presto和Spark以及XStream的统一的运行时向量化加速，velox相关的可以参看这篇文章 Velox: 现代化的向量化执行引擎
83093fc812ce68dbce211f5354b71bb2 - XStream: Stream Processing Platform at Facebook
整体的XStream架构，提供CoreSQL和DataFrame两套api，编译成LogicalPlan和Physical Plan。然后分发到local worker进行处理。Local planner将其翻译成XStream operator, 然后利用Velox 来进行加速处理