陈帆的手指从回车键上收回,指尖还残留着刚才敲击的力度。屏幕右下角的时间戳停留在06:43:17,那条断裂的日线数据已经被重新校准归档,但它的跳跃方式始终卡在他的思维里——不是渐进,不是波动,而是跃迁。
他没动,只是盯着主屏左侧一列缓存日志。攻击已经过去三个小时,系统运行平稳,可他知道,真正的隐患不在防火墙之外,而在预测模型内部。现有的统计方法在极端行情中频频失灵,就像一辆靠惯性行驶的车,在急弯处彻底失控。
“李阳。”他开口,声音不高,却让整个实验室瞬间安静下来。
李阳刚放下水杯,立刻转身。“在。”
“调出创业板最近三年所有日K线数据,我要看中青宝、东方财富、华谊兄弟这五十三只股票的状态跃迁特征。”他说,“不是看价格,是看走势形态的变化节奏。”
张远抬头,“状态?你是说……把K线分类?”
“对。”陈帆终于转过身,目光扫过两人,“市场从来不是连续运动的。它跳变,它停顿,它反复试探方向。我们一直用回归和趋势外推,其实是在假设市场有记忆。但如果它没有呢?如果每一阶段的走势,只取决于当前所处的状态,而不依赖更早的历史?”
李阳皱眉,“你是想用马尔可夫链建模?”
“没错。”陈帆走到副控台前,接过键盘,“我们不再预测具体点位,而是判断:现在处于哪种走势状态,下一步最可能转向哪里。”
他迅速列出五个类别:上涨延续、上涨衰竭、下跌延续、下跌反弹、盘整。每一种都对应一组技术指标组合——MACD是否红柱缩短、RSI是否超买、成交量是否萎缩或突增。
“比如,一只股连续拉升三天,第四天量能跟不上,MACD顶背离,RSI冲到80以上——这不是健康回调,是‘上涨衰竭’。这个状态下,下一阶段进入‘下跌延续’的概率,应该远高于继续上涨。”
张远若有所思,“所以你不关心它为什么跌,只关心它处在哪个位置,以及从这个位置出发,通常会去哪里?”
“正是。”陈帆点头,“就像掷骰子,每一次结果独立,但我们知道六面体出现每个数字的概率分布。市场也在不同状态间转移,只要我们能统计出转移概率,就能预判方向。”
李阳深吸一口气,“那你需要足够长的历史序列来构建转移矩阵。”
“我已经准备好了。”陈帆打开本地数据库,导入一段加密压缩包,“这是过去三十六个月的完整日线记录,剔除停牌和异常波动样本。你现在写个脚本,按我刚才的标准自动标注每一根K线所属状态。”
李阳立刻动手。Python编辑器亮起,他先定义状态判定函数,再循环遍历每只个股的时间序列。屏幕上开始滚动输出状态标签:U(上涨延续)、W(上涨衰竭)、D(下跌延续)、B(下跌反弹)、S(盘整)。
几个小时后,初步状态序列生成完毕。李阳将其汇总为频次表,统计从一种状态转移到另一种状态的次数。例如,“W→D”出现了四百七十二次,“W→U”仅一百零三次。
“原始频次出来了。”他指着表格,“但有些转移路径极少发生,比如‘B→W’只有三次,直接算概率会不稳定。”
“加拉普拉斯平滑。”陈帆说,“给每个转移路径加一,避免零概率问题。然后归一化,得到最终的转移概率矩阵。”
代码再次运行。几分钟后,一个五乘五的矩阵成型。主对角线上的数值普遍偏低,说明市场一旦进入某种状态,往往不会停留太久。而“W→D”的概率高达0.68,“S→U”和“S→D”接近均衡,分别为0.41和0.39。
“有意思。”张远凑近屏幕,“也就是说,一旦出现上涨衰竭信号,超过三分之二的可能性会转入下跌延续。这不是情绪判断,是历史行为统计。”
“接下来验证。”陈帆切换到回测模块,“用这个模型去预测已知序列中的下一个状态,看看准确率。”
第一轮测试选取2017年全年数据,涵盖震荡与局部牛市。结果显示,整体预测准确率为56.3%,相比原有模型提升6.3个百分点。
不算高。
“样本太短。”陈帆摇头,“而且避开了剧烈转折期。我们要看的是牛熊切换时的表现。”
他重新划定测试区间:2000年1月至2001年6月。那是互联网泡沫破裂前后,创业板虽未设立,但中小市值个股波动剧烈,具备典型趋势逆转特征。
李阳更新参数,重新加载数据集。这次,系统逐日模拟状态转移,并与实际走势比对。
等待结果的几分钟里,没人说话。服务器风扇低鸣,终端光标缓慢前进。
“出来了。”李阳轻声说。
准确率:75.2%。在“上涨衰竭→下跌延续”这一关键路径上,命中率达到81.4%。
“提升了十九个百分点。”张远喃喃道,“而且是在最难预测的阶段。”
李阳盯着那张热力图,忽然笑了,“这数学结构……真干净。每一个状态都是出口,也是入口。你不需要知道之前走了多远,只需要看清此刻站在哪里。”
“这就是马尔可夫的意义。”陈帆缓缓靠向椅背,“它不追求完美拟合历史,而是抓住动态规律的本质——变化本身也有模式。”
他站起身,走到主控台前,将新模型封装为独立模块,命名为“MarkovChain_TrendV1”。随后接入实时数据流,设定每收盘后自动更新一次转移矩阵。
“以后每天闭市,系统都会重新计算最新概率分布。”他说,“当某个转移路径的频率显著上升,比如‘S→D’突然变快,就意味着市场环境正在倾斜。”
张远端起桌上冷掉的咖啡喝了一口,忽然咧嘴一笑:“要是这玩意真能预判崩盘,咱以后就不只是操盘手了。”
李阳没接话。他打开笔记本,新建文档,标题打了六个字:“马尔可夫状态机”,又停下,盯着屏幕边缘一闪而过的状态提示栏。
那个绿色的小图标刚刚跳动了一下,从S变成了W。
“等等。”他的手指悬在键盘上方,“‘中青宝’刚刚被标记为‘上涨衰竭’。”
陈帆立刻看向主屏。该股今日涨幅4.2%,量能较昨日放大两成,但MACD红柱明显缩窄,RSI达到78。
“按照新模型,”李阳低声说,“它明天有六成八的概率转入下跌延续。”