我们为什么放弃了全栈 Python,转而用 Rust 重构了整个筛选 Pipeline

张开发
2026/4/16 8:34:31 15 分钟阅读

分享文章

我们为什么放弃了全栈 Python,转而用 Rust 重构了整个筛选 Pipeline
在跨国药企(MNC)的真实环境里,AI 最大的瓶颈从来不是模型参数量,而是工业级的工程链路。很多团队搞 AI 研发的常态是:花 6 个月精调一个 SOTA 模型;花 2 天封装成 API;最后花 6 个月去解释为什么线上跑得比实验室慢 10 倍。在真实药物筛选(Virtual Screening)场景下,算力永远是稀缺资源。今天我想聊聊,我们为什么放弃了全栈 Python,转而用Rust重构了整个筛选 Pipeline。一、 药企 AI 的残酷真相:Amdahl’s Law很多人以为筛选慢是因为 GPU 算力不够。但如果你去 Profile 一下线上流程,你会发现一个令算法工程师崩溃的现实:在一个典型的分流筛选任务中:SMILES 分子解析:40% 时间(CPU 密集型)特征工程(Fingerprint/Descriptor):20% 时间(CPU 密集型)模型推理(Inference):25% 时间(GPU 密集型)IO/入库/结果排序:15% 时间根据Amdahl’s Law(阿姆达尔定律):即使你把 GPU 推理速度优化到极致(耗时降为 0),整体速度也只快了 1.3 倍。剩下的 75% 时间,你的昂贵 GPU 全在等数据。Python 的痛点在这里被无限放大:GIL

更多文章