苹果发布基于流匹配的蛋白质折叠模型SimpleFold,被网友称为“iFold”。
该模型采用通用Transformer架构,未使用专属模块设计,通过流匹配生成范式实现从氨基酸序列到3D结构的预测。
SimpleFold-3B参数版本在CAMEO22基准测试中达到AlphaFold2性能的95%,并在CASP14高难度测试集上超越同类模型ESMFold。
模型依赖自适应层归一化适配蛋白质特征,利用流匹配技术学习从噪声分布到构象分布的映射,支持一步式生成原子坐标。
训练使用包含900万条数据的混合数据集,涵盖100M至3B参数规模的多尺度模型。
在搭载M2 Max芯片的MacBook Pro上,处理512残基序列推理仅需两三分钟,显著优于传统模型小时级耗时。
研究第一作者Yuyang Wang本科毕业于同济大学,后获卡内基梅隆大学机械工程硕士、机器学习硕士及机械工程博士学位,曾在Momenta实习,现为苹果机器学习研究员。
通讯作者Jiarui Lu本科毕业于清华大学,在朱军教授实验室任研究助理,后获卡内基梅隆大学机器学习硕士学位,2020年加入苹果,曾主导开源项目ToolSandbox的开发。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。