食源性疾病是全球范围内重要的食品安全问题,早期发现和查明病因是防控食源性疾病的重要保证。随着新一代基因组测序技术的发展,基于全基因组测序(WGS)的分子分型技术在食源性疾病聚集性病例识别和暴发溯源调查中已显示出极大的应用价值和发展潜力,逐渐成为国际研究热点,欧美相关国家已相继开展研究和布局。在国家重点研发计划“食品安全关键技术研发”重点专项的支持下,国家食品安全风险评估中心与中国农业大学和北京中科助腾科技有限公司合作,以国家食源性疾病分子溯源网络(TraNet)为基础,首次建成了基于WGS分型技术的新型食源性疾病分子溯源网络,是我国首个实现国家、省、市三级实际应用的分子溯源网络。
WGS技术的推广和使用需要解决庞大基因组数据的传输、储存、快速计算和精准比对,需要成熟易用的生物信息学分析流程和标准化解释系统。针对上述问题,研究团队搭建了我国首个全基因组数据计算云引擎,将标准化的WGS数据分析流程转移到云端,大大降低了WGS数据分析、运算及使用门槛。开发了基于阿里云OSS的WGS三级架构WGS原始测序数据交付中心,实现了原始数据的实时、快速上报及安全传输。在此基础上,建立了基于WGS原始及拼接后数据的全基因组特征基因图谱识别算法,通过以上两种分析方式的相互校正,显著提高了全基因组特征基因分析的准确性,同时建立了分辨力高、重复性好的全基因组多位点序列分型(wgMLST)和核心基因组多位点序列分型(cgMLST)标准化方法,结合流行病学信息,构建了溯源分析知识库,实现了不同实验室间WGS数据的快速分析、比对与共享。研究团队还进一步研究并整合NCBI、CARD、ResFinder、VFDB等公共数据库中的特征基因数据,开发了常见食源性致病菌毒力因子、耐药基因、血清分子分型等自动化分析功能模块,有助于各级实验室开展食源性微生物遗传与变异特征、致病和耐药机制及菌株进化等方面的基础研究。目前网络已经在泰国肠炎沙门氏菌暴发病例的跨省溯源、冷冻饮品中单核细胞增生李斯特氏菌的跨省追踪等事件调查中得到成功应用。网络的建成和运行,为我国食源性疾病暴发的快速调查和精准溯源提供了技术支撑。