安吉康尔天使轮融资1500万,要用“AI+基因大数据”基因智能助力遗传病临床决策
导读:2017年11月28日,安吉康尔宣布获得1500万人民币天使轮融资。本轮融资由丹华资本(DHVC)领投,和盟创投跟投。这是丹华资本成立一期人民币基金以来投资的第一批企业。
2017年11月28日,安吉康尔宣布获得1500万人民币天使轮融资。本轮融资由丹华资本(DHVC)领投,和盟创投跟投。这是丹华资本成立一期人民币基金以来投资的第一批企业。
21世纪初,人类基因组计划完成时提出了个性化医疗的理念,旨在利用基因组信息,根据患者的个体特征定制个性化的治疗方案。
但个性化医疗在实践过程中遇到诸多难题,主要的挑战在于基因疾病往往牵涉到多基因,在错综复杂的多基因位点中挖掘基因与疾病以及药物反应之间的联系,成为了个性化治疗道路的最大障碍。
2016年,AlphaGo战胜李世石,开启人工智能元年,人工智能应用再上新高。在“AI+”热潮席卷全球的同时,也为个性化医疗重新燃起了希望,安吉康尔在这样的时代背景下应运而生。
遗传病临床检测,冷门却有前景的蓝海市场
安吉康尔成立于2017年初,致力将基因大数据与人工智能相结合,打造临床决策辅助的精准医疗平台。与目前绝大多数聚焦肿瘤临床检测、NIPT以及基于NGS进行健康管理的企业不同,安吉康尔着力于遗传病领域。
安吉康尔创始人兼CEO李阳博士毕业于美国伊利诺伊大学香槟分校生物信息学专业,曾荣获国家优秀自费留学生奖学金。李阳博士毕业后就职于美国遗传病基因测序龙头企业INVITAE。
2016年,一位国内的朋友找到李阳,希望他能够帮助联系做一次遗传性肿瘤的基因检测,这位朋友的家族成员中多人曾患乳腺癌。由于当时其人在美国,李阳联系了国内一家基因检测公司进行检测。
但是该公司最终提供的检测结果却让他感到非常吃惊,检测结果显示所有检测人员均是乳腺癌高风险,但是报告的具体突变位点,百分百都只属于人群中常见的基因位点多态性。“连低频突变都谈不上,所谓肿瘤高风险更是无从谈起。”李阳表示。
当时他就看到了国内基因检测市场之乱象,也催生了其回国投入基因检测行业的想法。
无论是国内还是国外,临床级别的检测都是NGS行业的“重工”地带。但与国外不同的是,国内的大多数企业都把目光放到了NIPT和肿瘤靶向用药检测上,专注于遗传病临床检测的公司却很少。
从样本量来看,国内遗传病检测公司平均每年也就做几千例遗传病临床检测,但这种小作坊性质的服务远远无法满足潜在的需求。以新生儿出生缺陷为例,我国的出生缺陷率约为5%-8%,如果每年新生人口按2000万计算,百万级的遗传病新生儿确诊是一个非常大的需求缺口。
这个量级不比肿瘤市场小。”李阳向动脉网透露。也许就是那个时候,他就下定决心要回国。
大数据和分析解读是核心,“清一色”的生信算法团队
INVITAE是一家尤其注重生物信息算法和分析解读自动化的基因信息公司。李阳告诉动脉网,2014年刚加入的时候,公司团队大概有150人,其中有80人都是做软件开发的,包括不会写代码的遗传学家,也要深度参与自动化解读系统的开发。
“这在国内是很难想象的,一个做基因检测的公司,做程序和算法开发的人员比例如此之高。”李阳告诉动脉网。
遗传病临床检测的复杂度和临床解读方面的挑战比NIPT和肿瘤都要复杂。如果一个月处理10个、100个样本,那么人力尚可以解决。但如果样本量增加到1000个、10000个呢?很难想象在这样大的工程量下人力能够保证报告速度,更别提解读结果的精准度了。
基于这样的逻辑,INVITAE在系统研发上投入了大量资源,目的就是建立从遗传生物信息学到数据智能解读的自动化流程。这样一来,他们既能够保证解读水平的准确度,又能够保证在大样本量下的计算可扩展性。
在与李阳的谈话中,动脉网感到INVITAE的逻辑对他有着深远影响。正如和盟创投生物医疗基金所认为,AI+基因大数据领域,短期看商业应用场景很重要,但长期来看,理念和业界领先的技术是确保企业破局的关键。
安吉康尔的初创团队中,五个人全都出自生物信息领域。公司CTO刘阳是李阳的高中同桌,本科毕业于清华大学计算机系,之后又在军事医学科学院拿到生物信息学的博士学位,擅长组学大数据分析。
COO吕佩涛毕业于北京大学生物医学工程系,具有丰富的微流体系统计算模拟和设计开发经验。
生物信息总监张洋是李阳在伊利诺伊大学香槟分校的师弟,主要研究方向为基因组调控原件的功能解释与其在人类基因组疾病中的应用,有丰富的实验分析与计算机算法相结合的经验。
首席科学顾问马坚教授则是李阳的博士导师,现任美国卡内基梅隆大学(CMU)计算机学院计算生物学及机器学习系副教授。
不仅如此,安吉康尔现在的团队中,超过一半都是生信和软件开发人员。秉承INVITAE的逻辑,他们希望利用基因大数据和人工智能算法,为解读提供技术支持,使解读更准确,更快速,成本更低。
“每个人的基因都有数以万计的突变位点。要从如此复杂的信息中找出疾病的关键致病基因突变,并辅助临床决策,这本来就不是纯靠人工能完成的任务。”李阳表示。
丹华资本中国区主管合伙人张大地表示:“基因行业当前充满了机遇和活力,基因检测不仅对疾病防治和用药指导会起到不可替代的关键的作用,而且基因检测将会成为每个居民的标配检测。基因检测新旧技术在快速迭代中,安吉康尔团队强大的专业背景、技术实力和快速执行力非常适应这种挑战。”
覆盖下机数据到决策支持,立志做基因智能的先行者
AEGIS基因智能平台
安吉康尔致力于研发高精度全自动的遗传病测序数据分析系统和智能解读系统AEGIS,安吉康尔的诸多业务也是围绕着此系统展开,主要分为四个模块。
第一个模块是生物信息学算法模块(WEAVER),与国内同行相比,安吉康尔特别关注于基因拷贝数变异(CNV)。2016年,李阳和马坚合作开发了Weaver算法并发表在Cell系统生物学和计算生物学子刊Cell Systems。
此前,CNV算法是线性一维的,而Weaver算法利用概率图模型(马尔科夫随机场),从一维升级到二维,将基因组看作一个无向图进行全部扫描,从而精确到单个位点并定量检测CNV。
第二个模块是测序临床信息系统(HIVE),可为临床医生和科研人员提供基因组大数据管理。临床组学大数据的管理与数据挖掘是实现精准医疗的关键,随着NGS技术不断完善,全外显子组测序在遗传病诊断领域逐渐成为主流。
全外显子测序数据庞大,而医生需要能看懂的临床报告,包括病人的临床表征、基因突变对应的综合症以及相应的检测和辅助确诊方案。安吉康尔通过HIVE系统整合患者的外显子组测序数据、影像学数据、生化指标、家族遗传病史、环境和生活方式数据等各方面数据,制定个性化的精准诊断和治疗方案。
第三个模块是知识库(SAKYA)。这一模块包括公共数据库的整合以及自有数据的深度挖掘。该知识库是建立表型、疾病、基因、突变以及药物之间的联系的关键。
第四个模块是临床决策辅助系统(COSMO)。该系统现阶段的任务是通过整合生物信息学数据、临床数据和知识库半自动出具遗传病检测报告,遗传咨询师只需要进行简单的校对。在未来,COSMO系统将匹配患者的临床信息和基因组信息,进行诊疗方案的智能推荐,推进精准医疗实践落地。
丹华资本创始人、斯坦福大学终生教授张首晟认为:“基因是世界万物的基本原理,而基因组属于复杂系统。安吉康尔提出的基因智能概念,用最基本的数学和计算模型解决基因组学数据和临床指导问题,非常契合基因组学发展的趋势和精准医学的商业化方向。”
李阳告诉动脉网,公司已与北京大学生物医学工程系联合建立基因智能协同创新实验室,合作推进AEGIS系统研发。目前AEGIS系统的初代版本还只是在公司内部使用,保证自身数据解读和报告需要。
未来,如果医院、临检实验室有需求,他们也希望能够在这些场所投放,提供遗传病诊治解决方案。
未来目标:面向健康人群,覆盖新生儿筛查
目前公司的产品主要针对临床疾病诊断,即针对已经有临床表现的患者进行确诊以辅助临床决策。但是目前有些遗传病在发病后是无法干预和控制的,李阳透露,他们下一步的目标是实现健康人群的筛查,尤其是新生儿的筛查。
“在出现症状之前明确的计算出患病概率和时间节点,临床上才能够进行早期干预。”李阳表示。
实现新生儿的筛查既需要上游测序成本的下降,也需要数据库和分析解读环节高效精确的技术支持。尤其是分析解读环节,针对已经发病的患者去做诊断,在解读环节是有疑似疾病方向的,可以根据患者的临床表征去有针对性的寻找可能的致病突变,还可以根据家系信息等反过来确定意义未明的新突变。因此,对于健康人群,设计一个高效精准的临床级别筛查产品是非常有挑战性的。
“对于新生儿筛查,理论上所有的遗传疾病都要筛查一遍,目前数据库和分析解读能力跟不上,整个行业能做的都非常有限。”李阳表示。
他向动脉网透露,按照现在测序成本下降的趋势,上游成本下降只是时间问题,反而是本地化的数据库和数据分析解读能力将会是未来的技术瓶颈,这便又回到安吉康尔在基因智能方面的逻辑。