技术详细介绍
目前,随着医疗技术不断发展,对携带大量遗传疾病信息的单体型数据研究和应用的深入及新一代基因测序技术的发展,使个体单体型重建问题成为生物信息学的研究热点。个体单体型重建问题是指为给定的来自同源染色体的由DNA测序方法得到的DNA片段数据,根据片段上的SNP值组装出单体型。虽然个体的单体型可以通过生物实验技术测定,但在当前的实验技术水平下,直接通过生物学实验手段来测定一个个体的单体型在时间和成本上过于昂贵,因此利用计算机技术来确定个体的单体型,即个体单体型重建问题,有极其重要的现实意义。 之前的研究基本上是在二倍体生物个体上展开,对三倍体个体单体型重建问题的研究较少。有文献基于最少错误更正模型 (the Minimum Error Correction,MEC)、带基因型最少错误更正模型 (the Minimum Error Correction with Genotype Information,MEC/GI)及最少片段删除模型 (the Minimum Fragment Removal,MFR),提出求解K-个体单体型重建问题的算法。这些算法的性能受片段数目、单体型长度及错误率等参数严重制约。因此本文提出针对MEC/GI模型的基于枚举策略重建三倍体个体单体型的算法,并开发成系统,供研究人员和生物学家使用。 本软件的基于枚举策略重建三倍体个体单体型的算法,性能受片段数目、单体型长度及错误率等参数影响较小,比前人提出的重建三倍体个体单体型的算法性能更好,整合成系统后,使本文的算法更好的运用于实际生活中,具有很强的实用价值。
目前,随着医疗技术不断发展,对携带大量遗传疾病信息的单体型数据研究和应用的深入及新一代基因测序技术的发展,使个体单体型重建问题成为生物信息学的研究热点。个体单体型重建问题是指为给定的来自同源染色体的由DNA测序方法得到的DNA片段数据,根据片段上的SNP值组装出单体型。虽然个体的单体型可以通过生物实验技术测定,但在当前的实验技术水平下,直接通过生物学实验手段来测定一个个体的单体型在时间和成本上过于昂贵,因此利用计算机技术来确定个体的单体型,即个体单体型重建问题,有极其重要的现实意义。 之前的研究基本上是在二倍体生物个体上展开,对三倍体个体单体型重建问题的研究较少。有文献基于最少错误更正模型 (the Minimum Error Correction,MEC)、带基因型最少错误更正模型 (the Minimum Error Correction with Genotype Information,MEC/GI)及最少片段删除模型 (the Minimum Fragment Removal,MFR),提出求解K-个体单体型重建问题的算法。这些算法的性能受片段数目、单体型长度及错误率等参数严重制约。因此本文提出针对MEC/GI模型的基于枚举策略重建三倍体个体单体型的算法,并开发成系统,供研究人员和生物学家使用。 本软件的基于枚举策略重建三倍体个体单体型的算法,性能受片段数目、单体型长度及错误率等参数影响较小,比前人提出的重建三倍体个体单体型的算法性能更好,整合成系统后,使本文的算法更好的运用于实际生活中,具有很强的实用价值。