全基因多位点序列分型(wgMLST)
过去的15年中,多位点序列分型(MLST)已被证明可用于细菌的分子分型。传统的MLST分析框架通常定义七个位点(管家基因),这些基因使用Sanger技术进行测序。为每个位点的唯一序列分配了等位基因编号,并根据它们的等位基因图谱(这是七个等位基因编号的组合)确定了细菌菌株。
随着二代测序技术提供了快速、经济高效的细菌基因组测序方法,并逐渐取代了Sanger测序技术,传统的MLST可以扩展到全基因组MLST(wgMLST)。由于在wgMLST中考虑了更多的位点(通常为–),因此可以获得更高的分型分辨率。
与全基因组SNP分析相反,wgMLST是基于等位基因变异的概念,这意味着重组、缺失或多个位置的插入被视为单个进化事件。与仅考虑点突变的方法相比,该方法在生物学上可能更相关。
该技术的主要缺点是需要等位基因调控。在缺乏合适的自动化工具的情况下,为数千个位点维持一致的等位基因分配将是一项艰巨的任务。为此,软件提供了自动管理工具。
Bionumerics中进行wgMLST分析
ThewgMLST管理员andWGStools插件
wgMLST管理员插件提供了各种自动管理工具,可为任何选择的生物体建立和维护wgMLST分析框架。
自动命名等位基因自动分配序列型别根据wgMLST创建子框架如MLST,、eMLST,、rMLST使用质控工具尽管只有少数人可以访问特定于生物体的参考数据库,但大多数用户仅需要WGStools插件。该插件提供了一个全自动管道,来基于整个基因组序列数据来识别等位基因。
BioNumerics使用两种方法来识别等位基因:
基于从头拼接,然后进行BLAST搜索使用不基于拼接的方法,即直接从序列的原始reads计算引擎
在7.5和更高版本的BioNumerics中,可以在外部计算引擎上执行复杂的计算,例如从头拼接。您可以在几乎免安装的按使用量付费的云解决方案(例如通过Amazon)或本地计算机集群部署(需要自定义服务)之间进行选择。
可以在BioNumerics内部将任务发布到计算引擎上,并检索这些计算的结果(包括用于质量控制的参数)。只有wgMLST等位基因图谱作为字符集存储在BioNumerics数据库中,从而形成了一个轻量级且响应迅速的菌株数据库。
不同水平的分析框架
基于wgMLST分析框架中包含的位点,可以在不同级别定义(例如,核心基因组MLST(cMLST),核糖体MLST(rMLST)等。
BioNumerics7.5及更高版本中的字符视图提供了一种灵活的工具,可以选择用于软件中存在的分型、聚类分析(例如最小生成树)或统计测试的位点。
使用Bionumerics进行wgMLST分析的原因
Bionumerics提供了:
WgMLST的全自动流程集成计算引擎:可以基于云或本地设置轻量级的样品数据库灵活选择位点当前,功能齐全的wgMLST分析框架可用于以下生物:
鲍曼不动杆菌蜡状芽孢杆菌枯草芽孢杆菌洋葱伯克霍尔德菌复合体布鲁氏菌属弯曲杆菌-空肠弯曲菌柠檬杆菌属艰难梭菌克氏杆菌属。阴沟肠杆菌粪肠球菌粪肠球菌葡萄球菌大肠杆菌/志贺氏菌图拉弗朗西斯菌产气克雷伯菌产酸克雷伯菌肺炎克雷伯菌嗜肺军团菌李斯特菌微球菌属。牛分枝杆菌麻风分枝杆菌结核分枝杆菌淋球菌铜绿假单胞菌肠沙门氏菌粘质沙雷氏菌金黄色葡萄球菌表皮葡萄球菌假中间葡萄球菌化脓性链球菌目前正在开发以下wgMLST分析框架,并将很快提供:
百日咳博德特氏菌肉毒梭菌脓肿分枝杆菌奈瑟菌属嗜麦芽单胞菌弧菌耶尔森氏菌