




2023年11月6日,生物學(xué)領(lǐng)域國(guó)際著名期刊Nucleic Acids Research(《核酸研究》)在線(xiàn)發(fā)表了西南大學(xué)資源昆蟲(chóng)高效養(yǎng)殖與利用全國(guó)重點(diǎn)實(shí)驗(yàn)室代方銀教授團(tuán)隊(duì)的最新科研成果——家蠶泛基因組和多組學(xué)數(shù)據(jù)分析平臺(tái)(SilkMeta)。這是繼2022年研究團(tuán)隊(duì)發(fā)表家蠶泛基因組論文(Nat. Commun., 2022)之后,在家蠶種質(zhì)資源基因組和生物信息分析領(lǐng)域取得的又一突出進(jìn)展,標(biāo)志著團(tuán)隊(duì)創(chuàng)建“數(shù)字家蠶”的工作邁入新階段,對(duì)于推動(dòng)家蠶泛基因組成果在功能基因組、基因組選擇和分子設(shè)計(jì)育種等方面的研究應(yīng)用具有重要意義。
由于家蠶大規(guī)模種質(zhì)資源泛基因組的完成,家蠶組學(xué)數(shù)據(jù)真正海量式增加,推動(dòng)家蠶重要性狀遺傳基礎(chǔ)解析和分子育種研究步入快速發(fā)展階段。然而,多組學(xué)大數(shù)據(jù)的整合分析和使用具有成本高、技術(shù)難度大的特點(diǎn),這也是橫亙?cè)诖髷?shù)據(jù)和科研工作者之間的一座高墻。為破解這一阻礙,團(tuán)隊(duì)著力開(kāi)辟解析表型到基因型關(guān)系的快速通道,構(gòu)建了家蠶泛基因組和多組學(xué)數(shù)據(jù)庫(kù)——SilkMeta(http://silkmeta.org.cn/)。
SilkMeta整合了家蠶基因組、轉(zhuǎn)錄組、變異組、表型組等多組學(xué)數(shù)據(jù)和功能基因研究數(shù)據(jù),并提供了開(kāi)展比較基因組和功能基因組等方面研究的分析工具。目前數(shù)據(jù)庫(kù)涵蓋了豐富的數(shù)據(jù)內(nèi)容,包括:294種家蠶質(zhì)量性狀基因型特征、546個(gè)基因組、1168個(gè)轉(zhuǎn)錄組、4300多萬(wàn)個(gè)單核苷酸變異(SNPs)、930多萬(wàn)個(gè)小片段插入/缺失(InDels)、340多萬(wàn)個(gè)大片段結(jié)構(gòu)變異(SV)、19411個(gè)種內(nèi)基因簇、7216個(gè)種間基因簇以及家蠶的全長(zhǎng)轉(zhuǎn)錄本、轉(zhuǎn)座子、轉(zhuǎn)錄因子、small RNA(circRNA、miRNA、piRNA)、染色質(zhì)免疫共沉淀測(cè)序(ChIP-seq)數(shù)據(jù)、甲基化測(cè)序數(shù)據(jù)、Hi-C測(cè)序數(shù)據(jù)等,是迄今涵蓋數(shù)據(jù)類(lèi)型最全、數(shù)據(jù)量最大的家蠶組學(xué)數(shù)據(jù)庫(kù)。
為了使SilkMeta中多組學(xué)數(shù)據(jù)的可視化和分析更便捷,研究團(tuán)隊(duì)開(kāi)發(fā)了12個(gè)功能模塊,包括:樣本信息(sample information)、群體結(jié)構(gòu)(population genetics)、基因搜索(gene search)、變異搜索(variation search)、變異可視化(variations viewer)、基因組瀏覽器(genome browser)、基因表達(dá)(expression)、選擇性清掃(selective sweep)、功能基因研究(functional research)、突變圖譜(mutant map)、工具模塊(tools: Blast、引物設(shè)計(jì)、gRNA設(shè)計(jì)、序列提?。┖蛿?shù)據(jù)下載(download)頁(yè)面。
其中,樣本信息模塊提供了家蠶各品系的基本信息(樣品編號(hào)、名稱(chēng)、性別、地理來(lái)源、表型描述等)、地理分布情況和二代、三代測(cè)序信息,基因組注釋信息等;群體結(jié)構(gòu)模塊展示了家蠶各品系的系統(tǒng)發(fā)生關(guān)系和聚類(lèi)情況;基因搜索工具提供了基于101個(gè)基因組的基因搜索和基因的序列、結(jié)構(gòu)、結(jié)構(gòu)域注釋、同源基因(種內(nèi)和種間)、基因分類(lèi)(核心基因、次核心基因、可變基因和私有基因)、關(guān)聯(lián)文獻(xiàn)等信息;變異搜索工具提供了基于基因和基因組位置的兩種搜索模式,用戶(hù)可獲得搜索范圍內(nèi)變異(SNP、InDel、SV)的等位基因頻率(包括在野桑蠶、地方種、實(shí)用種各亞群中的等位基因頻率)、功能注釋等信息;通過(guò)變異可視化模塊,用戶(hù)可以比較一個(gè)基因組區(qū)域內(nèi)的變異在多個(gè)樣本/群體中的分布情況;基因表達(dá)模塊整合了已公布的122個(gè)項(xiàng)目1168個(gè)轉(zhuǎn)錄組數(shù)據(jù),覆蓋家蠶的43個(gè)組織和48個(gè)不同發(fā)育時(shí)期,用戶(hù)可在此模塊中輸入一個(gè)或多個(gè)基因編號(hào),選擇感興趣的組織、發(fā)育時(shí)期或研究項(xiàng)目以查看基因的表達(dá)模式;基因組瀏覽器展示了基因結(jié)構(gòu)信息、變異信息、非編碼RNA、小RNA、ChIP-seq的峰值等;在選擇性清掃模塊中,用戶(hù)可以查看不同群體間的選擇性清掃信號(hào),判斷候選基因或基因組區(qū)域是否存在人工選擇;在突變圖譜模塊,展示了家蠶遺傳連鎖圖譜及相關(guān)研究進(jìn)展;基因功能研究模塊整合了現(xiàn)有的家蠶功能基因研究進(jìn)展文獻(xiàn)……
通過(guò)SilkMeta平臺(tái),用戶(hù)可以全面快速挖掘表型關(guān)聯(lián)基因/變異(特別是大片段結(jié)構(gòu)變異),品系稀有/特有變異,結(jié)合家蠶遺傳連鎖圖譜和物理圖譜,高效精準(zhǔn)鎖定特定性狀的關(guān)聯(lián)位點(diǎn)/基因;可開(kāi)展基因的表達(dá)模式分析、選擇壓力分析、調(diào)控位點(diǎn)分析和功能分析等;可利用變異數(shù)據(jù)延伸開(kāi)展數(shù)量性狀全基因組關(guān)聯(lián)分析(GWAS)和育種芯片設(shè)計(jì)。為顯示平臺(tái)在基因/變異挖掘中的作用,研究團(tuán)隊(duì)復(fù)現(xiàn)了一個(gè)家蠶突變體(Bo)控制基因(變異)和一個(gè)蠶卵孵化率相關(guān)基因(SP1)及其關(guān)聯(lián)變異的挖掘過(guò)程,詳細(xì)分析步驟可在用戶(hù)手冊(cè)(http://silkmeta.org.cn/help/userManualGeneSearch)中查看。
作為一個(gè)綜合性家蠶組學(xué)數(shù)據(jù)庫(kù)和分析平臺(tái),SilkMeta將得到持續(xù)更新,為家蠶及昆蟲(chóng)學(xué)等領(lǐng)域研究者提供豐富的生物信息資源和分析工具,加速家蠶生物學(xué)基礎(chǔ)研究和現(xiàn)代育種。未來(lái),研究團(tuán)隊(duì)將繼續(xù)整合新的組學(xué)數(shù)據(jù)和有關(guān)研究進(jìn)展,不斷充實(shí)和優(yōu)化SilkMeta的數(shù)據(jù)資源和用戶(hù)體驗(yàn)。
西南大學(xué)為該論文的第一署名和通訊單位。資源昆蟲(chóng)高效養(yǎng)殖與利用全國(guó)重點(diǎn)實(shí)驗(yàn)室博士后陸昆鵬為論文第一作者,代方銀教授為論文最后通訊作者。該研究由國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目、現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系項(xiàng)目、重慶市自然科學(xué)基金創(chuàng)新群體項(xiàng)目等提供經(jīng)費(fèi)支持。
