Plant Phenomics | 南京農(nóng)業(yè)大學(xué)聯(lián)合江蘇省農(nóng)業(yè)科學(xué)院基于成像高光譜技術(shù)和GWAS分析的水稻籽粒蛋白質(zhì)含量表型研究
籽粒蛋白質(zhì)含量(Grain protein content, GPC)是稻米營(yíng)養(yǎng)與食味品質(zhì)的重要決定因素。快速獲取水稻GPC并識(shí)別與其相關(guān)的基因,對(duì)于了解其遺傳基礎(chǔ)和選育現(xiàn)代化優(yōu)質(zhì)水稻品種具有重要意義。高光譜技術(shù)的發(fā)展為縮小表型組學(xué)與基因組學(xué)之間的差距提供了一種新的分析方法。然而受限于數(shù)據(jù)集有限,難以構(gòu)建高精度、適應(yīng)大量品種的GPC估測(cè)模型。生成對(duì)抗網(wǎng)絡(luò)(Generative adversarial networks, GAN)的出現(xiàn)很好地解決了這個(gè)問(wèn)題。GAN已被證實(shí)能夠生成對(duì)人類(lèi)評(píng)估者來(lái)說(shuō)似乎是真實(shí)的模擬數(shù)據(jù)。GAN用于大量水稻品種數(shù)據(jù)增強(qiáng)的可行性目前仍不清楚。同時(shí),大部分研究?jī)H關(guān)注于前期少量品種目標(biāo)性狀的監(jiān)測(cè)預(yù)測(cè),忽視了后期探究目標(biāo)性狀預(yù)測(cè)值在實(shí)際育種中能否發(fā)揮和實(shí)測(cè)值相同的遺傳解析效力。
2024年7月,Plant Phenomics在線發(fā)表了由南京農(nóng)業(yè)大學(xué)國(guó)家信息農(nóng)業(yè)工程技術(shù)中心和江蘇省農(nóng)業(yè)科學(xué)院種質(zhì)資源與生物技術(shù)研究所共同完成的題為Grain Protein Content Phenotyping in Rice via Hyperspectral Imaging Technology and a Genome-Wide Association Study 的研究論文。
本研究基于兩年的大田水稻表型試驗(yàn),獲取了515個(gè)品種的GPC實(shí)測(cè)值以及單核苷酸多態(tài)性(Single nucleotide polymorphism, SNP)位點(diǎn)數(shù)據(jù)。利用N25E高光譜成像儀獲取每個(gè)品種成熟期精米的高光譜影像。水稻GPC表型監(jiān)測(cè)主要包括四個(gè)主要步驟:數(shù)據(jù)獲取、數(shù)據(jù)增強(qiáng)、模型構(gòu)建和關(guān)聯(lián)分析。首先利用原始數(shù)據(jù)集訓(xùn)練深度卷積生成對(duì)抗網(wǎng)絡(luò),并生成大量模擬數(shù)據(jù),從而構(gòu)建具備不同樣本量的訓(xùn)練數(shù)據(jù)集。然后利用連續(xù)小波變換提取敏感特征,為了消除冗余特征,引入相關(guān)性和遞歸特征消除來(lái)確定最優(yōu)特征子集,并構(gòu)建GPC估測(cè)模型。最后對(duì)比GPC實(shí)測(cè)值和估測(cè)值的全基因組關(guān)聯(lián)分析結(jié)果(圖1)。
圖1 水稻GPC估測(cè)及全基因組關(guān)聯(lián)分析流程圖
研究結(jié)果表明不同訓(xùn)練樣本量下的PLSR模型對(duì)GPC的估測(cè)精度。隨著模擬數(shù)據(jù)量的增加,模型的估測(cè)精度呈現(xiàn)先上升再下降的趨勢(shì)。當(dāng)模擬數(shù)據(jù)量為+200時(shí),基于全小波特征(R2=0.50, RRMSE = 7.27%)和優(yōu)選特征(R2 =0.58, RRMSE = 6.70%)的PLSR模型對(duì)于測(cè)試集的估測(cè)精度均達(dá)到最高。從統(tǒng)計(jì)學(xué)角度來(lái)看,基于全小波特征模型的R2增加了22.0%,RRMSE減少了12.8%,同時(shí)基于優(yōu)選特征模型的R2增加了13.7%,RRMSE減少了8.5%。
本研究對(duì)實(shí)測(cè)GPC、基于原始數(shù)據(jù)的GPC估測(cè)值(訓(xùn)練數(shù)據(jù)為276時(shí)基于優(yōu)選小波特征訓(xùn)練的PLSR模型)以及基于模擬數(shù)據(jù)的GPC估測(cè)值(模擬數(shù)據(jù)為200時(shí)基于優(yōu)選小波特征訓(xùn)練的PLSR模型)的GWAS結(jié)果進(jìn)行了對(duì)比分析(注:后文兩種估測(cè)值分別用估測(cè)值1和估測(cè)值2表示)。從圖2可以看出三者都定位到同一位點(diǎn)(SNP12.5076465),并且估測(cè)值2與實(shí)測(cè)GPC和估測(cè)值1均有兩個(gè)lead SNPs重合,分別為SNP12.5076465和SNP7.10830236以及SNP12.5076465和SNP5.10266233。同時(shí)發(fā)現(xiàn)三個(gè)特征中僅有估測(cè)值2定位到的SNP4.17571584的±100kb范圍內(nèi)可檢測(cè)到籽粒儲(chǔ)藏蛋白相關(guān)基因OsmtSSB1L。通過(guò)對(duì)比估測(cè)值和實(shí)測(cè)值檢測(cè)到的位點(diǎn)的異同,可以得出結(jié)論,基于DCGAN的GPC預(yù)測(cè)值具備良好的代替實(shí)測(cè)值進(jìn)行遺傳解析的能力。這項(xiàng)工作證明了生成模型可以作為實(shí)現(xiàn)大量水稻品種GPC高精度估測(cè)的重要研究方法,為基于高光譜技術(shù)的水稻表型性狀高效遺傳研究提供了一種潛在新方法。
圖2 實(shí)測(cè)GPC、基于實(shí)測(cè)數(shù)據(jù)的GPC估測(cè)值、基于生成數(shù)據(jù)的GPC估測(cè)值的曼哈頓圖(a、c、e)和QQ圖(b、d、f)
本研究由南京農(nóng)業(yè)大學(xué)國(guó)家信息農(nóng)業(yè)工程技術(shù)中心和江蘇省農(nóng)業(yè)科學(xué)院種質(zhì)資源與生物技術(shù)研究所共同完成,我校青年教師鄭恒彪副研究員、江蘇省農(nóng)科院唐偉杰助理研究員、研究生楊濤(已畢業(yè))為論文第一作者,姚霞教授和張?jiān)戚x研究員為通訊作者。農(nóng)學(xué)院曹衛(wèi)星教授、朱艷教授、程濤教授參與了研究工作。成果獲得國(guó)家重點(diǎn)研發(fā)項(xiàng)目、國(guó)家自然科學(xué)基金項(xiàng)目和江蘇省生物育種鐘山實(shí)驗(yàn)室等資助。
論文鏈接:
https://doi.org/10.34133/plantphenomics.0200
——推薦閱讀——
A precise framework for rice leaf disease image-text retrieval using FHTW-Net
https://doi.org/10.34133/plantphenomics.0168
Plant Phenomics | 中南林業(yè)科技大學(xué)周?chē)?guó)雄教授團(tuán)隊(duì)基于FHTW-Net的水稻葉片病害圖文檢索精確框架
Establishing a Gross Primary Productivity Model by SIF and PRI on the Rice Canopy
https://doi.org/10.34133/plantphenomics.0144
Plant Phenomics | 南京信息工程大學(xué)等單位利用日光誘導(dǎo)葉綠素?zé)晒夂凸饣瘜W(xué)植被指數(shù)建立了水稻冠層總初級(jí)生產(chǎn)力模型
加入作者交流群
掃碼添加小編微信,拉您進(jìn)入《植物表型組學(xué)》作者交流群,群內(nèi)不定期開(kāi)展作者分享會(huì)、專(zhuān)刊發(fā)布會(huì)等高質(zhì)量活動(dòng)。
添加小編微信,備注姓名+單位+PP,加入作者交流群
About Plant Phenomics
《植物表型組學(xué)》(Plant Phenomics)是由南京農(nóng)業(yè)大學(xué)和美國(guó)科學(xué)促進(jìn)會(huì)(AAAS)合作創(chuàng)辦的英文學(xué)術(shù)期刊,于2019年1月正式上線發(fā)行。采用開(kāi)放獲取形式,刊載植物表型組學(xué)交叉學(xué)科熱點(diǎn)領(lǐng)域具有突破性科研進(jìn)展的原創(chuàng)性研究論文、綜述、數(shù)據(jù)集和觀點(diǎn)。具體范圍涵蓋高通量表型分析的最新技術(shù),基于圖像分析和機(jī)器學(xué)習(xí)的表型分析研究,提取表型信息的新算法,作物栽培、植物育種和農(nóng)業(yè)實(shí)踐中的表型組學(xué)新應(yīng)用,與植物表型相結(jié)合的分子生物學(xué)、植物生理學(xué)、統(tǒng)計(jì)學(xué)、作物模型和其他組學(xué)研究,表型組學(xué)相關(guān)的植物生物學(xué)等。期刊已被DOAJ、Scopus、PMC、EI和SCIE等數(shù)據(jù)庫(kù)收錄?祁Nò睯CR2022影響因子為7.6,位于農(nóng)藝學(xué)、植物科學(xué)、遙感一區(qū)。2023年中科院期刊分區(qū)位于農(nóng)林科學(xué)大類(lèi)一區(qū)。2020年入選中國(guó)科技期刊卓越行動(dòng)計(jì)劃高起點(diǎn)新刊項(xiàng)目、2024年入選江蘇科技期刊卓越行動(dòng)計(jì)劃領(lǐng)軍期刊項(xiàng)目。
說(shuō)明:本文由《植物表型組學(xué)》編輯部負(fù)責(zé)組稿。
中文內(nèi)容僅供參考,一切內(nèi)容以英文原版為準(zhǔn)。
排版:蘇梓鈺(南京農(nóng)業(yè)大學(xué))
審核:孔敏、王平