當前位置:學問谷 >

行業範例 >科技 >

科技期刊的常見名詞用法錯誤探析論文

科技期刊的常見名詞用法錯誤探析論文

引言

科技期刊的常見名詞用法錯誤探析論文

生物信息學是近年來發展起來的一門新興學科,科技期刊中有關生物信息學方面的文章越來越多,但科技期刊的很多編輯對生物信息學方面的知識瞭解有限,在尚無規範和標準可參考的情況下,只能原稿來什麼樣就發什麼樣,經常會出現一些關聯名詞描述方面的錯誤,因此,對生物信息學中一些關聯名詞用法進行研究具有重要的意義。目前,在生物信息學編輯方面僅見蔣元霖[1]、劉華[2]、張翠英[3]、張冰[4]等關於科技期刊中基因及蛋白質符號的規範表達,宋亞珍等[5]關於同源性、一致性、相似性概念辨析等研究,有關生物信息學中更多名詞的用法及其準確表述的研究尚未見報道。而科技期刊中有關基因的克隆與表達以及蛋白質的提取、分離、純化和功能等方面研究的文章越來越多,筆者根據對此類文章的編輯實踐以及對部分科技期刊此類文章的閲讀,發現一些既有關聯又有區別的名詞,如基因與蛋白質,核苷酸序列與氨基酸序列,同源性與親緣關係等的使用及其表述不少有誤甚85至存在歧義,為此,本研究對這些高使用頻率關聯名詞的用法錯誤進行了分析,旨在為同人提供參考。

一基因和蛋白質名詞用法錯誤辨析

基因和蛋白質是最常見的兩個名詞,雖然是兩個不同的概念,但又緊密關聯。基因是一段有遺傳效應的脱氧核糖核苷酸序列(DNA),基因的基本結構單位是脱氧核苷酸;DNA要通過RNA的轉錄(mRNA)和翻譯(tRNA)才能產生蛋白質,即基因編碼蛋白質,蛋白質的基本結構單位是氨基酸[6-8]。生物信息學稿件中常見的錯誤有:1.基因與蛋白質混淆例1.本研究通過PCR技術對RcTIR1基因進行了克隆,生物信息學分析顯示其含有富含亮氨酸重複序列的結構域,並通過多序列比對顯示該基因與小立碗蘚的生長素受體蛋白TIR1相似度達76%,初步認為該基因為生長素受體蛋白TIR1。例1中,存在多個錯誤:(1)“其含有富含亮氨酸”中的“其”指基因,而基因是不含有氨基酸的,應將“其”改為蛋白質;(2)“多序列比對顯示該基因”中的“該基因”是不能與蛋白質直接比較的,應將“該基因”改為蛋白質;(3)“相似度76%”指的是氨基酸序列之間的同源性比對,數值結果應描述為一致性,應將“相似度76%”改為“一致性76%”;(4)“初步認為該基因為生長素受體蛋白TIR1”有邏輯錯誤,即“基因”是“蛋白質”。因此,本例應改為:“本研究通過PCR技術對RcTIR1基因進行了克隆,生物信息學分析顯示該基因編碼的蛋白質含有富含亮氨酸重複序列的結構域,並通過多序列比對顯示該基因編碼的蛋白質與小立碗蘚的生長素受體蛋白TIR1一致性達76%,初步認為該基因編碼的蛋白質為生長素受體蛋白TIR1。”2.標題或圖題中基因、蛋白質的描述與研究內容不一致例2.Fesod的生物信息學分析;Fesod生物信息學分析例3.Actin系統進化樹分析;Actin系統進化樹分析例2、例3均為常見的二級標題或圖題,其中每個例子的第一句都是表述基因層面的內容,第二句都是表述蛋白質層面的內容,表面看上去都沒有錯誤,但在文中標題或圖題中基因、蛋白質的表述與研究內容經常不一致。如生物信息學分析中,如果是通過軟件對克隆的基因片段推導的蛋白質的分子量、等電點、信號肽、跨膜區、二級結構等進行預測,標題或圖題應表述為蛋白質的生物信息學分析;如果是對克隆的基因序列及其結構等進行的分析,標題或圖題應表述為基因的生物信息學分析。再如系統進化分析中,如果是基於基因序列(核苷酸序列)構建的系統進化樹,標題或圖題應表述為基因系統進化分析;如果是基於蛋白質序列(氨基酸序列)構建的系統進化樹,標題或圖題應表述為蛋白質系統進化分析。

二基因符號與蛋白質符號用法錯誤辨析

筆者隨機對2015和2016年30多種科技期刊中基因符號的斜體表達情況進行調查,結果還是有10%左右的期刊未用斜體字母表示基因符號,即使用斜體字母表示基因符號的期刊,存在的問題也很多,如對一些基因與蛋白質未能準確區分,導致基因符號和蛋白質符號表達存在諸多問題。生物信息學稿件中常見的錯誤有:1.引物名稱、重組質粒中的基因符號等未用斜體例4.設計了IGFBP-2基因的1對簡併引物IGFBP-2F和IGFBP-2R例5.刺蔘凝集素基因AJL與原核表達載體pET-32a(+)的重組質粒pET-32a(+)-AJL例4中,引物名稱是以基因命名的,基因“IG-FBP-2”應為斜體,即改為“簡併引物IGFBP-2F和IGFBP-2R”;例5中,重組質粒是指將酶切的基因片段和表達載體通過酶連接並轉化至大腸桿菌細胞(或其他細胞)中得到的重組體,因此,本例中基因“AJL”應為斜體,即改為“重組質粒pET-32a(+)-AJL”。2.蛋白質符號未用正體或未大寫例6.用鄰接法構建的基於nm23氨基酸序列的系統進化樹例6中,“nm23”表示的是蛋白質,而字母全為小寫,説明蛋白質符號用法錯誤,可以找作者確定此蛋白質的準確符號,是首字母大寫還是所有字母全大寫,也可以將“nm23氨基酸序列”直接改為“nm23基因推導的氨基酸序列”。目前,基因和蛋白質的命名及符號在不同物種間沒有統一的規則[9],根據《TIG遺傳命名指南》[10]有關細菌、原生動物、酵母、絲狀真菌、植物、無脊椎動物、脊椎動物中一些典型生物模式的命名規則與書寫原則,生物基因符號的組成歸納起來一般有以下幾種:全小寫斜體字母,全大寫斜體字母,斜體的小寫字母+大寫字母(有首字母大寫,有最後一個字母大寫),斜體字母+數字等。但蛋白質符號的定義基本相同,一般用相同的基因符號命名蛋白質,不用斜體,但要大寫(或首字母大寫)。這表明,基因與蛋白質符號的正斜體表達目前已有統一規定,只要作者使用的生物基因和蛋白質符號命名準確,再加以正斜體,即可用字母符號準確表達基因和蛋白質,即使“基因”和“蛋白質”兩詞省略,也能分清描述的是基因還是蛋白質。

三核苷酸序列與氨基酸序列用法錯誤辨析

生物信息學稿件中,經常出現因核苷酸序列與氨基酸序列混淆而發生的表述錯誤。基因序列就是指核苷酸序列,或稱基因核苷酸序列;而蛋白質序列就是指氨基酸序列,或稱蛋白質氨基酸序列。核苷酸序列和氨基酸序列最簡單的區分方法就是,核苷酸序列中僅含A、T、C、G4個字母,而氨基酸序列中還有其他字母。作為編輯,有時雖然不知道稿件作者具體是基於什麼序列進行的分析,但可從一篇文章中對此類問題的.前後描述以及圖表來準確區分和表述這兩種序列。生物信息學稿件中常見的錯誤有:1.基因序列與氨基酸序列混淆例7.茶尺蠖EoL2與其他昆蟲脂肪酶氨基酸序列進化樹分析例8.Pm-MMP-17與其他物種的進化分析(標題);Pm-MMP-17蛋白質聚類分析(圖題)例7中,“EoL2”是指脂肪酶基因,顯然基因序列(核苷酸序列)是不能與“其他昆蟲脂肪酶氨基酸序列”一起構建系統進化樹的,因此,應將“茶尺蠖EoL2”改為“茶尺蠖EoL2氨基酸序列”;例8中前後兩句是同一篇文章的一個二級標題和一個圖題,描述的是同一個內容,顯然前一句描述的是基於基因序列的物種進化分析,而後一句描述的是基於蛋白質序列的物種進化分析,前後不一致,實際上,根據原文內容後一句描述是正確的,因此,可將例8中前一句改為“Pm-MMP-17氨基酸序列與其他物種的進化分析”。2.蛋白質與核苷酸序列、基因與氨基酸序列錯誤搭配例9.劍尾魚Cu/Zn-SOD核苷酸及氨基酸序列相似性與其他已知魚類的比對例10.豬、人、牛、綿羊和小鼠PDGFRα基因氨基酸多重序列比對結果例9中,據原文正體符號Cu/Zn-SOD代表蛋白質,蛋白質不能直接搭配核苷酸序列,應將蛋白質改為基因,即改為“劍尾魚Cu/Zn-SOD核苷酸序列及其推導的氨基酸序列”;例10中,基因不能直接搭配氨基酸序列,應將基因改為蛋白質,即改為“PDGFRα蛋白質氨基酸多重序列”。

四同源性與系統進化分析

結果描述錯誤辨析同源性分析與系統進化分析都是用於判斷同源基因或同源蛋白質而進行的不同層面的分析,同源性分析進行的是基因序列或蛋白質序列的比對,其結果一般用一致性、相似度、同源序列等描述;而系統進化樹的構建是基於同源基因序列或是同源蛋白質序列,其結果一般用是否聚在一個分支和親緣關係遠近等描述。生物信息學稿件中常見的錯誤有:1.同源性分析結果用物種的親緣關係遠近描述例11.EoL2編碼的蛋白與其它昆蟲脂肪酶蛋白序列比較分析的結果表明,EoL2序列與家蠶BmL1序列相似度最高,為57%,親緣關係較近,其次為黑脈金斑蝶Danausplexippus(Linnaeus)DpL1為55%,與棉鈴蟲HaL、家蠶BmL、黑脈金斑蝶DpL2序列一致性均為44%……例11中,有多個錯誤描述:(1)本例中描述的是同源性分析結果,不能用“親緣關係較近”來描述,應將“親緣關係較近”刪除;(2)“BmL1序列相似度最高,為57%”中顯然指相似度為57%,一般情況下,根據序列比對軟件得出的結果中只有“I-dentity”(一致性)值,沒有“Similarity”(相似度)值,因此,序列比對分析中,數值的多少要用一致性描述,序列的相似程度即相似度要用高低來描述,本例中應將“57%”改為“序列一致性為57%”,“為55%”改為“序列一致性為55%”。2.系統進化分析結果用同源性描述例12.將ScMT2-1-4推導的氨基酸序列進行了Blastp同源搜索,選取不同植物的MT2蛋白序列與ScMT2-1-4構建系統進化樹,結果表明,ScMT2-1-4基因編碼蛋白與已報道的甘蔗ScMT2-1-3基因(登錄號:KJ504375)和甘蔗ScMT2-1-2基因(登錄號:AAV50043)編碼蛋白同源性最高,其次是高粱MT2(登錄號:XP0024551970)和玉米MT2-1(登錄號:NP001150795)。例12中,描述的是系統進化分析結果,不能用同源性高低描述,應將“同源性最高”改為“親緣關係最近”。

五結語

科技期刊來稿中,有很多作者對基因、蛋白質、核苷酸、氨基酸、序列等名詞及其組合的表述比較混亂,甚至會出現歧義,編輯應根據文中的實際情況,將這些名詞準確加以區分,正確表述。

  • 文章版權屬於文章作者所有,轉載請註明 https://xuewengu.com/flhy/keji/o65g0j.html