【佳學基因檢測】基因檢測關鍵問題:肺癌風險是由什么遺傳的?
肺癌風險基因檢測位點的發(fā)現(xiàn)與收集
肺癌首個全基因組關聯(lián)研究 (GWAS) 發(fā)表 14 年后,目前已有約 45 個基因位點與肺癌風險顯著相關?;蚪獯a基因檢測已對其中幾個基因位點進行了功能表征,正在進行對肺癌風險分子理解的全面總結。此外,現(xiàn)在有許多新型計算和實驗工具可用來加速對疾病相關變異的功能評估,超越了逐個基因位點的方法。在《基因檢測關鍵問題:肺癌風險是由什么遺傳的》中,肺癌風險基因檢測首先強調了肺癌 GWAS 結果在組織學亞型、祖先和吸煙狀況之間的異質性,這對后續(xù)研究提出了新穎的解碼解析方向。然后,肺癌風險基因檢測總結了每個風險相關基因位點的已發(fā)表肺癌 GWAS 后研究,以評估當前對初始統(tǒng)計關聯(lián)以外的生物學機制的理解。肺癌風險基因檢測進一步總結了 GWAS 功能后續(xù)研究的策略,考慮了先進功能基因組學工具,并提供了與肺癌相關的可用資源目錄。總的來說,肺癌風險基因檢測旨在強調整合計算和實驗方法的重要性,以便從肺癌 GWAS 結果中得出超越關聯(lián)的生物學見解。
為什么要進行肺癌風險基因檢測?
肺癌是全球第二大常見癌癥,也是癌癥死亡的主要原因,占癌癥死亡總數(shù)的 18% 。利用功能基因組學工具和資源的更新進展,GWAS 后策略正在開始向多基因座方法過渡。肺癌基因檢測位點豐富工作小組肺癌風險基因檢測總結了肺癌 GWAS 結果的顯著異質性,討論了已發(fā)表的肺癌 GWAS 后功能研究,并提供了與肺癌 GWAS 功能表征相關的可用功能基因組學工具和策略。
肺癌 GWAS 結果的異質性
組織學亞型
肺癌有兩種主要組織學亞型——非小細胞肺癌 (NSCLC) 和小細胞肺癌 (SCLC) 。根據(jù) GWAS 目錄(訪問日期:2021 年 7 月 15 日,通過術語“肺癌”搜索,并以全基因組顯著性P ≤ 5 × 10 −8進行過濾。這些結果共同表明,導致 SCLC、LUAD 和 SQC 風險的遺傳因素不同,可能表明潛在的機制不同。
祖先
盡管大部分 GWAS 是在歐洲人群中進行的,但在亞洲人群中也有了重大發(fā)現(xiàn)。根據(jù) GWAS 目錄,相當一部分基因座(46 個中的 25 個)僅在歐洲(17 個基因座)或東亞(8 個基因座)人群中顯著,44%(41 個基因座中的 18 個)的已鑒定基因座在所有三個祖先中均表現(xiàn)出顯著性。祖先特異性位點要在歐洲人中觀察到,可能是由于樣本量不平衡造成的,但也觀察到了 EAS 或 AFR(非洲)特異性信號,包括罕見變異的位點。
值得注意的是,非歐洲/東亞人群(例如非洲人)的肺癌 GWAS 仍然很少見。在 5339 名非裔美國人的 GWAS 中,最初在歐洲和亞洲人群中發(fā)現(xiàn)的兩個已知基因座(15q25.1 和 5p15.33)達到了全基因組顯著性,但沒有發(fā)現(xiàn)新的基因座。值得注意的是,迄今為止,西班牙裔/拉丁裔人群中尚未報告 GWAS。需要在代表性不足的人群中開展更大樣本量的進一步研究,以剖析不同祖先之間的異質性。
吸煙狀況
全球約 25% 的肺癌患者為終生不吸煙者。這些觀察結果表明,從不吸煙者的肺癌在病因和致癌途徑方面呈現(xiàn)出不同的特點。
已開展了多項針對非吸煙者肺癌的 GWAS 研究。肺癌基因解碼基因檢測及其同事對非吸煙亞洲女性(5510 例病例和 4544 例對照)進行了 GWAS 研究,結果證實了主要針對吸煙者的研究中所報告的位點(5p15、3q28 和 17q24.3),并確定了新的位點(10q25.2、6q22.1 和 6p21.32)。
盡管在確定從不吸煙者肺癌相關獨特基因位點方面做出了這些努力,但利用目前的樣本量很難區(qū)分祖先、性別和主要組織學等其他因素與吸煙的影響。
肺癌風險基因位點的 GWA 后研究
除了初始 GWAS 的顯著關聯(lián)外,統(tǒng)計精細定位(識別獨立信號并在具有相似P值的多個變體中優(yōu)先考慮最合理的變體)和功能分析為幾種肺癌相關基因座的生物學意義提供了線索。這些基因座可能與吸煙行為和尼古丁代謝、端粒生物學、免疫反應、DNA 損傷反應和修復、細胞應激反應和細胞周期調節(jié)等途徑有關。值得注意的是,對于許多這些基因座,仍需要建立 GWAS 信號、功能變體和靶基因之間的牢固聯(lián)系,以全面了解生物學機制。
吸煙行為和尼古丁代謝
15q25.1
不管是中國人,還是歐洲人,均沒有跡象表明15q25.1 基因在從不吸煙的人群中與肺癌的發(fā)生有關。
該基因座包括三個煙堿乙酰膽堿受體 (nAChR) 亞基基因 (CHRNA5、CHRNA3 和 CHRNB4),這些基因上或附近的變異也與吸煙狀況和尼古丁成癮 有關。盡管這些變異在歐洲人中處于高 LD,但對非裔美國人的精細定位將關聯(lián)信號細化到 CHRNA5 上或附近的變異,包括錯義變異 rs16969968 (D398N,與 rs55781567 的 R2 = 0.9089;圖 1A) 。在人類胚胎腎(HEK293)細胞中的實驗數(shù)據(jù)表明,與吸煙行為相關的 A 等位基因(398N)在高外部鈣存在的情況下降低 nAChR 對激動劑(如乙酰膽堿和尼古?。┑姆磻@可能導致不同的下游細胞信號傳導(圖 1B)。一項 fMRI 研究表明,在 D398N 替換的個體中,前扣帶皮層與腹側紋狀體回路的連接性降低與吸煙和成癮嚴重程度有關。在小鼠中,D398N 替換將導致 nAChR 功能部分喪失,同時尼古丁攝入量增加。rs16969968 和其他變體是歐洲人群腫瘤鄰近正常肺組織中 CHRNA5 水平的表達數(shù)量性狀位點(eQTL),這在另外兩個肺組織數(shù)據(jù)集中得到了復制。除了單個變異的 GWAS 和 eQTL P 值的簡單重疊之外,使用 GTEx 肺組織的轉錄組全關聯(lián)研究 (TWAS) 正式發(fā)現(xiàn)基于多個局部變異基因型推斷的 CHRNA5 表達水平與肺癌風險之間存在顯著關聯(lián) (圖 1A)。這些 SNP 的肺癌風險相關等位基因與較低的 CHRNA5 水平相關。
圖1:15q25.1 肺癌 GWAS 基因座功能性發(fā)現(xiàn)總結。(A)圍繞基因IREB2、PSMA4、CHRNA5和CHRNA3的總結性發(fā)現(xiàn)。(B ) CHRNA5中 rs16969968 的實驗結果。 (C )通過熒光素酶報告基因檢測確定 rs6495309 對CHRNA3的調控活性。肺癌風險相關等位基因用紅色陰影表示,保護性等位基因用藍色陰影表示。
CHRNA3 eQTL 在 GTEx 肺組織中也很重要,較低水平與風險相關。在對 CHRNA3 rs6495309(在中國人群中報告,與 EUR 中的 rs55781567 相比,LD R2 = 0.0175)的實驗評估中,啟動子區(qū)域的變異被證明會影響 Oct-1 結合親和力,風險等位基因 C 導致肺組織中 CHRNA3 的表達增加(與 TWAS 相反;圖 1C)。此外,CHRNA3 的表觀遺傳沉默 導致肺癌細胞在尼古丁存在下凋亡和 Ca2+ 內流受到抑制。這些發(fā)現(xiàn)表明,15q25.1 上的變異可能通過 nAChR 蛋白功能和這些基因的表達影響肺癌風險。
除了 nAChR 亞基基因外,該區(qū)域中的其他一些基因也在肺癌發(fā)展中獲得了功能支持。增殖和凋亡試驗表明,PSMA4(蛋白酶體 α-4 亞基異構體 1)的敲低顯著降低了肺癌細胞系的生長并增加了其凋亡。一項 TWAS 研究一致表明,正常肺組織中較高水平的 PSMA4 與肺癌風險相關。在同一項研究中,IREB2(鐵反應元件結合蛋白 2)是 15q25.1 上與肺癌最密切相關的基因,較低水平的基因與風險相關。此外,IREB2 的敲低增加了永生化肺成纖維細胞中的 DNA 損傷,表明存在通過 DNA 損傷和修復途徑的潛在機制。另一項研究發(fā)現(xiàn),rs2036534 的風險等位基因 C(EUR 中 rs55781567 的 R2 = 0.1803)與肺癌中 IREB2 表達增加相關(圖 1A)??傊?,這些發(fā)現(xiàn)為該位點背后的 nAChR 基因提供了強有力的支持,并表明除了吸煙行為之外,腫瘤發(fā)生中還存在一種涉及其他基因的更復雜的機制。
端粒生物對肺癌發(fā)生的影響
5p15.33 基因座是眾所周知的多癌基因座,與不同人群的肺癌相關。最強的信號是 rs2736100,在歐洲和東亞人群的吸煙者和從不吸煙者中持續(xù)觀察到。一項功能研究發(fā)現(xiàn),rs2736100 在肺細胞中通過熒光素酶報告基因檢測顯示出潛在的增強子活性,肺癌風險相關的 C 等位基因與正常和肺腫瘤組織中 TERT (端粒酶逆轉錄酶) 的較高表達相關 (圖 2A) 。TERT 編碼端粒酶復合物的催化亞基,一旦重新激活,細胞就能避免衰老,并通過維持端粒長度和染色體完整性促進癌癥發(fā)展 。值得注意的是,rs2736100-C 等位基因與外周白細胞中較長的端粒長度相關(圖 2A)。此外,基因預測的較長端粒長度和白細胞中較長的端粒長度與肺癌風險增加相關。
圖 2:肺癌 GWAS 基因座 5p15.33、6p21 (MHC) 和 6p22.1 的功能性發(fā)現(xiàn)總結。( A ) 圍繞基因TERT和CLPTM1L的總結性發(fā)現(xiàn)。( B ) 對 6p21 處 MHC 區(qū)域的條件精細定位分析。 ( C ) rs17079281 對DCBLD1表達的調節(jié)機制及其功能性后果。肺癌風險相關等位基因以紅色表示,保護性等位基因以藍色表示。
不同人群的 GWAS 和逐步條件分析已在該基因座中發(fā)現(xiàn)了更多的獨立信號(在以領先 SNP 作為回歸分析的協(xié)變量時仍然顯著)。rs36115365 的肺癌保護性 C 等位基因優(yōu)先招募轉錄因子 ZNF148,這會增加肺癌細胞系中的TERT表達,但不會增加CLPTM1L。肺癌細胞系中 ZNF148 的消耗也會降低端粒酶活性并增加端粒長度。值得注意的是,相同的 rs36115365-C 等位基因會增加胰腺癌和睪丸癌的風險,但會降低肺癌和黑色素瘤的風險,盡管TERT的變異功能在不同癌細胞類型中始終存在。
一些精細定位變異的功能注釋也表明 CLPTM1L 參與了該基因座。rs31489 與正常肺組織中的 CLPTM1L 水平顯著相關,風險等位基因 C 與更高的表達相關 (圖 2A)。與此觀察結果一致,據(jù)報道 LUAD 組織中的 CLPTM1L 表達水平高于正常肺組織。功能研究表明,在小鼠模型中,CLPTM1L 是 K-Ras 誘導的肺腫瘤發(fā)生所必需的,而 CLPTM1L 的敲低使肺腫瘤細胞對基因毒性應激誘導的細胞凋亡敏感。這些研究表明,CLPTM1L 的敲低可以作為阻止 KRAS 突變腫瘤生長的潛在治療方法。這些數(shù)據(jù)支持 TERT 是該基因座中最可能的肺癌易感基因,但也支持 CLPTM1L 的參與。鑒于該基因座遺傳信號的復雜性,需要使用高通量方法全面識別多種功能變異及其各自的靶基因。
(責任編輯:佳學基因)