【佳學基因檢測】結直腸癌腫瘤基因檢測的方法與科學流程
結直腸癌(CRC)是全球范圍內最常見的癌癥之一,其發(fā)生和發(fā)展涉及多種遺傳、環(huán)境及生活方式因素。近年來,隨著腫瘤基因組學的進展,基因檢測技術成為早期診斷、預后評估及個性化治療的重要手段。結直腸癌的腫瘤基因檢測通過識別與腫瘤發(fā)生、進展和藥物反應相關的基因突變和變異,提供了對腫瘤生物學的深刻理解。這些檢測方法主要包括基因突變分析、擴增片段長度多態(tài)性(PCR)、下一代測序(NGS)、全基因組關聯(lián)研究(GWAS)等。通過對腫瘤組織和血液樣本的檢測,科研人員能夠發(fā)現(xiàn)與結直腸癌相關的特定基因變異,如APC、KRAS、BRAF等突變,這些信息為疾病的早期診斷、風險評估以及選擇個性化治療方案提供了重要依據。同時,基因檢測還能幫助預測患者對化療、靶向治療等治療方式的反應,有助于提高治療效果和患者的生存質量。因此,腫瘤基因檢測在結直腸癌的臨床應用中具有重要價值,推動了精準醫(yī)學的發(fā)展。
早期結直腸癌隊列的構建
結直腸癌腫瘤基因檢測連續(xù)納入了 2018 年 1 月至 2018 年 12 月在復旦大學附屬中山醫(yī)院接受內鏡黏膜下剝離術治療的 600 例疑似結直腸病變的結直腸癌患者。正如結直腸癌的靶向用藥基因解碼基因檢測的的方法介紹中的描述,在患者選擇上沒有偏倚,且所有患者均未接受過放療或化療等先前治療。118 例早期結直腸癌病例符合納入標準。482 例排除患者中,107 例診斷為非腫瘤(NT)病變,65 例患有間質瘤,110 例患者因無法獲得正常組織樣本而被排除,200 例樣本未通過病理質量檢查(如腫瘤細胞比例 < 80%)。隨后,對 30 例未接受新輔助治療且接受手術切除的晚期結直腸癌病例進行篩查。因此,結直腸癌靶向藥物基因解碼基因檢測共選擇了 148 名結直腸癌患者構建結直腸癌隊列。所有病例均根據美國癌癥聯(lián)合委員會第八版腫瘤-淋巴結-轉移分期系統(tǒng)進行分期。結直腸癌腫瘤靶向用藥基因檢測符合赫爾辛基宣言 II 的倫理標準,并經復旦大學中山醫(yī)院機構審查委員會批準。所有患者在進行任何特定研究調查之前均提供了書面知情同意書。所有患者在進行任何特定研究調查之前均提供了知情同意書。
結直腸癌腫瘤靶向藥物基因檢測的所有樣本均符合以下標準:首先,根據世界衛(wèi)生組織的分類,所有樣本均保存完好,并由兩名以上的胃腸道病理專家進行系統(tǒng)評估,以確認組織病理學診斷和任何變異組織學,他們根據腫瘤含量(> 95%)、腫瘤壞死的存在和程度(< 5%)以及侵入固有肌層的跡象確定可接受的組織片段。其次,應用以下標準:(i)成功提取 DNA 和蛋白質;(ii)正常組織中沒有腫瘤細胞。
根據世界衛(wèi)生組織和日本的病理診斷標準,早期結直腸癌隊列中的所有亞期均納入四個 TNM 分期:T0(正常上皮,n = 166)、T1(T1a/b 癌癥,n = 239)、T2(n = 10)、T3(n = 10)和 T4(n = 10)。T1 被細分為低級別 IEN [LGIN;2_1(n = 37)、2_2(n = 29)、2_3(n = 20)、2_4(n = 22)、2_5(n = 4)和 2_6(n = 1)]、高級別 IEN [HGIN; 3_1 ( n = 20)、3_2 ( n = 21)、3_3 ( n = 20) 和 3_4 ( n = 16)]、LP 期 [4_1 ( n = 2)、4_2 ( n = 18) 和 4_3 ( n = 1)]、MM 期 [5_1 ( n = 1)、5_2 ( n = 11)、5_3 ( n = 1) 和 5_4 ( n = 1)],以及粘膜下浸潤癌期,即 SMIA [6 ( n = 11)] 和 SMIB 期 [7_1 ( n = 1)、7_2 ( n = 1) 和 7_3 ( n = 1)]。所有樣本分為四個階段:NT期、IEN期(包括LGIN和HGIN期)、IFT期(從LP至SMIB期)、以及晚期結直腸癌期(從T2至T4期)。
福爾馬林固定、石蠟包埋標本的采集和處理
所有福爾馬林固定石蠟包埋 (FFPE) 標本均由復旦大學中山醫(yī)院制備和提供。如腫瘤的靶向用藥基因檢測基因檢測所述,對于臨床樣本制備,對 FFPE 塊的載玻片 (10 μm 厚) 進行大體解剖,用二甲苯脫蠟,并用乙醇清洗。將 FFPE 塊切成 3 μm 厚的切片,進行蘇木精和伊紅染色。所有亞期標本均由兩名以上經驗豐富且獲得委員會認證的胃腸道病理學家刮取、評估和確認,并將材料分裝并儲存在 –80°C 下,直至進一步處理。
左側結腸直腸癌和右側結腸直腸癌樣本
根據結直腸癌患者病變部位,將其分為三組:單獨左側結直腸癌組,僅患有左側結直腸癌;單獨右側結直腸癌組,僅患有右側結直腸癌;混合組,即左側和右側結直腸癌均有記載。在主要隊列中,混合組記錄了左側和右側結直腸癌。結直腸癌腫瘤基因檢測有效性僅收集其中一個部位(左側或右側)的病變,收集腫瘤位置相應側的正常組織。在驗證隊列中,混合組同時患有左側和右側結直腸癌,收集腫瘤組織和相應的正常組織。驗證隊列中所有結直腸癌樣本(n = 60)均切成 3 mm 厚的切片,然后在蘇木精和伊紅染色的切片上進行標記。所有正常/腫瘤樣本均從 FFPE 載玻片上分別解剖,并由兩名以上經驗豐富的胃腸病理學家進行評估。
全外顯子組測序
全外顯子組測序(WES)由佳學基因醫(yī)學技術(北京)有限公司完成。如腫瘤基因解碼基因檢測中所述,從FFPE腫瘤組織樣本中采集DNA,從NT組織樣本中獲得匹配的種系DNA。對37例106個樣本進行了WES分析,方法的細節(jié)由佳學基因醫(yī)學技術(北京)有限公司提供。使用Qubit 2.0(Thermo Fisher Scientific)對得到的序列文庫(雙端序列和兩端之間的插入DNA)進行定量,使用Agilent 2100生物分析儀(RRID:SCR_018043)測定插入片段大小。使用堿基調用從原始圖像數據中獲取原始數據(測序讀?。?。
DNA 提取和 DNA 鑒定
對37例結直腸癌病例的106個樣本進行了WES分析,方法學細節(jié)由佳學基因靶向藥物基因檢測提供。所有樣本首先用二甲苯脫蠟,然后在1%瓊脂糖凝膠上監(jiān)測DNA降解和污染。隨后,使用Qubit DNA分析在Qubit 2.0熒光計(Invitrogen)中測量DNA濃度。每個樣本至少使用0.6 μg基因組DNA作為DNA樣本制備的輸入。
文庫制備
方法學細節(jié)由佳學基因醫(yī)學技術(北京)有限公司提供。每個樣本的基因組 DNA 量為 0.6 μg,用于 DNA 樣本制備。按照制造商的建議,使用 Agilent SureSelect Human All Exon 試劑盒(安捷倫科技)生成測序文庫,并為每個樣本添加索引代碼。
使用流體力學剪切系統(tǒng)(Covaris)進行片段化,隨機生成180至280 bp的片段。剩余的突出端通過外切酶/聚合酶活性轉化為平端。在DNA片段的3′端腺苷酸化后,連接接頭寡核苷酸。在PCR中選擇性富集兩端連接有接頭分子的DNA片段。PCR后,用生物素標記的探針將文庫與液相雜交,然后使用含有鏈霉素的磁珠捕獲基因的外顯子。在PCR中富集捕獲的文庫以添加索引標簽以準備測序。使用AMPure XP系統(tǒng)(Beckman Coulter)純化產物,并使用Agilent Bioanalyzer 2100系統(tǒng)上的Agilent高靈敏度DNA分析進行定量。
使用 HiSeq PE 聚類試劑盒(Illumina),按照制造商的說明,在 cBot 聚類生成系統(tǒng)上對索引編碼樣本進行聚類。聚類生成后,在 Illumina HiSeq 平臺上對 DNA 文庫進行測序,并生成 150 bp 的雙端讀取。
數據處理和分析的質量控制
具體實驗與操作方法由佳學基因醫(yī)學技術(北京)有限公司提供。雙端測序(PE150)在 Illumina HiSeq(Illumina NovaSeq 6000)上進行。使用 Qubit 2.0(Thermo Fisher Scientific)對得到的序列文庫(雙端序列和兩端之間的插入片段 DNA)進行定量,使用 Agilent 2100 生物分析儀測定插入片段大小。從 HiSeq 平臺獲取的原始熒光圖像文件通過堿基調用轉換為短讀(原始數據),并將這些短讀記錄為 FASTQ 格式,其中包含序列信息和相應的測序質量信息。使用堿基調用從原始圖像數據中獲取原始數據(測序讀段)。
質量控制:
- (一)如果任一讀取包含適配器污染(與適配器對齊的核苷酸 > 10 個,允許≤10%的錯配),則丟棄配對讀??;
- (二)如果任一讀取中超過 10% 的堿基不確定,則丟棄配對讀??;
- (三)如果任一讀取中低質量(Phred 質量 < 5)堿基的比例超過 50%,則丟棄配對讀取。
所有下游生物信息學分析均以高質量的干凈數據為基礎,保留干凈數據,同時計算并匯總質控統(tǒng)計數據,包括總read數、原始數據、原始深度、測序錯誤率、Q30(Phred-scaled質量得分>30的堿基百分比)reads百分比、QC內容分布等。
讀取映射到參考序列
方法的細節(jié)由佳學基因醫(yī)學技術(北京)有限公司提供。使用 Burrows–Wheeler Aligner(BWA)軟件(RRID:SCR_010910)將有效測序數據比對到參考人類基因組(UCSC hg19),以獲得以 BAM 格式存儲的原始比對結果。如果一個或一對讀取被映射到多個位置,BWA 采用的策略是選擇最可能的位置。如果存在兩個或兩個以上最可能的位置,BWA 會隨機挑選一個,然后使用 SAMtools(RRID:SCR_002105)和 Picard(http://broadinstitute.github.io/picard/,RRID:SCR_006525)對 BAM 文件進行排序,并進行重復標記、局部重新比對和堿基質量重新校準,以生成最終的 BAM 文件,用于計算序列覆蓋率和深度。由于存在錯配(包括真突變和測序錯誤)以及 PCR 擴增導致的重復,映射步驟非常困難。這些重復讀取沒有信息量,不應被視為變異的證據。使用 Picard(RRID:SCR_006525)標記這些重復,以便進行后續(xù)分析。
體細胞突變的檢測和調用
方法學細節(jié)由佳學基因醫(yī)學技術(北京)有限公司提供。使用BWA和Samblaster進行基因組比對,使用MuTect軟件(RRID:SCR_000559)定位體細胞單核苷酸變異位點,使用Strelka檢測體細胞INDEL信息。本文使用的統(tǒng)計數據包括適度t統(tǒng)計量和Fisher精確檢驗。
新突變的獲得
為了探究結直腸癌致癌過程中各個階段的突變情況,首先統(tǒng)計每個階段的突變,然后重點關注新突變的獲得。在結直腸癌基因解碼基因檢測中,新突變意味著只在某個階段發(fā)生,而不是在更早的階段存在。例如,如果AFP在LGIN階段未發(fā)生突變,而在HGIN階段發(fā)生突變,則AFP在HGIN階段即為新突變。某一階段的新突變也可以反映特定突變在結直腸癌進展中的作用。
檢測到的突變對蛋白質和磷蛋白水平的影響
體細胞拷貝數改變及其對蛋白質組的影響
對于體細胞拷貝數變異 (SCNA) 分析,使用了在體細胞突變檢測流程中處理的 WES 衍生 BAM 文件。為了研究SCNA 在 chr20q 增加和 chr17q 丟失時的順式/反式效應,重點研究了在 SCNA 和蛋白質水平上均檢測到的基因,然后計算了斯皮爾曼相關系數 (FDR < 0.05)。
定義癌癥相關基因
癌癥相關基因 (CAG) 是根據 Bailey 及其同事定義并由 Mertins 及其同事列出的基因匯編而成的。CAG 列表請查閱《人體基因序列變與人的疾病表征》數據庫。
蛋白質提取和胰蛋白酶消化
如前文所述,所有標本均采用顯微切割技術進行切割,收集于1.5 mL EP管中,保存于-80℃冰箱中。每片F(xiàn)FPE切片厚度為10 μM,每個亞組標本細胞數不超過10,000個。
將 50 μL Tris(2-羧基乙基)-膦-HCl 緩沖液(2% 脫氧膽酸鈉鹽(Solarbio,目錄號 D8330)、40 mmol/L 2-氯乙酰胺(Aldrich,目錄號 22790-250G-F)、100 mmol/L Tris-膦鹽酸鹽(Amresco,目錄號 0497)、10 mmol/L(2-羧基)-膦鹽酸鹽(Aldrich,目錄號 4706-10G)和 1 mmol/L 苯甲基磺酰氟(Amresco,目錄號 M145-5G)與質譜 (MS) 級水(JT Baker,目錄號 4218-03,pH 8.8)混合,加入裝有制備樣品的 1.5 mL EP 管中,然后在99°C 金屬浴中加熱 30 分鐘。冷卻至室溫后,向每管中加入 3 μg 胰蛋白酶(Promega,目錄號 V528A),并在 37°C 培養(yǎng)箱中消化 18 小時。然后,向每管中加入 13 μL 10% 甲酸 (FA;Sigma,目錄號 F0507),渦旋 3 分鐘,然后離心 5 分鐘(12,000 g)。之后,使用新的 1.5 mL 管和 350 μL 緩沖液[0.1% FA 在 50% 乙腈 (ACN;JT Baker,目錄號 9830-03)] 收集上清液進行提?。u旋 3 分鐘,然后在 12,000 g下離心5 分鐘)。將上清液轉移到新管中并在 60°C 下真空干燥。干燥后用100 μL 0.1% FA溶解多肽,旋渦混合,離心3 min(12 000 g),將上清液收集至新管中脫鹽。脫鹽前需用兩片3M C18 盤片對柱子進行活化,活化液為:90 μL 100% ACN 2次,90 μL 50%和80% ACN 依次活化1次,90 μL 50% ACN 1次。然后將上清液裝入柱子2次,再用90 μL 0.1% FA 凈化2次。最后加入90 μL 洗脫緩沖液(0.1% FA in 50% ACN)洗脫2次,僅收集流出液進行MS分析。將收集液在60°C下真空干燥(約1.5小時)。
使用 LC-MS/MS 分析進行蛋白質組分析
如我們之前的研究(16、17、21)中所述,對于樣品的蛋白質組學分析,使用 Q Exactive HF-X 混合四極桿軌道阱質譜儀(賽默飛世爾科技)結合高效液相色譜系統(tǒng)(EASY-nLC 1200,賽默飛世爾科技)對肽進行分析。將干燥的肽樣品重新溶解在溶劑 A(水中 0.1% FA)中,然后使用溶劑 A 將其裝入 2 cm 自填充捕獲柱(內徑 100 μm,實踐尺寸 3 μm ReproSil-Pur C18-AQ 珠,自制,SunChrom),并在 150 μm 內徑、長度 15 cm 的柱上進行分離(實踐尺寸 1.9 μm ReproSil-Pur C18-AQ 珠,自制,SunChrom),梯度洗脫時間為 150 分鐘(溶劑 A:水中 0.1% FA;溶劑 B:80% ACN 中的 0.1% FA),恒定流速為 600 nL/分鐘(0-150 分鐘,0 分鐘,4% B;0-10 分鐘,4%-15% B;10-125 分鐘, 15%–30% B;125–140分鐘,30%–50% B;140–141分鐘,50%–100% B;141–150分鐘,100% B)。將洗脫的肽在2.0 kV下電離并引入質譜儀)。MS在數據依賴性采集模式下執(zhí)行。對于MS1光譜全掃描,使用Orbitrap質譜分析儀以120,000的高分辨率采集m/z范圍為300至1,400的離子。自動增益控制(AGC)目標值設置為3E6。最大離子注入時間為80 ms。MS2光譜采集在離子阱模式下快速進行。選擇前體離子并以更高能量碰撞解離碎裂,標準化碰撞能量為27%。使用離子阱質譜分析儀分析碎片離子,AGC 目標為 5E4。MS2 的最大離子注入時間為 20 毫秒。觸發(fā) MS/MS 掃描的肽在 12 秒內被動態(tài)排除在進一步的 MS/MS 掃描之外。
對于磷酸化蛋白質組學樣品,使用 Q Exactive HF-X 混合四極桿軌道阱質譜儀(賽默飛世爾科技)結合高效液相色譜系統(tǒng)(EASY-nLC 1200,賽默飛世爾科技)對肽進行分析。將干燥的肽樣品重新溶解在溶劑 A(水中含 0.1% FA)中,使用溶劑 A 將其裝入 2 cm 自填充捕獲柱(內徑 100 μm,實踐尺寸 3 μm ReproSil-Pur C18-AQ 珠,自制,SunChrom),并在 150 μm 內徑、長度 30 cm 的柱上進行分離(實踐尺寸 1.9 μm ReproSil-Pur C18-AQ 珠,自制,SunChrom),在 150 分鐘的梯度(緩沖液 A:水中含 0.1% 甲酸;緩沖液 B:80% ACN 中含 0.1% FA)下以 600 nL/分鐘的恒定流速進行分離(0-150 分鐘,0 分鐘,4% B;0-10 分鐘,4%-15% B;10-125 分鐘, 15%–30% B;125–140 分鐘,30%–50% B;140–141 分鐘,50%–100% B;141–150 分鐘,100% B)。洗脫的磷酸肽被電離并使用 Q Exactive HF-X 混合四極桿軌道阱質譜檢測。質譜采集范圍為 m/z 300 至 1,400,分辨率為 120,000(AUG 目標值為 3E+06,最大注射時間為 80 毫秒)。對于 MS2 掃描,在標準化碰撞能量為 30% 的情況下執(zhí)行更高能量碰撞解離碎片。MS2 AGC 目標設置為 5E4,最大注射時間為 100 毫秒。選擇肽模式進行單同位素前體掃描,并啟用電荷狀態(tài)篩選以拒絕未分配的 1+、7+、8+ 和 >8+ 離子,動態(tài)排除時間為 40 秒,以區(qū)分±10 ppm 之間先前分析的離子。
磷酸肽富集與分析
所有符合要求的分析數據均在 Firmiana 平臺上根據 NCBI 中的人類 RefSeq 蛋白質數據庫(更新于 2013-07-04;RRID:SCR_003496)進行處理。由于樣本量有限,只有來自 36 名結腸直腸癌患者的 101 個樣本適合進行磷酸化蛋白質組分析:NT 期(n = 31)、LGIN 期(n = 23)、HGIN 期(n = 17)、LP 期(n = 6)、MM 期(n = 7)、SMIA 期(n = 6)、SMIB 期(n = 3)、T2 期(n = 3)、T3 期(n = 3)和 T4 期(n = 2;補充表 S1D)。
如腫瘤發(fā)生的基因解碼技術方案中所述,根據制造商的說明,使用 Fe-NTA 磷酸肽富集試劑盒(Thermo Fisher Scientific,目錄號 A32992)制備磷酸化蛋白質組樣品。簡而言之,將 2 mg 肽懸浮在 200 μL 結合/洗滌緩沖液中,并加載到平衡的旋轉柱中。輕輕拍打使樹脂與樣品混合。將混合物孵育 30 分鐘,以 1,000 × g離心 30 秒以棄去流出物。然后用 200 μL 結合/洗滌緩沖液洗滌柱子,以 1,000 × g離心30 秒,共 3 次,再用 200 μL LC-MS 級水洗滌一次。用100 μL洗脫緩沖液洗脫磷酸肽,以1,000 × g離心30秒,重復2次。將磷酸肽干燥后進行LC-MS/MS分析。
整體蛋白質組數據和磷酸化蛋白質組數據的量化
如結直腸癌的致病基因鑒定基因解碼所述,所有 MS 原始文件均在 Firmiana 平臺(一站式蛋白質組學云平臺:http://www.firmiana.org )上進行處理,并在 Mascot 搜索引擎(版本 2.3,Matrix Science Inc.,RRID:SCR_014322)中根據 NCBI 人類 RefSeq 蛋白質數據庫(2013 年 4 月 7 日更新,32,015 個條目)進行搜索。使用胰蛋白酶作為蛋白水解酶,最多允許兩次漏切。脲甲基 (C) 被視為固定修飾。對于蛋白質組分析數據,可變修飾是氧化 (M) 和乙?;ǖ鞍踪| N 端)。對于磷酸化蛋白質組數據,可變修飾是氧化 (M)、乙?;ǖ鞍踪| N 端)和磷酸化 (S/T/Y)。所有已鑒定的肽均在 Firmiana 平臺上定量,峰面積由其 MS1 強度得出。通過 Q-Exactive HFX 收集的母體和產物的質量公差分別為 20 ppm 和 50 mmu。母體離子分電荷限制為 +2、+3 和 +4。肽譜匹配和蛋白質的 FDR 設定為最大 1%。我們的研究采用了無標記蛋白質定量,即所謂的 iBAQ 算法,該算法將蛋白質豐度(由已鑒定肽的強度得出)除以理論上可觀察到的肽的數量。然后,總量的分數(定義為蛋白質的 iBAQ 除以一個樣本中所有已鑒定蛋白質的總 iBAQ)用于表示特定蛋白質在樣本中的標準化豐度。
數據歸納
如結直腸癌的致病基因鑒定基因解碼所述,對于研究中的缺失值,首先應用了運行間匹配算法,該算法已被證明是一種有效的填充缺失值的技術。簡而言之,根據樣品中的常見識別肽建立了一個動態(tài)回歸函數。根據相關值R 2,函數選擇線性或二次函數進行回歸計算相應隱藏肽的保留時間(RT),并根據 m/z 和計算出的 RT 檢查提取離子色譜圖的存在。該函數評估所顯示的提取離子色譜圖的峰面積值。這些峰面積值被視為相應蛋白質的一部分。
層次聚類分析
如結直腸癌的致病基因鑒定基因解碼所述所述,在 R (版本 3.5.1) 中實現(xiàn)了層次聚類分析和主成分分析 (PCA),以評估我們的蛋白質組數據集中關于以下兩個變量的批次效應:批次身份和樣本類型 (亞階段/亞型/面板)。對于層次聚類分析,首先研究了同一亞階段中樣本的成對 Spearman 相關系數。為此,同一類型的樣本表現(xiàn)出較高的相似性,而不同亞型的樣本明顯不同。此外,使用了平均鏈接算法,以一減去 Spearman 相關系數作為相異度度量。
在全局熱圖中,全局蛋白質組表達矩陣中的每個蛋白質表達值都轉換為所有樣本的Z分數。對于樣本和蛋白質聚類,距離設置為“歐幾里得”距離,權重方法為“完整”。使用 R 包 pheatmap(版本 1.0.12,RRID:SCR_016418)對Z分數轉換后的矩陣進行聚類。
差異蛋白質組學分析和通路富集
為了比較結直腸癌進展過程中不同階段的差異表達蛋白(DEP)(圖1),關注每個階段的蛋白質豐度(平均值),這些蛋白質由京都基因和基因組百科全書(KEGG;RRID:SCR_012773)/基因本體(GO;RRID:SCR_002811)數據庫和 ConsensusPathDB(http://cpdb.molgen.mpg.de/,RRID:SCR_002231 )富集。然后,我們注釋了信號通路(調整。FDR < 0.05)并手動檢查通路相關蛋白,然后估計這些蛋白是否與結直腸癌分期顯著相關(Kruskal-Wallis 檢驗,調整。P < 0.05)。
為了分析KRAS和BRAF突變的不同功能(圖2),分別對KRAS突變組與野生型(WT)組、BRAF突變組與WT組進行DEP檢驗(Wilcoxon秩和檢驗,F(xiàn)DR < 0.05,Mut vs. WT比例≥2),然后基于基因集富集分析(GSEA)進行比較分析。
為了在磷蛋白水平分析KRAS和BRAF突變如何在結直腸癌進展中調控不同的功能(圖2 ),我們分別在KRAS突變組與WT組之間、BRAF突變組與WT組之間進行了DEP分析(Wilcoxon秩和檢驗,F(xiàn)DR < 0.05,Mut vs. WT比例≥ 2,Phos vs. Pro≥ 2),并對KRAS突變組和BRAF突變組的磷酸化蛋白質組進行激酶-底物富集分析(KSEA),建立KRAS突變-激酶-底物網絡和BRAF突變-激酶-底物網絡。
為了在磷酸化蛋白水平分析DDX5缺失和TOP1擴增對細胞周期的影響(圖3),對DDX5缺失組與WT組、TOP1擴增組與WT組進行DEP檢驗(Wilcoxon秩和檢驗,F(xiàn)DR < 0.05,Del/Amp vs. WT比例≥2,Phos vs. Pro≥2),然后應用KEGG/GO數據庫進行通路富集,并對DDX5缺失組和TOP1擴增組的磷酸化蛋白質組進行KSEA,建立DDX5缺失-激酶-底物網絡和TOP1擴增-激酶-底物網絡。
為分析KRAS與TP53共突變的功能(圖4),建立4組:KRAS WT和TP53 WT(KRAS WT/ TP53 WT)組、KRAS WT和TP53 Mut(KRAS WT/ TP53 Mut)組、KRAS Mut和TP53 WT(KRAS Mut/ TP53 WT)組、KRAS Mut和TP53 Mut(KRAS Mut/ TP53 Mut)組。利用4組間的DEPs進行通路富集分析(Kruskal–Wallis檢驗,F(xiàn)DR < 0.05),然后應用KEGG/GO數據庫進行通路富集分析。
為了分析左側結直腸癌單獨組和右側結直腸癌單獨組之間的差異(圖5),收集了435個樣本的主要隊列和另一個包含60個樣本的獨立驗證隊列,并在左側結直腸癌單獨組和右側結直腸癌單獨組之間應用DEP(Wilcoxon秩和檢驗,F(xiàn)DR < 0.05,左側結直腸癌與右側結直腸癌的比例≥2或≤0.5)。在混合組中,在正常組織和腫瘤組織之間應用DEP(Wilcoxon秩和檢驗,F(xiàn)DR < 0.05,正常與腫瘤的比例≥2或≤0.5)。為了分析左側結直腸癌/右側結直腸癌與混合組的差異,采用左側結直腸癌/右側結直腸癌與混合組之間的DEP(Wilcoxon秩和檢驗,F(xiàn)DR < 0.05,左側結直腸癌/右側結直腸癌與混合比≥2或≤0.5),然后應用KEGG/GO數據庫進行通路富集。
為了分析基于 CMS 和 CRIS 分類的進展路徑(圖 6),我們評估了結直腸癌進展過程中不同階段的 DEP(Kruskal-Wallis 檢驗,F(xiàn)DR < 0.05),然后通過 KEGG/GO 數據庫和 ConsensusPathDB(http://cpdb.molgen.mpg.de/)進行富集。然后我們注釋了信號通路(FDR < 0.05)并手動檢查了通路相關蛋白,然后估計這些是否與結直腸癌的分期顯著相關(Kruskal-Wallis 檢驗,F(xiàn)DR < 0.05)。
為了分析 MSI 和 MSS 之間的差異(圖 7),我們使用了 MSI 和 MSS 腫瘤之間的 DEP(Wilcoxon 秩和檢驗,F(xiàn)DR < 0.05,MSI 與 MSS 比率 ≥ 2 或 ≤ 0.5),然后應用 GSEA 進行通路富集。
為了分析AOM/DSS導入結直腸癌小鼠模型三組(對照組、第I周期組、第II周期組)的分子特征(圖8 ),采用各組高表達蛋白(Kruskal-Wallis檢驗,F(xiàn)DR < 0.05),然后使用ConsensusPathDB( http://cpdb.molgen.mpg.de/ )進行富集。
構建和驗證預測模型以區(qū)分KRAS Mut/ TP53 Mut 與其他、結直腸癌肝轉移與 WT
使用 R 軟件 v3.5.1,基于 20 種蛋白采用二項 Logistic 回歸分析構建區(qū)分KRAS Mut/ TP53 Mut 與其他、結直腸癌肝轉移與 WT 的預測模型。采用后向逐步法進行特征選擇。將樣本隨機分為訓練集和測試集。此外,使用 ROC 分析(pROC R 包版本 1.16.2 和 caret R 包版本 6.0-86)驗證該模型的診斷價值。使用靈敏度、特異度、準確度和 AUC 確定預測值。在驗證隊列中對預測模型進行驗證。
補體級聯(lián)和細胞外基質信號傳導評分
使用 R 包 GSVA,利用單樣本 GSEA 根據蛋白質組學數據為每個樣本獲得分數。使用 Pearson 相關性確定基質分數與補體級聯(lián)/細胞外基質 (ECM) 信號之間的相關性。使用 R 包 GSVA 中實現(xiàn)的單樣本 GSEA 執(zhí)行推斷的補體級聯(lián)和 ECM 信號分數。
激酶活性預測和磷酸肽分析
使用 MaxQuant(RRID:SCR_014485)在同一數據庫中搜索 101 份結直腸癌樣本的磷酸化蛋白質組數據。如我們之前的研究(16、17)所述,將S 或 T 或 Y 的磷酸化設置為可變修飾,其中允許 3 次錯誤切割,光譜匹配的最低 Andromeda 評分為 40。所有樣品中已鑒定的磷酸化位點的比例用于通過 KSEA 算法估算激酶活性。激酶-底物關系的信息來自公開數據庫,包括 PhosphoSite(RRID:SCR_001837)、Phospho.ELM(RRID:SCR_001109)和 PhosphoPOINT(RRID:SCR_002109)。底物基序的信息來自文獻或使用 Motif(sP)分析 KSEA 數據集獲得。激酶-底物-基序網絡分析參考自 PhosphoSitePlus ( https://www.phosite.org/homeAction , RRID: SCR_001837) 和 NetworKIN 3.0 (RRID: SCR_007818)。使用 R (版本 3.5.1) 中的 Kruskal–Wallis 檢驗進行統(tǒng)計分析。
軌跡推理方法和進展路徑分析
我們利用單片眼鏡(版本 2.10.1)和軌跡推斷方法追蹤 148 名早期結直腸癌患者的譜系。如我們之前的研究(16、17)所述,突出顯示并篩選了平均表達量超過 1.0E−1 的蛋白質。使用 R(版本3.5.1)中 Rtsne(版本 0.15)的 Barnes–Hut 實現(xiàn)對數據集進行聚類并通過 t 分布隨機鄰域嵌入進行預處理。每位早期結直腸癌患者的所有階段都被視為偽時間,以構建基于 CMS 和 CRIS 的亞型分類中結直腸癌患者的軌跡。
單元格
HEK293T 細胞系 (Cat# CRL-11268, RRID: CVCL_QW54)、HCT116 細胞系 (Cat# CCL-247, RRID: CVCL_0291)、SW480 細胞系 (Cat# CCL-228, RRID: CVCL_0546) 和 SW620 細胞系 (Cat# CCL-227, RRID: CVCL_0547) 均購自 ATCC。HEK293T 細胞、HCT116 細胞、SW480 細胞和 SW620 細胞在 DMEM/高葡萄糖培養(yǎng)基 (HyClone) 中培養(yǎng),培養(yǎng)基中添加 10% FBS (BI)、100 U/mL 青霉素和 100 μg/mL 鏈霉素 (Sangon Biotech)。所有細胞均在 37°C 的加濕培養(yǎng)箱中培養(yǎng),培養(yǎng)液中含有 5% CO 2。通過短串聯(lián)重復分析(Cell ID,Promega)確認細胞系的遺傳身份,最后于 2023 年 12 月重復一次。使用Venor GeM Kit(Minerva Biolabs)定期檢測細胞是否感染支原體,所有細胞系的支原體污染檢測結果均為陰性。
IHC 分析
2008 年 6 月至 2018 年 12 月,上海交通大學醫(yī)學院新華醫(yī)院收集了用于組織陣列的人類結直腸癌樣本。所有樣本收集均獲得了機構審查委員會的批準和知情同意(n = 244)。根據一般方案對組織陣列進行 IHC 染色,使用 DDX5 兔抗體(Abcam,目錄號 ab126730,RRID:AB_11130291,稀釋度 1:250)分析 DDX5 的表達。通過染色強度和染色百分比對 IHC 的半定量分析進行評分。
逆轉錄病毒的包裝和感染
為了生成針對人類 DDX5 過度表達的逆轉錄病毒,將目標序列克隆到 pBABE-FLAG-puro 載體中。為了生成針對人類 DDX5 的逆轉錄病毒 shRNA 構建體,將目標序列克隆到 pMKO.1 puro 載體(Addgene,Cat# 8452,RRID:Addgene_8452)中。shRNA 序列如下:
shDDX5:5?-AGG?TGG?AAA?CAT?ACA?GAA?GAA-3?
細胞增殖
將細胞接種于 96 孔板中,密度為每孔 4,000 個細胞(HCT116 細胞、SW480 細胞和 SW620 細胞)。根據制造商的方案,使用 Cell Counting Kit-8(Dojindo)測定細胞數。簡而言之,將培養(yǎng)基替換為 100 μL 新鮮培養(yǎng)基,其中含有 10 μL CCK8。在 37°C 下孵育 3 小時后,將培養(yǎng)板搖動 5 分鐘,并在 450 nm 處讀取光密度值。
小鼠異種移植體外研究
裸鼠(4-6 周齡,雄性,n = 32)來自中國上海 SLAC 實驗室動物有限責任公司。所有小鼠程序均經新華醫(yī)院動物護理和使用委員會批準(XHEC-NSFC-2021-326)。將 pMKO-Control、pMKO-shDDX5、pBABE-Control 和 pBABE-oeDDX5 細胞(1 × 10 6)分別懸浮在 100 mL 1 × PBS 中,然后皮下注射到雙側腋窩脂肪墊中。21 天后,通過脫頸法處死小鼠。解剖腫瘤、成像并稱重。收集腫瘤組織,在 10% 中性緩沖福爾馬林中固定,以備后續(xù)分析。
AOM/DSS誘發(fā)的小鼠結直腸癌模型
小鼠稱重后,第 1 天腹腔注射 AOM(6-8 周齡,10 mg kg −1體重,溶于 PBS),然后從第 2 天開始,以 1.25%–1.5%–1.75% 的濃度逐步增加的方式,進行 3 次 DSS 溶解在飲用水中。在每個 DSS 周期中,小鼠飲用 DSS 水 7 天,然后在下一個周期前停止 14 天。在本研究中,小鼠在第 21 天(周期 I,n = 4)和第 44 天(周期 II,n = 5)處死??v向解剖結腸后計算并拍照。具體而言,周期 I 和周期 II 中的腫瘤代表早期和晚期的樣本。所有小鼠(n = 13)均飼養(yǎng)在無病原體動物設施(新華醫(yī)院動物護理和使用委員會,XHEC-NSFC-2021-326)的通風籠中,可自由飲水和食用標準嚙齒動物飲食。小鼠在受控溫度(22°±2°)和 12 小時明暗循環(huán)下飼養(yǎng)。
免疫沉淀
對于免疫沉淀,用含有 50 mmol/L Tris-HCl(pH 7.5)、150 mmol/L NaCl 和多種蛋白酶抑制劑(苯甲基磺酰氟 1 mmol/L、抑肽酶 1 mg/mL、亮抑酶肽 1 mg/mL、胃酶抑素 1 mg/mL、Na 3 VO 4 1 mmol/L 和 NaF 1 mmol/L(用于乙?;瘜嶒?;另外還有 TSA 2.5 mmol/L 和 NAM 25 mmol/L,最終濃度為)的 1% Nonidet P40 緩沖液裂解細胞。將細胞裂解物與抗 FLAG M2 磁珠(Sigma)在 4°C 下孵育。用 NP40 緩沖液洗滌免疫復合物三次。然后使用指示的一抗檢查裂解物和免疫沉淀物。
使用的網站和下載的蛋白質
在本研究中,為了下載巨噬細胞標志物(圖 4),我們進入了 CellMarker 網站(http://xteam.xbio.top/CellMarker/download.jsp ),并通過篩選出關鍵詞“巨噬細胞”下載了巨噬細胞相關標志物數據庫(n = 285)。為了獲得錨定蛋白,我們進入了人類蛋白質圖譜(HPA; n = 49;https://www.proteinatlas.org ),并通過篩選出關鍵詞“錨定蛋白”下載了錨定蛋白數據庫(n = 49)。
量化和統(tǒng)計分析
所有數據均使用 R 和 GraphPad Prism 9 軟件進行分析和繪圖,并使用 R(版本 3.5.1)進行 Fisher 精確檢驗、Bartlett 檢驗、Kruskal-Wallis 檢驗、Wilcoxon 符號秩檢驗和 Spearman 相關性檢驗。條形圖中的數據以平均值±SEM 表示。所有統(tǒng)計檢驗均為雙尾,當(調整后的)P值 < 0.05 時認為具有統(tǒng)計學意義,使用 Benjamini-Hochberg 程序進行調整。Kaplan-Meier 圖(對數秩檢驗)用于描述總體生存率。隨機選擇結直腸癌患者的組織樣本。為了驗證本研究中的結果,每個實驗至少獨立重復三次。所有實驗均可靠地重現(xiàn)并在圖例、方法和材料以及結果中指明。箱線圖中的數據表示為中位數(中心線)、上四分位數和下四分位數(箱界)和 1.5× IQR(須)。對于樣品處理、PCA 和共識聚類分析,所有研究人員都對結果不知情。
(責任編輯:佳學基因)