單細胞測序技術改變了我們對人體組織的理解,但單一研究通常樣本數量有限,並且在細胞型別定義上存在分歧,將多個單細胞資料集整合可以消除單一研究的侷限性,識別人群水平的變異性,促進對健康和疾病組織間差異的理解。

在最近的《自然·醫學》雜誌上,一個國際研究團隊發表了迄今最大最全面的人類肺細胞圖譜(HLCA),整合了49個人類呼吸系統資料庫的資料,包含486名參與者的超240萬個細胞。研究的通訊作者來自德國亥姆霍茲慕尼黑中心計算生物學研究所和肺健康與免疫研究所[1]。

HLCA根據匹配的標誌基因標註了不同的細胞型別,包含一些罕見的和之前未被發現過的,並且突出了健康人之間的細胞差異。使用HLCA作為疾病研究的參考,研究團隊還確定了多種肺部疾病的共享細胞狀態,例如COVID-19、肺纖維化和肺癌中的SPP1+促纖維化單核細胞衍生巨噬細胞,這為我們理解肺部疾病提供了新的思路,同時有助於確定新的治療靶點。

為了構建HLCA,研究人員首先從14個資料集中收集了單細胞RNA測序資料和詳細的、統一的技術、生物學和人口統計學後設資料,包含107名年齡、性別、種族、BMI和吸菸狀況不同的參與者的166個組織樣本。

他們將樣本的解剖位置投射到一維公共座標框架(CCF)上,代表呼吸系統由近端到遠端,以標準化解剖位置起源,並且構建了五級分層細胞身份參考框架,將每個資料集收集的細胞身份標籤對映到分層參考框架中,統一了細胞型別命名,計算出了每個樣本不同細胞型別的比例。

經過整合,研究人員建立了HLCA的核心,在此基礎上,再將35個額外的包含疾病樣本的資料集對映到HLCA核心,將圖譜包含的細胞總數擴充套件到240萬個。

HLCA概覽

HLCA識別出了6種以前未在人類肺組織中發現或僅在個別研究中發現的細胞,包括遷移樹突狀細胞(312個)、造血幹細胞(60個)、高度增殖性丘狀上皮細胞(4600個)、0型肺泡細胞(1440個)、末端前細支氣管分泌細胞(4393個)和一個平滑肌細胞亞群(335個),這個平滑肌細胞亞群絕大多數存在於氣道中,表達典型的平滑肌細胞標誌物CNN1MYH11以及獨特的標誌物FAM83D

人口統計學和其他因素會影響細胞轉錄表型,例如,性別與淋巴內皮細胞的轉錄組變異相關性最高,BMI與B細胞和T細胞的變異相關性最高,吸菸狀況與先天淋巴細胞/自然殺傷細胞變異相關性最高,這有助於研究人員瞭解性別、BMI和吸菸等風險因素對肺部組織由健康狀態進展到疾病狀態的影響。

在疾病的單細胞研究中,需要足量的匹配對照樣本,才能正確識別疾病特異性變化。此前有研究認為,ACKR1在腫瘤內皮細胞中特異性高表達,與不良預後相關,而基於本研究中多個對映資料集和HLCA的對照,ACKR1在健康組織中表達也很多,尤其是靜脈內皮細胞,這表明ACKR1並非是腫瘤特異性內皮細胞標誌物。因此,HLCA可以為疾病研究提供全面的健康對照,防止將取樣和實驗設計中的侷限性誤解為健康與疾病組織之間的差異。

此外,HLCA還能夠為全基因組關聯研究(GWAS)等大規模的疾病遺傳學研究提供全面可靠的背景參考。

基於先前的GWAS,HLCA細胞型別與四種不同肺部狀態的關聯

由於納入了包含疾病樣本的資料集,HLCA也可以提供對疾病特異性細胞狀態的參考。

以特發性肺纖維化(IPF)為例,基於以前的單一研究,研究人員發現,與健康對照相比,IPF樣本中被標記為肺泡成纖維細胞的細胞一致表現出高不確定性,而基於HLCA和納入的IPF資料集,肺泡成纖維細胞聚類分析表明,IPF患者來源的細胞絕大多數都聚集在一個類群中,特徵為高表達IPF相關基因(CCL2、COL1A1、CTHRC1MMP19),以及纖維化相關標誌物,包括細胞外基質分解抑制因子SERPINE1和慢性缺氧反應基因HIF1A

HLCA包含是多種肺部疾病的資料,此前的研究在IPF、COVID-19和肺癌中均發現了促纖維化的SPP1+單核細胞衍生巨噬細胞(MDM),研究人員利用HLCA復現了這一發現。

他們對HLCA中所有的MDM進行了聚類分析,確定了四種主要的MDM亞型,有不同的基因表達和疾病富集模式,代表了單核細胞到MDM分化和適應疾病微環境的不同階段。

第一種為早期和炎症性MDM(聚類2),高表達CCL2,主要來自COVID-19肺炎患者病程早期的肺泡灌洗液樣本,第二種為表達炎症和吞噬作用相關基因的MDM(聚類4),在COVID-19肺炎和肺癌患者中富集,第三種是分化程度更高的MDM(聚類3),主要來自非疾病樣本,第四種MDM高表達SPP1、LPL 和CHIT1(聚類0),主要來自IPF樣本,同時也在COVID-19病程晚期死亡和COVID-19後發展為肺纖維化,以及肺癌患者樣本中富集。

不同MDM在疾病狀態的數量和標誌基因

SPP1、LPLCHIT1都已經被證明在肺纖維化發展中發揮因果作用,CHIT1更是目前在研的IPF治療靶點。這表明,COVID-19病程晚期和肺癌與IPF“共享”部分MDM纖維化表型,有可能加速發現有效的疾病療法。

總的來說,這項研究作為全球人類細胞圖譜計劃的一部分,建立了目前首個完整的人類肺部單細胞圖譜,以健康肺部細胞為核心,輻射十餘種肺部疾病資料。參與了研究的美國西北大學範伯格醫學院的研究人員表示,HLCA作為第一個主要器官的完整參考圖譜,是實現完整人類細胞圖譜的里程碑,將改變我們對生物學和疾病的理解。

#朋友們,為了不錯過奇點糕推送的重要研究進展,一定記得給我們加星標哈~

參考文獻:

[1] Sikkema L, Ramírez-Suástegui C, Strobl D C, et al. An integrated cell atlas of the lung in health and disease[J]. Nature Medicine, 2023: 1-15.

來自: 奇點網