云南软件开发 单细胞数据的双刃剑! Cell | 东谈主类scRNA-seq 数据集存在隐痛显露风险, 应加强保护
转自:生物谷云南软件开发
获取公开的东谈主类单细胞基因抒发数据集(scRNA-seq数据集)极地面促进了科学家们对复杂生物系统和多样疾病病因的了解。然则,可看望性的提升也引起了东谈主们对捐赠细胞的个东谈主隐痛以及他们的私东谈主健康信息在未经高兴的情况下被分享的可能性的更大蔼然。
往日相关这些隐痛显露的商讨主要引诱在批量基因抒发——测量来自组织或样本的多半细胞而非单个细胞的基因平均抒发水平的数据分享上。鉴于单细胞数据集可能包含多半变异或“杂音”,科学家们并不合计这些数据集存在信息显露的高风险。
如今,在一项新的商讨中,来自纽约基因组中心、哥伦比亚大学和布朗大学的商讨东谈主员对这一假定冷落了挑战。他们指出单细胞基因抒发数据引诱的个体很容易受到“衔接袭击(linkingattack)”。在这类衔接袭击中,黑客不错发现商讨参与者的私东谈主遗传特征和生理特征信息。
相关商讨效用于2024年10月2日在线发表在Cell期刊上,论文标题为“Privateinformationleakagefromsingle-cellcountmatrices”。
论文通信作家、纽约基因组中心中枢成员、哥伦比亚大学生物医学信息学助理种植GamzeGürsoy博士说:“最近发布的群体范畴单细胞数据集让咱们得以接近隐痛显露这一主题,并惩处黑客是否不错哄骗公开可用的信息通过单细胞数据的杂音来深切了解患者的基因构成、表型特征和疾病的问题。”
Gürsoy博士终点团队领先从一项红斑狼疮商讨和OneK1K队伍中积聚数据,通过与公开的批量抒发定量性状位点(eQTL)进行比拟,将个东谈主与其遗传和表型数据关联起来。
app他们随后阐发,使用细胞类型特异性eQTL不错更准确地进行这种关联。终末,他们标明,在无法赢得eQTL数据的情况下,哄骗来自较少个体的遗传和单细胞数据来熟悉展望模子,将个体与其遗传和表型特征经营起来仍然是可行的。
论文第一作家、Gürsoy试验室前博士后ConorWalker补充说:“咱们齐知谈基因抒发状况受基因突变的影响,而基因突变的组合对每个个体来说齐是惟一无二的。咱们的商讨标明,通过使用一个队伍中的基因变异和单细胞RNA-Seq数据,软件开发公司咱们不错详情其他商讨中不错展望的位点,而这全齐依赖于这些商讨中的单细胞抒发数据。这种措施不错检索到不相关商讨中参与者从未高兴分享的遗传信息。”
图片来自Cell, 2024, doi:10.1016/j.cell.2024.09.012
1. 德岛漩涡位于日本德岛县鸣门市,成立于1955年,历史上获得1次日职乙冠军(2020赛季)。
由于数据不需要来自归并群体或东谈主群,因此健康数据集不错用来展望患病数据集的信息。健康东谈主和患病个体的基因抒发有满盈多的内在共性,即使在单个细胞中,疾病也不会对基因抒发信号产生很大影响。
Gürsoy博士补充说:“哄骗不同试验室生成的数据,以致用不同措施处理的数据,然后用它来将全齐不同的匿名数据引诱的个体关联起来,这种才调终点惊东谈主,况兼突显了单细胞数据的实在隐痛问题。咱们但愿这项商讨能匡助定量详情数据发布前的风险,并影响畴昔商讨的绸缪,以确保提升患者的隐痛保护。”
作家但愿这一发现将有助于制定明确而详备的高兴计谋,强调单细胞数据捐赠者的隐痛风险,并制定法律和立法,精良袭击者哄骗这些信息形成伤害。
参考良友:
ConorR.Walkeretal.Privateinformationleakagefromsingle-cellcountmatrices.Cell,2024,doi:10.1016/j.cell.2024.09.012.
(转自:生物谷)云南软件开发