近日,深圳国家基因库(CNGB)加入The TRUST Principles列表。The TRUST Principles由RDA(Research Data Alliance)提出,旨在为维护数字存储库(尤其是科研数据存储库)可信度提供指导。目前,已有World Data System、Springer Nature、Science Data Bank等44家研究机构、出版商和数据存储库加入其中。
深圳国家基因库(CNGB)成功加入The TRUST Principles列表,说明CNGB的科学数据平台——国家基因库生命大数据平台(CNGBdb)符合在较长时间内确保数据的完整性、真实性、准确性、可靠性和可访问性的原则,标志着CNGB的科学数据存储标准及体系建设在国际权威认可方面再上新台阶。
RDA & The TRUST Principles
研究数据联盟(Research Data Alliance,RDA)由美国、欧盟和澳大利亚于2012年联合发起,目前已经与国际科技数据委员会(CODATA)、世界数据系统(WDS)共同成为主要国际科学数据合作组织。其目标是建立沟通的平台与桥梁,降低数据开放共享和重用的壁垒,帮助科研人员跨越技术、学科和国家的界限共享数据,应对各自社会所面临的巨大挑战。
RDA自成立以来一直致力于科学数据基础设施建设,关注数据共享应用中的数据注册、管理及标准化等全球数据热点问题,目前通过其工作组和兴趣组在各学科领域间开展国际合作与研究工作。The TRUST Principles的概念正是在RDA成员之间的讨论中提出的,并在RDA第13次全体会议期间正式启动。随后,相关讨论后续也于2020年2月刊登在施普林格·自然旗下期刊《科学数据》上。The TRUST Principles从存储库的透明度、承担责任、用户导向、可持续性、技术能力提出了相关指导意见:
CNGB & CNGBdb
深圳国家基因库(CNGB)是服务于国家战略的重大科技基础设施之一,对生物遗传资源进行存储、读取和开放共享,并以此为基础搭建起支撑生命科学研究与生物产业创新发展的公益性、开放性、引领性、战略性科技平台,是世界领先的综合性生物遗传资源基因库。
目前,深圳国家基因库已建成千万级样本存储能力、691万亿次/秒计算能力、Pb级数据产出能力,并在此基础上建立了综合性生命科学数据共享平台——国家基因库生命大数据平台(CNGBdb),为全球科研工作者提供生物大数据汇交管理和共享服务。
CNGBdb一直致力于稳定、可靠、持续的科学数据存储库建设,并推动科学数据的安全共享。目前CNGBdb已通过FAIRsharing认证及国际科研数据仓储目录re3data收录,支持Elsevier、Wiley、Taylor & Francis、Oxford、Cell Press、Science等多个国际著名出版社/系列期刊投稿发文,交到CNGBdb的数据统一进行DOI(数字对象标识符)标识。
其中,CNGBdb的存储功能由国家基因库序列归档系统(CNSA)负责。CNSA是一个支撑全球组学研究成果汇交和管理的系统,致力于多组学数据(基因组、转录组、代谢组、单细胞和空间转录组等)的开放和共享,为全球科研人员提供更加安全、稳定、可靠、便捷的数据归档服务,促进多组学数据的再利用,推动全球生命科学的发展。截至目前,CNSA已支持论文发表1135篇,发表期刊337种,包括The Lancet、Science、Cell等。
未来,深圳国家基因库将继续秉持与The TRUST Principles高度契合的科学数据库存储库建设方向和服务主旨,遵循国内外标准进行平台建设,以切实服务用户需求为驱动,为全球科研工作者提供更加稳定高效的服务。
参考文献:
[1] Lin, D., Crabtree, J., Dillo, I. et al. The TRUST Principles for digital repositories. Sci Data 7, 144 (2020).
[2] 姜恩波 李娜. 开放科学环境下的欧盟研究数据开放共享研究 [PDF√] [Abstract√][J]. 世界科技研究与发展, 2020, 42(6):12.
部分信息信息来源于:“科技资源标识”、“CSCD”公众号、http://www.igsnrr.ac.cn/xwzx/kydt/201310/t20131025_3962739.html,如有侵权请联系删除。