大数据环境下科研人员对数据的需求有多强烈

2016-03-22 黄金霞 科学网

当大数据时代扑面而来的时候,图书馆是提前应对,还是被扑倒?提到这个问题,估计同行们都心情沉重,或佯装思考,或蹙眉挠头。我也没能力去想象,在苍茫的数据大海上,图书馆这只海燕该如何飞翔。好吧,依然从图书馆最擅长的需求调查入手,探一探科研人员或学者们对数据的需求到底是怎样的。 从3月1日起,我们在中科院内发布“数据服务需求调查问卷”。截至到3月9日,收集问卷269份。 调查结果:

当大数据时代扑面而来的时候,图书馆是提前应对,还是被扑倒?提到这个问题,估计同行们都心情沉重,或佯装思考,或蹙眉挠头。我也没能力去想象,在苍茫的数据大海上,图书馆这只海燕该如何飞翔。好吧,依然从图书馆最擅长的需求调查入手,探一探科研人员或学者们对数据的需求到底是怎样的。


从3月1日起,我们在中科院内发布“数据服务需求调查问卷”。截至到3月9日,收集问卷269份。

调查结果:

1、73.23%的调查者了解有同行利用数据挖掘或分析方法来发表论文;
2、在科学研究中,科研人员用到最多的数据为文献中出现的数据和原始实验数据(包括观测数据);
3、67.66%的调查者对发表数据挖掘和分析相关文章感兴趣;
4、科研人员在利用数据遇到的最大困难,是感觉数据量庞大且缺乏规律,不知道如何整理,需要技术支持,以及缺少高效的数据采集、处理、分析工具;
5、科研人员获取数据最常用的方式,是自己一点一点下载和累积;
6、科研人员最希望文献情报中心提供的数据服务形式,是按照科研人员的需要提供数据整理加工;
7、科研人员最希望的数据服务合作方式,是有关机构面向科研人员提供非赢利性服务;
8、43.87%科研人员对数据成果的保密及期限有要求,希望成果属于委托人,保密期至少1年。

问卷反馈具体情况,如下:

第1题:您知道,有科研人员利用数据挖掘或分析方法来发表论文吗?



第2题:您在科学研究中是否用到如下的数据?



第3题:您是否对基于大量科技数据进行科学研究感兴趣?



第4题:您认为在利用大量数据时,有哪些困难?



填写其他困难的答案包括:数据的准确性;数据可靠性未知;时间精力有限;人为障碍或商业行为,如气象、水文数据,是最可靠的,但是收费奇高,本身是大数据没错吧,单个收费,也成了大数据,极大讽刺;利用大数据出成果慢、少;缺乏想要的试验数据。

第5题:您通常以何种方式获取大量数据?



填写其他方式的答案包括:院文献中心(含分中心);数据库;自己通过实验或者仪器获得;网上搜;代码;测序。

第6题:您希望提供什么形式的数据服务?



其他形式的答案包括:原始数据最好。

第7题:您希望以何种合作方式获得数据服务?



其他方式答案包括:可像订购手机话费的套餐那样,按需选择

第8题:您对数据服务成果的保密及期限是否有要求?



其他答案包括:付费的话成果全部属于委托人,公益的话属于双方;非国家和军事类为什么要保密。

第9题:是否希望为您提供数据服务?

希望提供服务的有233人,占比为87%。

目前,调查问卷时间还没有结束。以上的调查结果,供同行参考。

作者:黄金霞



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (6)
#插入话题
  1. 2017-05-15 qjzhai1623

    提供数据方,数据处理

    0

  2. 2016-04-21 hewenda

    肯定想要更多更有用的数据呀

    0

  3. 2016-04-15 wei834766788

    好好看看

    0

  4. 2016-03-23 milkshark

    这是真的?

    0

相关资讯

Hadoop和大数据:60款**大数据开源工具,包括平台,数据,分析等

说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱。弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hadoop。Market Research的一份报告预测,到2011年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长;到2020年,市场产值会超过10亿美元。IBM更是非常看好开源大数据

DNACloud:一种基于DNA的大数据存储工具

来自欧洲生物信息研究所的Goldman 和他的同事们告诉我们,DNA可以作为存储介质,在1克的DNA上可以储存1PB的信息,DNACloud软件可以更好地支持在这种存储。 我们去哪里存储人们十分关注的海量数据呢?如何在 DNACloud存储每克DNA中1PB字节的信息? 写入有点慢。你需要把你的的数据文件转换成DNA描述,然后发送给任何一家生物科技公司,他们会给你合成DNA,你可以将其存储

癌症大数据公司Flatiron Health融资1.75亿美元,罗氏领投

近期,肿瘤大数据创业公司Flatiron Health宣布获得1.75亿美元的C轮融资。领投的是药企大佬罗氏,Allen & Company、Baillie Gifford和Casdin Capital跟投。不过Flatiron Health拒绝透露他们最新的公司估值。 Flatiron Health从2012年创立初始就备受关注,他们想通过大数据分析为癌症的精准治疗提供帮助。要知道我们

20个更佳大数据可视化工具概览

以下我们选出的大数据可视化的20个最好的工具。文章需要登录才能阅读,不过,如果你下载MedSci医学APP,则可以免登录阅读,APP下载地址:http://www.medsci.cn/m/ 数据可视化之初级篇---零编程工具 1. Tableau Tableau 是一款企业级的大数据可视化工具。Tableau 可以让你轻松创建图形,表格和地图。 它不仅

2016生物医疗大数据论坛暨华理-梅斯联合研究中心成立仪式即将召开,敬请期待

为了推动生物医药大数据的发展,华东理工大学信息学院与上海梅斯医学,在上海大数据产业技术创新联盟,中国计算机学会大数据专委会指导下,成立了"生物医药开放链接大数据联合研究中心"旨在充分发挥双方优势,提供开放的中文基础生物医药数据,关联国内外已有的生物医药开放链接数据,搭建生物医疗大数据研究公共服务平台为行业发展尽绵薄之力。 为此,由华东理工大学信息学院与上海梅斯医学共同举办

想听行业大牛怎么谈“大数据与精准医学“么?小M诚邀您参与2016生物医疗大数据论坛

精准医学是个系统工程,通过全面认识疾病的状态,对整个医疗过程和临床实践进行最优化的诊治,它把各种现代科技手段集成运用于传统医疗,这里面包括组学的技术、数字影像、系统生物学、信息科学、大数据等等,通过现代科学的手段和传统医学的融合创新,最后成就了精准医疗的体系和范式。  近年来,生物医疗行业的海量数据迅速形成,同时,伴随着大数据处理关键技术的突破、数据开放等契机的发展,大数据将在