企研数据

2018 年度项目成果总结会议暨经济数据应用研讨会顺利召开

为促进经济大数据与学术研究、智库建设相融合,共同探讨大数据时代中国经济、金融、管理等学科实证研究跨越式发展的美好前景。1月31日上午,杭州古德科技有限公司(企研数据)全体成员携手诸多学界好友、同仁在浙江省互联网产业大厦会议室举办了“企研数据·年度项目成果总结会议暨经济数据应用研讨会”。

杭州古德科技有限公司CEO杨奇明博士、浙江大学公共管理学院阮建青教授、浙江科技学院经济管理学院叶俊焘教授、浙江理工大学经济管理学院刘西川副教授、浙江理工大学经济管理学院高峰博士、浙江理工大学经济管理学院张燕副教授、浙江工商大学经济学院王学渊副教授、浙江工商大学经济学院张志坚博士、南京审计大学城市发展研究院助理教授武岩博士、中山大学博士研究生邹伟出席本次会议。

本次会议聚焦于「企研数据」团队已取得的项目成果与研发经验,从数据资源、数据分析云端平台、数据ETL成果与进展三个方面展开分享与讨论,旨在以大数据为纽带,搭建业界与学界、高端智库之间对话的窗口。

 

 

会议伊始,杭州古德科技有限公司CEO杨奇明博士代表公司全体成员发表了新年致辞并向受邀与会的专家、学者致以由衷谢意。他表示,中国众多的大数据资源既是学术界尚未挖掘的宝藏,也是许多学者当前面临的桎梏。他认为,数据不应该成为中国学者开展学术研究和智库建设的壁垒,一个第三方的、专业为科研机构和智库提供数据资源和分析平台建设服务的团队将帮助消除这样的壁垒。

当前经济行政大数据的应用在全世界方兴未艾,中国作为全球第二大经济体和最重要的经济增长引擎,全世界学术界都高度关注中国经济行政大数据的学术开发。杨奇明博士特别指出,「企研数据」的服务对象应该是中国高校科研机构和高端智库及相关领域的研究者,在当前极端复杂的国际环境下,我们和我们的客户不仅要充分认识到中国经济行政大数据资源的加速开发对于中国学术发展和智库建设的重大意义,更应该以主人翁的精神爱护、珍惜这些数据资源,使其不仅有利于中国相关领域学术研究的发展,更有利于中国经济的安全和持续健康发展!

 

在各个专题讨论环节:

首先,研发部主管施丹燕详细介绍了“企研”团队2018年已经或即将整理与研发的海量数据资源,并对本公司的服务模式和分析平台进行了简要概括。她生动详细地对企业股权投资信息表、变更信息表、年报信息表、负面风险信息表以及专利信息数据库、商标信息数据库和2017海关数据库进行了展示,并就此引出「企研数据」搭建的“企研数据沙箱”分析平台及个性化、专业化技术服务。海量的数据资源和全新的服务模式引起了在场嘉宾的热烈讨论。

研发部研究员沈梦露则从专题库简介、数据来源、字段展示和统计概况四个角度分别对“家庭农场”和“农民专业合作社”专题数据库向与会嘉宾进行了展示与介绍。相关与会专家表示,农业专题数据库的采集与研发将为学界相关领域提供新的宝贵数据资源,期待「企研数据」继续深入开发更多、更规整的专题数据库。

随后,研发部研究员何年华进行了“用大数据思维完善「工业企业数据库」匹配”的主题汇报。「企研数据」团队试图采用工商企业行政大数据与工业企业进行识别,建立合并数据集,其合并结果中通过法人或县码检验的匹配率从1998年的62%左右变化至2013年的98%以上。并基于上述横向合并样本最终完善了约36万条纵向误匹结果(超过全样本的8%),显著提高了工业企业数据库纵向匹配质量。未来「企研数据」将利用横向匹配的结果,进一步帮助工业企业数据库扩展变量信息,并且更好地与其他企业微观数据库进行融合。

信息部主管黄胜蓝则以“学术生产范式转换:从本地到云端”为题,阐述了集安全性、便捷性、协同性于一体的学术生产云端框架,即“企研数据沙箱”平台1.0版。该平台将为解决大数据存储与处理、保护学者数据隐私、加强高校学术团队建设提供了新的思路与可用工具。一些与会专家表现出了浓厚兴趣,表示希望为其学术团队搭建一个自由的学术生产环境。

技术部主管刘颖波则以“企业注册地识别”、“企业名称拉链表”等项目为例对海量数据的匹配、清洗与储存过程进行了阐释,并预报了2019年「企研数据」团队将推出“企研数据实验室”Python数据处理框架和相关的培训服务,该框架将为经济管理类学者解决大数据抓取、清理和存储等难题提供一套完整的解决方案。

讨论过程中,与会嘉宾、学者多次就数据资源的字段完整性、大数据处理方法、企研数据沙箱可能应用场景等问题展开了热烈讨论,并提出规整数据库、规范数据处理流程等方面的宝贵建议,对「企研数据」团队的年度项目成果表示了充分肯定。

过去的一年中,「企研数据」团队初露峥嵘,在业务开拓、数据资源和分析平台研发方面进展顺利。来年,「企研数据」将继续以为中国科研机构和智库提供安全、清洁、高能的服务为发心,以信守承诺、尊重知识产权为原则,继续专注于从科研和智库建设的角度收集和清理宏微观经济社会数据,为广大学者提供高质量的科研大数据挖掘服务,助力中国相关领域的学术研究和智库建设。