“目前我国农林渔数据资源总量超过2.3亿条,农林渔主题词库累计6.8万条,农林渔术语词库累计10万条。”近日举行的“2019大数据智能与知识服务高端论坛——知领系列论坛”上,中国林业科学研究院林业科技信息研究所研究员王忠明告诉《中国科学报》,随着“互联网+”、大数据智能时代的到来,用数据创新、用数据决策已成为科研创新和管理决策的新常态、新范式。“互联网+”代表着现代农林发展的新方向、新趋势,也为转变农林发展方式提供了新路径、新方法。
如何用好我国农林渔大数据成为当前亟须深入研究的重要问题。
大数据+人工智能:
更有价值的知识服务
论坛主办方中国工程科技知识中心(以下简称知识中心)由中国工程院负责实施,是经国家批准建设的首个国家工程科技领域公益性、开放式的资源集成和知识服务平台。王忠明介绍,目前,知识中心已建成由总中心、34个分中心组成的体系架构,积极开展工程科技领域知识资源集成和知识服务平台建设。农业、林业、渔业分中心是知识中心的重要组成部分。
“农林渔专业知识服务系统旨在全面整合国内外农林渔领域丰富的科学数据和信息资源,开展知识资源组织和数据挖掘分析,为国家工程科技思想库战略咨询、农林渔科技创新以及科技管理决策提供知识支撑。”王忠明介绍,目前,农林渔专业知识服务系统提供农林渔领域的科技文献、科学数据、统计数据、专家、机构、科研项目、成果、专利、标准、行业报告等10大类数据资源,资源总量超过2.3亿条。
知识中心重点打造了农林渔领域精品特色资源数据集120个,包括农业草地数据、作物科学数据、中国森林资源清查数据、荒漠化和沙化调查数据、渔业灾害数据、渔业质量安全数据等;优化知识组织体系,构建了农林渔领域基础词典系统,农林渔主题词库累计6.8万条,农林渔术语词库累计10万条;开发了农林渔业知识的深度搜索、学科导航、知识链接、大数据分析、知识图谱和可视化分析等服务功能。
据介绍,知识中心面向行业领域院士及其团队、专家、重大项目等提供定向的深度知识服务,如国内外最新科技动态、精品文献、产业报告、专利、科学数据等信息的动态跟踪。“目前农林渔分中心已为23位院士、14个重大咨询项目、295位领域专家推送高质量信息,在决策咨询和重大工程科技项目数据支撑中发挥了重要作用。”王忠明说。
王忠明强调,在大数据和人工智能技术的驱动下,知识服务将更加注重与用户潜在需求之间的智能响应,将以更智慧的方式进行知识传播和决策服务。特别是人工智能的深度学习能力,有望在知识服务领域引发巨大变革,构建起全新生态,创造出更有价值的知识服务。
森林资源大数据:从监测到实践
林业大数据是林业产业、生态资源监管、科研实验、生态修复和公众健康等多种数据的集合。“它具有海量化、多样化、价值化、快速化、空间特征明显等特征。”中国工程院院士、中国林业科学研究院研究员张守攻如是说。
“我国在资源环境监测方面做了大量的研究和应用示范工作。”张守攻说,这主要体现在应用卫星遥感技术进行森林资源调查、碳循环研究、湿地资源动态变化监测、水土流失和荒漠化遥感监测与评价、基于遥感的重大工程生态效应评价等方面。
目前,大数据已经在我国森林资源管理中得到了应用。例如,以空天一体化对地观测数据为基础,通过数据整合和数据挖掘技术,将林业基础数据落实到山头地块,实现对林业资源基本情况全面了解,协助管理者“摸清家底”。
在林业资源领域,高分遥感技术用途广泛。我国已建立森林资源遥感监测多阶抽样技术体系;规范了遥感技术应用的技术流程与标准;创建了遥感技术与传统地面调查相结合的天—空—地一体化、点—线—面多尺度的综合监测技术体系等。目前,我国约70%的林业卫星遥感分析数据来源于我国自己发射的卫星。
在智能林业物联网应用方面,基于下一代互联网、智能传感、宽带无线、卫星导航等构建先进技术和产品,构造天网、地网、人网和林网一体化感知体系,对接智慧林业平台,形成国际领先、性价比高、具有重大实用价值的“感知生态 智慧森林”四网一平台大系统。
此外,林业管理部门利用北斗应用进行林业资源清查、林地管理与巡查等,大大降低了管理成本,提升了工作效率。特别是在国家森林资源普查中,北斗卫星导航技术结合遥感等技术发挥了重要作用。
不过,张守攻仍然强调,目前森林资源监测全局工作缺乏有效的规划,导致部分重复建设;各部门、各行业都在做监测,但数据共享困难,信息孤岛现象严重,不能连接起来发挥综合效应;缺乏科学、统一的森林资源监测体系,不同部门组织制定的检测标准之间不协调;缺乏完善的考核体系,目标也不够明确,导致监测效率低,数据不够可靠。
张守攻希望,在开放共享的基础上,推进森林资源数据整合;利用现代信息技术,制定森林资源一体化监测技术方案;推进我国森林资源监测研究与全球森林资源监测研究体系的融合。
“从森林资源监测数据到大数据分析,再到指导林业实践,整个过程应实现实时、快速、无缝衔接,最终实现山、水、林、田、湖、草等海量数据的实时采集、传输、融合、分析、知识发现并能指导林业科学研究与生产实践。”张守攻说。
渔业大数据:推动深度应用
目前,我国渔业专业知识数据资源中,有结构化数据约100G,非结构化数据约100T。中国水产科学研究院渔业机械仪器研究所研究员陈军介绍,渔业数据包括渔业资源环境、渔业质量安全、渔业统计数据等。
在渔业资源数据平台中,有一部分被称为稀有资源,即高清图片、水产品电商价格数据等。目前天猫、淘宝、京东等大型平台电商已新建水产品日度价格数据。
同时,我国渔政管理智慧系统已积累结构化数据约1.2T,每年数据总量增长约5%。“智慧渔技”水产养殖数据资源的结构化数据约有100G,每年数据增长30%;非结构化数据约有12T,每年数据增长约20%。
我国渔业大数据主要用于渔业物种资源分布评估、渔情及渔场预测预报、渔船动态监测与轨迹预测、水产养殖监测与评价、渔业经济、情报与知识服务等。
最典型的应用是渔船船位管理。“100余万艘渔船、30多万艘海洋渔船,茫茫大海中到底怎么管?”陈军说,目前的主要手段有三个:基于北斗/GPS来管,该系统已基本普及,北斗有通信功能,GPS需要有通信系统支撑;基于AIS来管,该系统开始在大型渔船上普及,本身具备信息传输能力;基于遥感来管,主要还是用于宏观信息获取。
又如,在渔场渔情分析及预报中,我国已开发出北太平洋鱿鱼场信息应用服务系统,成功地在小型渔船上建立了船基遥感接收系统,实现了大数据量传输、海况产品自动制作,研建了我国远洋渔业综合数据库管理系统,实现了范例推理的北太平洋鱿鱼渔场渔情分析预报,准确性超过60%。
而通过“智慧渔技”水产养殖管理平台可以实现疾病实时监控、技术成果热力分析、水产品国际竞争力分析等。
陈军指出,下一步,将以数据为核心,以大数据分析和挖掘为主线,着力推动渔业大数据中心建设和深度应用,如进一步完善渔业科学数据交汇与共享制度,加强动态实时监测与通信技术研究,深化大数据技术在渔业生态环境与资源保护中的应用,加快推进人工智能、数据挖掘等新技术的渔业应用,拓展大数据技术在渔业管理中的应用。