浙江大学博导巫英才:AI 与人类互补,实现智能数据可视化


随着 AI 技术的不断发展,机器人会在各个方面超越人类吗?浙江大学博导、国家青年千人计划专家巫英才认为,在大数据领域,机器在计算能力上拥有优势,但人类的经验和创造能弥补机器智能的不足。特别是解决超出常理的复杂问题时,结合人类智能(直觉、创造力、经验、隐性知识挖掘)与机器智能(计算、搜索、关联、显性知识挖掘),将更为高效,更有发展前景。

巫英才以一款名为 Foldit 游戏为例,这是一种用于蛋白质结构分析的游戏,玩家在 3D 画面下任意扭曲蛋白质构造,制作蛋白质的理想模型。根据相关报道,仅用了三周时间,就解决了一个困扰科学家好几年的难题,玩家在玩游戏的过程中发现了一种蛋白质的结构,这种蛋白质在艾滋病毒生长过程中起到了至关重要的作用。

“由于缺乏空间推理的能力,计算机花很长时间也难以完成这样的蛋白质模型。这个游戏在一定程度上证明,人类智能和机器智能可以互补,人机智能协同分析会在很多领域产生更好的效果。比如在数据分析过程之中,融合人类智慧与机器的智能,一方面充分发挥机器的深度挖掘和关联计算的能力,另一方面发挥人的探索、导向、顿悟和推理能力。”

因此,巫英才所在的浙江大学团队选择了智能可视分析的研究方向,面向大而复杂的数据,利用高带宽的视觉感知通道和交互可视化,将智能算法与人的智慧结合,完成理解、推理和决策等任务。

数据可视化的力量:曾抑制霍乱疫情

巫英才表示,可视化是研究数据的视觉表达,输出是数据,输出是各种视觉形式。借助可视化,将数据以形象直观的方式展现,让用户以视觉理解的方式获取数据所蕴含的信息。

在历史上,数据可视化经常发挥出重要的力量。比如知名的伦敦霍乱地图。1854 年伦敦爆发严重霍乱,当时流行的观点是霍乱是通过空气传播。而英国医师 John Snow 把本次霍乱暴发调查中的死亡病例标点在地图上,发现病人集中在百老汇大道的公共水井附近,从而推测霍乱是通过受污染的饮用水来传播的,最终该区域的疫情被有效地控制住。

伦敦霍乱地图_数据可视化_数据分析_大数据

伦敦霍乱地图

目前,浙江大学团队在智能可视分析的研究理论、方法和技术、工具等方面有了一定的成果。巫英才介绍,其应用方向包括商务智能、城市计算、科学计算、计算体育等多个方面,对海量大数据进行更深入的分析和理解。

比如针对海量图片的分析,由于图片缺乏语义信息,传统的可视化方面仅仅考虑图片的视觉特征,难以有效的搜索、分析和理解海量的图片集。

浙江大学团队提出了基于语义的海量图片集可视化方法,与深度学习相结合,使用 CNN 深度学习方法提取图片的语义信息,把图片转换成一系列文本,以新的 co-embedding 方法,把图片和关键词共同投影到二维可视化空间,对图片进行分析和理解。

体育战术靠数据可视化

智能可视分析在计算体育上有广泛的应用空间。以乒乓球比赛为例,虽然有详细的比赛数据,但如何从具有时空性和相邻拍强关联性的数据中获得洞见仍待研究。

浙江大学团队的核心思路,是通过紧密地与专家合作交流,厘清重要技术概念和特征,从时序比分变化、技术属性关联,战术使用效果三个角度对比赛数据进行分析。

“从视频中分析每个选手击球的位置和落点,帮助专家更好地分析关联和模式。具体方法是从技术属性的关联模式切入,设计新颖的矩阵列全面简明地展示不同序号拍内和拍间的关联模式,设计直观的图表连接抽象的数据和乒乓球物理场景。”

又例如在足球领域,数据可视化的两大挑战是足球视频数据的高效采集处理,以及足球阵型演化的直观可视呈现。

而浙江大学团队在数据采集与处理的架构上,从原始数据中追踪球员的位置,利用深度学习技术自动检测阵型,以可视化的方式把阵型的变化呈现出来,为足球训练提供决策支持。

智能可视分析在城市计算上的应用

快速发展的城市化,带来了错综复杂的城市物理空间,这使得规划和选址问题成为构建高效城市的挑战。

“如何更好的规划救护车站、充电站、商业设施的位置?传统的规划和选址方式是以人工采集数据,数据规模小,数据来源有限且更新缓慢,且以个体经验为主。而利用城市大数据,能对城市复杂空间进行高效和精准的分析并做出最优化的决策。”

浙江团队的研究内容包括基于海量机构城市数据的选址计算模型,易于使用、性能高效的多层次时空可视化,以及结合领域知识通过交互技术多角度分析位点。

据悉,浙江大学团队提出了面向规划选址的便捷可视推理和决策,涵盖了面向时空场景的探索式推理以及人机智能融合的多准则决策。

巫英才指出,选址难点在于数据规模非常大,算法搜索的空间非常大,人工无法完成,同时,个体的需求又多样化,因此,把专家经验与计算机的强大性能相结合,提供易用交互的可视化系统,势在必行。

在针对选址问题的多准则可视化决策方面,浙江大学提出了最大覆盖和位置可达选址计算模型,通过混合索引方法和轨迹拼接算法,支持海量数据的计算,高效地获得候选数据集合,完成初步筛选。

浙江大学还发明了多准则决策的便捷可视化选址框架,通过多准则的视觉编码,多准则的可视交互,多准则的可视排名,来使得选址变得更为透明、直观。

基于上述理论和模型,浙江大学团队开发了大屏环境下的可视推理和决策系统,使用多源机构大数据,交互式地选取地理位置,进行协同数据分析
来源:企业网D1Net