京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据系统可实现医疗信息服务普适共享
(周慧吴兰)身体不适想在网上求医问药,搜索出的信息成千上万,却很难找到适合自己的有用信息,这是很多病人尤其是慢性病人的切身体验。记者从第六届“数据挖掘与智能计算”论坛上获悉,该校数据挖掘与智能计算研究团队在大数据知识工程领域取得的研究成果,将为解决这一问题提供有效的途径。
“即使只是在县城得了普通感冒,如果在搜索引擎中寻找合适的医院,推荐的往往也是北京上海的大医院,推荐结果显然并不适应患者的情况。”长江学者、国家“千人计划”特聘专家、合肥工业大学数据挖掘与智能计算研究团队学科带头人吴信东教授介绍说。发生这种情况的原因是目前从互联网上获取的还主要是信息,而并非有用的知识。目前,人类知识的迅猛增长和大数据的多源与动态加剧了知识的碎片化问题,针对这些数量庞大、来源众多、结构各异的碎片化知识,大数据知识工程通过发掘其表示与演变的规律,融合知识实现量质转化与知识增殖,同时对融合知识进行动态有序化组织,以满足不同客户的需求。
网上存储的医疗健康数据中隐藏着丰富的医学领域知识,但如何从这些数据中获取真正有用的知识进行辅助决策支持方面的临床实践应用,还存在着诸多难点。由于这些医疗健康数据是来自于地理上分布、管理上自治、模式上异构的多种数据资源,其信息的有效性往往很难甄别。如同一家医院具有不同的名称、同一种疾病可能分属多个分科、一家医院的同一科室可能存在同名医生等。对疾病的治疗方案,也存在着专业医生的权威诊断和病人自己的治疗经验。
面向具有多源性、海量性、动态性、异构性、不确定性和实时性等特征的医疗健康数据,该校数据挖掘与智能计算研究团队开发的普适医疗信息与服务系统采用数据挖掘及其它人工智能技术、云计算等技术,提供医疗信息自动聚合、知识发现与服务、医疗服务信用评价机制、个性化医疗服务推荐机制,以达到医疗信息和服务普适共享、广大民众普遍受惠的目的。系统开发集成了具有自主知识产权的多源海量信息自动聚合的中间件、多源海量动态信息知识发现中间件、知识处理工具库、个性化计算工具库、平台管理工具库和数据管理与查询工具库等多项技术,每天从12个信息较为全面的医疗门户网站选取处理的数据高达5TB。这些数据经过采集、加工后进入普适医疗信息服务系统,以在线方式为广大疾病患者提供智能化、实用易用的服务和咨询。通过系统,病人可以查疾病、诊症状、推医院、荐医生,并形成医疗信息知识库。同时,这些服务与咨询也是针对患者病情的量身定做,同一种疾病在不同的情况下将推荐不同的诊断方案,如痛风患者由于病情不同,应该到风湿科、内分泌科或骨科等不同科室接受治疗。
“大数据知识工程形成的基于互联网的知识服务经济是一种新的经济和业态,也是新经济的支撑,具有重要的战略意义。除了医疗领域外,大数据知识工程在个性化教育、社交媒体等公共领域有着极为广泛的应用前景。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25