
数据价值挖掘之道:人工智能成新宠
人工智能自1943年诞生以来,在几十年的发展历程中经历了多次潮起潮落,人们却从未停止过对人工智能的研究与探索。而今年的AlphaGo人机大战又将人工智能推向了一个新的高潮,人工智能也已经从实验室逐步走向了商业化。
在互联网和移动互联网的新生态环境下,云计算、大数据、深度学习和人脑芯片等因素正在推动着人工智能的大发展。未来大数据将成为智能机器的基础,通过深度学习从海量数据中获取的内容,将赋予人工智能更多有价值的发现与洞察,而人工智能也将成为进一步挖掘大数据宝藏的钥匙,助力大数据释放具备人类智慧的优越价值。那么,在未来,人工智能会向着什么方向发展?人工智能真的能够超越人类吗?
近日,由百分点集团、中国人民大学、北京大学、伦敦政治经济学院与统计之都共同主办的中国最大的大数据盛会“大统计与数据科学联合会议”在北京召开。在百分点集团与北京大学携手举办的“2016百分点数据与价值国际论坛”上,北京大学数学学院信息科学系教授林作铨、大规模机器学习专家王益、中科院模式识别国家重点实验室副研究员刘康等学者和专家,与百分点集团研发总监苏海波一起分享了知识表示、深度学习、自然语言处理等人工智能的相关技术与应用,同时还共同探讨了大数据的应用创新及最新趋势。
如今人工智能产业格局的生态圈正在逐渐清晰化,整个产业结构分为基础、技术和应用三层,基础层指的是芯片开发、存储设备开发和计算平台等,譬如地平线机器人和百度大脑就处于这一层;技术层指的是基于深度学习的语音识别、人脸识别等智能算法,譬如科大讯飞、商汤科技;应用层指于技术层为用户提供智能化的服务和产品,譬如小i机器人、出门问问。
北京大学数学学院信息科学系教授林作铨认为:“人工智能的原始目标有两个:一个是要通过计算机来模拟人的智能行为,来探讨智能的基本原理,这是真正关心的问题。第二个目标是把计算机做得更聪明,计算机变得更聪明,我们人就可以更傻,就是体验更好。”
随着搜索引擎的飞速发展,将互联网文本内容结构化,从中抽取有用的概念、实体,建立这些实体间的语义关系,并与已有多源异构知识库进行关联,从而构建大规模知识图谱,对于文本内容的语义理解以及搜索结果的精准化有着重要的意义。然而,如何以自然语言方式访问这些结构化的知识图谱资源,构建深度问答系统是摆在众多研究者和开发者前的一个重要问题。
对此,中科院模式识别国家重点实验室副研究员刘康表示:“我们做问答其实是想用人工智能的技术来做这样的问题,不管是检索式问答还是社区QA的问答,都是基于关键词的匹配和检索,其实很难做到对于数据真正的结构化的理解。问答的脉络可分为三类:一是基于检索式的问答,二是基于关键词检索或者是语义匹配的技术,三是基于知识库的问答系统,核心就是语义解析和推理。目前,深度学习在自然语言理解领域,还有很长的一段路要走。”
在论坛中,大规模机器学习专家王益分享了关于“通用计算机群和分布式机器学习”的主题,他表示,当我们说大数据的时候,不同行业有不同的说法,在互联网行业,凡是能说出有多大的数据的都不是大数据,互联网行业的数据是无穷无尽的。而要真正用好这些数据就一定会用到分布式存储和计算。实际上,在互联网和大数据环境下,首要目标是“能算大”.而“大”不是“算得快”就能做到的,而是要能形成业务闭环--运行Web服务、收集用户行为数据、通过机器学习理解用户、将学习得到的“知识”反馈到Web服务中以提升服务质量。
针对人工智能跟大数据到底是一个什么关系的问题上,百分点集团研发总监苏海波表示,人工智能给大数据带来的更多的是基于,而不仅仅是挑战。大数据对人工智能更多是一种推动,推动人工智能的发展。如今,人工智能已经开始慢慢深入到各个领域,我们能够利用人工智能技术,去提高我们的效率,去辅助人类,帮助我们进行洞察,做出正确的决定。
看百分点大数据价值挖掘之道
如今,大数据技术正在不断向各行各业进行渗透。深度学习、实时数据分析和预测、人工智能等大数据技术逐渐改变着原有的商业模式,推动着互联网和传统行业发生着日新月异地变化。但与此同时,非结构化数据难以利用,数据与实际商业价值不匹配的现象在很多企业依然存在,只有不断推进大数据技术与场景创新,才能真正推动大数据应用的不断落地。
为了帮助企业用户挖掘大数据价值,百分点打造了涵盖大数据技术层、管理层和应用层的完整产品体系,能通过大数据操作系统(BD-OS)、用户画像标签管理系统,以及应用层的推荐引擎、分析引擎和营销引擎,帮助企业更好的管理数据资产,全方位的搜集用户数据、进行深度整合,并借助数据分析对用户行为进行精准的洞察、分析,为企业的产品研发、经营策略制定提供坚实的数据支撑,从而更好地实现从粗放型营销向精准营销的转变。
百分点集团研发总监苏海波表示:“针对传统企业,我们要提倡互联网+,以互联网+大数据为基础,帮助传统企业提升效率,帮助他们挖掘数据价值,从而提升业务价值。”
与传统的数据管理系统相比,百分点大数据系统具有技术、应用、数据这三大核心竞争力,还创新的整合了标签体系、用户画像,用户群管理、数据输出、审计管理,智能推荐、价值分析等功能,系统能够通过企业全触点、全渠道用户数据整合,多维度洞察用户特征,满足全面性、深入性、易用性这三个维度的大数据应用要求。
写在最后,我相信,未来五年是人工智能进入各个垂直领域的加速期,“人工智能+”将引领产业变革,金融、制造、安防等领域将会诞生新的业态和商业模式,从而更好的实现信息技术由IT向DT的转变
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15