京公网安备 11010802034615号
经营许可证编号:京B2-20210330
2012年11月30日于北京开幕的HBTC 2012 (Hadoop与大数据技术大会 2012,原 Hadoop in China) 技术盛会上,云集众多学者、企业用户以及技术领袖。大会发扬开源精神的角度,联合国际和国内 Hadoop 及大数据应用的产学界人士和成功企业,通过技术应用审视大数据技术生态系统的现状和发展趋势,围绕大数据处理、信息检索、内容挖掘、自然语言理解、数据可视化、计算广告学、地理信息系统等相关技术主题进行探讨,充分促进 Hadoop 与大数据技术在国内的应用实践。
Etu 知意图首席顾问陈昭宇先生,在本届大会上进行了题为”企业应用Hadoop 的最佳模式”的主题演讲。在演讲中,陈昭宇先生不仅介绍了知意图大数据一体机 Etu Appliance 2.0 版本的最新功能,同时也向与会嘉宾分享知意图的用户和伙伴基于 Etu Appliance 2.0 上开发的行业解决方案与应用案例,让更多对大数据感兴趣但充满疑虑的人,充分了解大数据如何真正的落地。
Etu 知意图是亚洲大数据解决方案的领导品牌,专注于电信、金融、与电商行业的大数据解决方案研发,于 2012 年3 月28 日正式发布了亚洲第一个基于Hadoop 的大数据一体机产品 —— Etu Appliance。在此次 HBTC 2012 年度盛会中,Etu 知意图再次与现场的嘉宾分享了技术卓越的 Hadoop 大数据一体机产品Etu Appliance 的最新版本。这一版本在 Hadoop 生态系统的开源基础上,除了计算效能是用户自行搭建系统的3~12倍外,还实现了一键式的大规模集群自动部署、非仅是Name Node的系统全面性 HA、Kerberos/LDAP集成的多租户安全性、高效数据采集、集群集中管理等特色功能,是一个真正企业级即插即用的 Hadoop 一体机产品。
“因为Etu 知意图深刻理解 Hadoop 应用开发者与系统管理员的痛,我们独到的设计让Etu Appliance 2.0 确实做到了 Hadoop集群部署、管理、HA、安全性都简单难以超越,计算与网络传输效能高性价。这是亚洲的骄傲,并首先在中国发布。”Etu 知意图负责人蒋居裕在 HBTC 2012 大会上如此表示。
来自 Etu 知意图的大数据系统架构专家施宏良 (Jason Shih) 先生,也和与会嘉宾一起做了“从 Hadoop 安全架构部署实施到高等服务的演变”的精彩分享,施宏良先生认为目前使用 Hadoop 的开源框架,组织和管理庞大的数据量已经成为解决快速数据处理和提高分析能力的趋势。但企业对于数据与集群系统的安全有更高的要求,从不同层面或者访问权限上分离敏感信息和隔离共享存储或计算机设备。在 Hadoop 0.20 之前的版本中,类似 Unix 的文件权限已经提及并提供集群内的简单身份验证机制,但缺乏访问控制每个作业队列,控制提交等操作。为了使用新的安全功能,Etu Appliance 2.0集成了 Kerberos 网络认证协议,使其具备强大的身份验证和授权,保证严格的访问控制数据,资源和隔离之间运行的任务。施宏良先生分享了基于 Kerberos 的 Hadoop 安全集群环境的基础设施部署细节以及如何以此实现高层次的服务。通过 Etu Appliance 的快速部署和自动化系统内置的跨域认证机制,实现现有的活动域与外部 LDAP 域的互操作,并有效减少集成和操作的管理员开销。
2012 年5 月,Etu 知意图正式在北京发布了基于Hadoop 的Etu Appliance 知意图大数据一体机。同年10 月,又针对电子商务的行业特征推出具有针对性的解决方案知意图精准推荐系统 Etu Recommender。标志着Etu 知意图以Etu Appliance 知意图大数据一体机为数据处理平台为基础,支撑多种行业应用的“一横多纵”产品走向初步建立。
大数据起源于互联网,因而使用大数据的人才大多也扎根互联网。为了改善“人才瓶颈就是技术瓶颈”的现状,Etu 知意图为了更好的帮助中国用户实现 Hadoop 大数据处理与分析价值,特别在北京建立了 Hadoop 开发原厂团队和技术支持团队,Etu 知意图大数据一体机降低 Hadoop 采用上的系统门槛,帮助企业跨越大数据处理基础架构的障碍。Etu 知意图清楚的知道 Hadoop 等技术是实现大数据的技术手段,让企业发现数据背后的价值,集中精力透过数据寻找新的商业机会上才是大数据的核心意义。(文章来源:CDA数据分析师)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20