
大数据不是空中楼阁,红象云腾一站式技术让大数据平台落地
中国大数据领域的产、学、研、用大格局正在形成,大数据产业蓝图已经绘成就。在国家层面,实施大数据战略,塑造国家竞争力的战略制高点;企业推出大数据技术、产品、应用,发展大数据服务,推动大数据产业发展;政府、社会以及各类用户依靠大数据,提升政府治理能力,优化民生公共服务。
然而,大数据应用始终给人一个高高在上、空中楼阁的印象。为什么会出现这样的现象?如何让大数据应用更节接地气,真正落地,发挥数据的价值呢?
红象云腾创始人兼CEO 童小军
6月30日,接受记者采访的红象云腾创始人兼CEO童小军认为,在大数据金字塔里,处于金字塔顶端的技术“Hadoop”是大数据的底层支撑平台,是大数据最核心的技术手段。目前来看大数据基础平台具有技术门槛高、投资大、回报周期长的特点,其发展水平直接制约着大数据应用的落地。大数据基础平台的稳定性、速度、易用性等成为考验大数据应用落地企业落地的关键难点。
Hadoop标志是大象,红色是中国色,红象代表中国的Hadoop厂商。今年年初,红象云腾将RedHadoop品牌正式升级为REDOOP,专注于大数据核心底层技术的研发和产品化,让现在看起来“高大上”的大数据趋于平民化。同时在坚持走自主创新的同时,以开放的心态,与广大合作伙伴一起构建大数据应用生态,让大数据应用落地。
专注大数据基础平台 将大数据技术带入更多企业
Hadoop的核心是分布式计算和分布式存储,核心思想是化整为零,分片存储,移动计算,分片处理。它属于大数据底层基础软件,目前国内掌握企业级大数据基础软件核心技术的高科技公司凤毛麟角。
作为中国Hadoop大数据厂商,红象云腾从成立之初,就提出了两个目标:成为中国大数据基础软件厂商的领导者,致力于将大数据技术带入更多企业。6月30日,在中关村软件园国际会议中心,作为中关村国家自主示范创新区的重要组成部分和信息技术产业发展的主要板块的中关村软件园的入园企业,红象云腾推出全球唯一支持五种芯片的大数据基础平台产品CRHV5.0,为企业大数据实施提供一套完整的一站式大数据解决方案,将大数据技术带入更多中国企业。
这是红象云腾大数据基础软件平台的第五次更新,而Redoop推出的产品也被称作“红象数据高铁”。之所以用“高铁”来做比喻,是因为二者动力原理相似。高铁因为每节车厢都有动力,效率比传统火车快。基于分布式技术的Hadoop的原理则是把数据分块,通过并行运算来提高数据检索、查询、分析等操作的效率,每台机器都有自己的动力(计算力)与存储,从而提供充沛的动力和功能模块来提升客户的大数据应用环境。
童小军说,红象云腾五年磨一剑,专注于中国大数据基础软件一个点,秉持“专注产品,全面合作”态度,打造“安全稳定,坚若磐石”的企业级大数据平台,冀望能成为中国大数据领域的高铁。红象云腾前五年为后十年发展打下坚实基础。
支持五种CPU 全球唯一
红象腾云的大数据基础平台Redoop Enterprise CRH全称“China Redoop HyperLoop”,代号 “数据高铁”,分布式动力、处理速度快,立志成为 “全球开源大数据基础软件旗舰厂商”。目前落户联想、NTT-DOCOMO、中国航天等企业,管理的最大集群超过4PB。
本次大会发布的红象云腾Redoop Enterprise CRHV5.0为企业大数据实施提供一套完整的一站式大数据解决方案,产品覆盖了企业数据仓库、商业智能、机器学习、数据可视化等领域,助力企业在DT时代更敏捷、更智能、更具洞察力。
其中,CRH-DB是红象云腾自主研发的基于实时的分布式数据库,可以实现千亿数据秒级响应;CRH-SE是基于ElasticSearch的搜索服务组件,能够达到实时搜索,具有稳定、可靠、快速的特点;CRH-TSDB基于HBase存储数据,充分发挥了HBase的分布式列存储特性,支持数百万每秒的读写;CRH-CEP基于Storm和SparkStreaming的准实时流处理组件,具有低延迟、可扩展和高容错的诸多优点;CRH-DW是基于Apache Hive+Apache Hadoop的数据仓库,突破传统数据仓库数据量过大导致的数据提取缓慢的问题,存储数据量无上限要求;CRH -DM基于机器学习和统计学,提供R语言、Mahout数据挖掘组件。
童小军认为,红象大数据平台充分利用了开源的Hadoop的优势,并树立自己的几大优势:
一站式,提供企业大数据应用的整套大数据基础软件平台。CRH具备分布式存储、分布式计算、分布式数据库、分布式数据挖掘等基础功能,支持PB级别海量数据存储、批处理、流处理、内存计算、多维查询、搜索引擎等基本功能,支持在亿万级数据中进行高速统计和检索功能,实现从基础平台到可视化分析一键部署,从数据存储到可视化报表开发一站式解决方案,从解决方案到项目实施一站式服务。
跨平台,大数据基础软件只有深深扎根在芯片和操作系统的开放土壤中才能生根发芽。CRH支持宏芯(OpenPower)、飞腾、申威、龙芯国产芯片,以及Intel X86等多种芯片;支持红旗、中标麒麟、银河麒麟等多种国产服务器操作系统;支持国产服务器,已经完成浪潮、中太、航天科工飞腾服务器等兼容性测试。
多场景,支持在线(Online)、近线(NearLine)、离线(OffLine)三大应用场景数据分析,并做了场景优化,为用户提供从数据存储、数据分析、数据挖掘等全场景的大数据平台解决方案,并在交通、公安、航天、工业、金融、电信等多个场景均有实战项目。
多兼容,支持结构化、半结构化、非结构化的多种数据接入,可视化展示兼容Zeppelin、Apache Kylin、Saiku等多种分析工具。
构建大数据生态, 做大大数据行业基础软件
权威机构统计,到2025年基于Hadoop的大数据基础软件的市场规模将达到10000亿元。而在国内,大数据应用对基础软件的需求也在持续增加,相信基于开源软件Hadoop的国产大数据基础软件将迎来一大发展重大机遇期,不仅可以赢得国内海量市场,并能借助“一带一路”战略走向世界。
红象云腾公布成功融资1000万
在本次会议上,红象云腾宣布获得了由国家新兴产业引导基金支持的华耀资本1000万Pre-A 投资。作为中国大数据软件旗舰厂商,红象云腾联合China Hadoop Summit、中国卫星全球服务联盟和中关村大数据产业联盟、中国首席数据官联盟、北京长风信息技术产业联盟共同发起“共建大数据合作生态”。在本次大会上,红象云腾得到了中国卫星全球服务联盟、 IBM、微软、盐城市政府,洛阳市政府的大力支持,合作伙伴红旗、中太、中标麒麟、新云东方、银河麒麟、纬创、NVIDIA、微云数聚等悉数到场,呈现合作共赢的态势。
大数据和人工智能实验室揭牌
会上,红象云腾和新云东方签约,建立大数据和人工智能实验室。同时红象云腾和盐城市政府、南京邮电大学盐城研究院签订产学研合作协议和江苏红象云腾数据科技有限公司也成功揭牌。
童小军说,红象云腾专注于底层平台软件开发,以及部分和底层密切相关的工具,致力于成为全球领先的大数据基础软件供应商。上层的应用和其他工具模型由合作伙伴负责。红象云腾希望将Hadoop技术融入到各种应用场景中,打造“芯片、操作系统、云计算、算法(深度学习)、应用、行业”+Hadoop等多个细分的战略方向。本着开放的心态,与合作伙伴一起共建开放协作的大数据生态,和大数据生态链上的厂家合作共赢。红象云腾目标是十年内将红象云腾打造成为市值百亿级的大数据行业基础软件国际领军企业。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15