京公网安备 11010802034615号
经营许可证编号:京B2-20210330
岗位职责
1.多源异构数据处理体系设计与建模 基于业务场景需求,设计多源异构数据的解析与结构化处理框架,支持跨领域数据融合; 构建多模态非结构化数据管理体系:整合不同形态数据,设计统一的数据表示与存储方案,确保数据的可扩展性与互操作性。
2.多模态非结构化数据结构化工程落地 主导多模态数据结构化技术方案设计:基于预训练模型、自然语言处理、计算机视觉(CV)及多模态对齐技术,开发自动化解析工具链; 组织跨团队实施数据结构化全流程:完成从数据清洗→ 格式统一→ 关键信息提取→ 结构化存储→ 质量验证的落地,保障结构化数据的准确性与完整性。
3.数据处理自动化与性能优化 优化数据处理流程,提升自动化率:通过规则引擎、低代码/无代码工具或自定义算法,减少人工干预环节; 聚焦关键信息提取准确率提升:结合标注数据与模型迭代,持续优化抽取效果; 主导数据处理性能调优:针对大规模数据处理场景,优化算法效率与分布式计算框架,降低处理耗时与资源成本。
4.数据价值与业务场景赋能 深度对接业务部门,识别数据结构化需求,输出定制化解决方案; 推动结构化数据与业务系统集成:通过API、微服务等方式,将解析能力嵌入业务流程,支撑决策与技术创新; 建立数据处理迭代机制:基于业务反馈与技术演进,持续优化解析策略、结构化规则及工具链,确保数据资产的时效性与实用性。
5.关键技术/课题攻坚支撑,推动落地转化 联合其他领域专家,带领小组与跨组团队协同攻克关键技术/课题,推动技术攻坚成果的落地转化。
任职要求
1.基础资质计算机科学、人工智能、数据科学、统计学等相关专业硕士及以上学历(博士优先); 5年以上多源异构数据处理、非结构化数据结构化研发与工程实践经验,其中3年以上汽车电子/智能驾驶/AI研发领域相关项目经验; 英语可作为工作语言(读写流利),能高效对接跨国技术/产品团队。
2.核心能力 ①数据处理技术深度: 精通常见数据形态的高效处理方式,熟悉不同形态数据的特征提取、降噪、归一化等关键技术; 掌握多模态非结构化数据处理技术,能设计文本-图像-视频等跨模态数据的统一结构化方案,熟悉多模态预训练模型(或传统多模态对齐方法的应用。 ②工具与技术栈: 熟练使用数据解析工具链及多模态处理库; 熟悉主流结构化存储方案,能根据业务需求选择适配的存储架构; 具备自动化框架开发能力,熟悉Python/Java等编程语言,掌握Spark/Flink等分布式计算框架的性能调优。 ③工程实践能力: 有千万级以上多源异构数据处理经验,具备从需求分析→ 方案设计→ 落地实施→ 性能优化的全流程交付能力; 熟悉关键信息提取的主流算法,有实际提升准确率的成功案例。 3.优先条件 持有数据工程、自然语言处理或计算机视觉相关认证(如CDA、AWS认证),或在顶会(如KDD、ACL、CVPR)发表过数据处理/结构化相关论文; 有跨国多源数据项目管理经验,或主导过跨部门数据中台、数据湖等复杂项目。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25在数字化时代,数据已成为企业核心资产,而“数据存储有序化、数据分析专业化、数据价值可落地”,则是企业实现数据驱动的三大核 ...
2026-02-25在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16