职位概要:
深入学习招采大数据业务,研究、研发和应用数据处理算法,完成数据的抽取、清洗、入库、建模、应用、维护,持续提升数据完整性和准确性。
岗位职责:
1、深入理解招标采购业务和产品应用场景,设计基础数据分类画像,和数据关系图谱;
2、微调或私有化训练通用大模型,或结合自研算法,设计数据实验方案,并设计数据完整性、准确性验证方法,并保障设计方案与过程结果的一致性;
3、运用大模型结合自研算法,将各格式文档(包括但不限于Word、Pdf、Excel、Html)的文字、表格、压缩文件进行解析,对文档中关键表格、关键文字段落进行识别和抽取;
4、对上述完成粗加工的数据,研究数据特征、相似性、关联性、差异性,并定向开发和调试语义识别算法和机器学习算法程序,自动提取准确数据;
5、根据基础数据关系,设计或重构数据库表结构和数据关系,对提取字段数据进行结构化入库;
6、深入研究数据之间的业务关联关系,定向开发和调试匹配算法,将多个来源分别获得的“项目-招采单位-供应商-产品-资质要求”组成完整准确的业务关系链数据;
7、持续优化算法和基础数据,并开发数据维护工具(提升基础数据增、删、改更新效率和稳定);
8、积极研究数据的应用,协助产品、研发、测试完成数据到产品的转化,并验收上线数据效果,对数据完整性和准确性负责;
9、对数据打标签、推荐算法进行探索研究,发现数据新的应用价值,并基于数据分析层面,为产品提供建议,提升产品价值;
任职资格:
教育背景:
◆ 本科以上学历,计算机、数学、统计学相关专业。
经 验:
◆3年以上算法实际工作经验(研究生可2年以上)
◆ 深入研究和测试过大模型应用(chatGPT、文心一言等),拥有基于场景化需求,对算法模型微调、二次训练,或自行开发机器学习算法的实际经验;
◆ 深厚的数据挖掘、统计、分析、应用理论和实践经验;
◆ 在大模型商业化、NLP、大数据挖掘和处理领域,至少1个项目承担数据主导作用项目经验;
◆ 有招采大数据相关经验优先。
技能要求:
◆ 精通使用python(同时熟练java优先),具备很强算法实现能力;
◆ 精通数据库结构、表结构设计;
◆ 在文本分类、关系抽取、自动摘要,文本生成、图谱构建、关系聚类、知识推算上有深入研究;
◆ 经常学习和研究最新算法论文及成果的习惯,并能将匹配的算法成果场景化改造用于实际工作,帮助产
品获得持续的竞争力;
态 度:
◆性格开朗,对工作充满激情;
◆有强烈的责任心,工作主动积极,认可公司发展目标规划,愿景,及公司价值观,愿意与公司共同发展;