职位详情
数据工程师
1-1.5万
沈阳麟龙科技股份有限公司
沈阳
3-5年
本科
03-26
工作地址

沈阳市-浑南区-白塔二南街18号

职位描述

数据标注与预处理:

负责金融领域文本、图像、时序数据(如K线图、交易数据)的标注工作,确保标注符合业务逻辑。

设计标注规则与质量标准,对标注结果进行校验和优化,支持NLP(如舆情分析、研报解析)和机器学习模型训练。

理解金融专业术语(如PE、PB、MACD、量化因子等),确保标注内容与金融场景高度匹配。

数据清洗与ETL:

清洗海量金融数据(如行情数据、用户交易日志、爬虫数据),处理缺失值、异常值及噪声数据。

构建自动化数据清洗流程,使用工具(如Python Pandas、OpenRefine)提升数据质量。

对非结构化金融文本(如公告、新闻)进行分词、实体识别、标准化处理。

数据建模与存储:

设计金融主题数据仓库(如基于Snowflake、Hive),优化数据存储和查询效率。

参与构建风控、推荐等业务的数据特征工程,支持量化分析和策略开发。

任职要求

数据标注与清洗能力:

熟练掌握数据标注工具(如Label Studio、Prodigy)及文本标注技能(如实体标注、情感分类标注)。

精通数据清洗技术(正则表达式、模糊匹配、去重算法)及工具(Pandas、SQL、Apache Spark)。

金融知识基础:

了解证券、期货、基金等金融产品术语及市场规则,能快速理解业务需求(如技术指标计算、财报数据分析)。

有金融数据(如Wind、Tushare、爬虫数据)处理经验者优先。

技术栈要求:

熟练使用Python(NumPy/Pandas/Scikit-learn)、SQL,熟悉Linux/Shell。

掌握ETL工具(如Airflow、Kettle)及分布式计算框架(如Hadoop、Spark)。

熟悉数据库设计(MySQL、MongoDB、ClickHouse)。

查看更多职位描述

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请