2000-4000元
沈阳市-浑南区-白塔二南街18号
数据标注与预处理:
负责金融领域文本、图像、时序数据(如K线图、交易数据)的标注工作,确保标注符合业务逻辑。
设计标注规则与质量标准,对标注结果进行校验和优化,支持NLP(如舆情分析、研报解析)和机器学习模型训练。
理解金融专业术语(如PE、PB、MACD、量化因子等),确保标注内容与金融场景高度匹配。
数据清洗与ETL:
清洗海量金融数据(如行情数据、用户交易日志、爬虫数据),处理缺失值、异常值及噪声数据。
构建自动化数据清洗流程,使用工具(如Python Pandas、OpenRefine)提升数据质量。
对非结构化金融文本(如公告、新闻)进行分词、实体识别、标准化处理。
数据建模与存储:
设计金融主题数据仓库(如基于Snowflake、Hive),优化数据存储和查询效率。
参与构建风控、推荐等业务的数据特征工程,支持量化分析和策略开发。
任职要求
数据标注与清洗能力:
熟练掌握数据标注工具(如Label Studio、Prodigy)及文本标注技能(如实体标注、情感分类标注)。
精通数据清洗技术(正则表达式、模糊匹配、去重算法)及工具(Pandas、SQL、Apache Spark)。
金融知识基础:
了解证券、期货、基金等金融产品术语及市场规则,能快速理解业务需求(如技术指标计算、财报数据分析)。
有金融数据(如Wind、Tushare、爬虫数据)处理经验者优先。
技术栈要求:
熟练使用Python(NumPy/Pandas/Scikit-learn)、SQL,熟悉Linux/Shell。
掌握ETL工具(如Airflow、Kettle)及分布式计算框架(如Hadoop、Spark)。
熟悉数据库设计(MySQL、MongoDB、ClickHouse)。
查看更多职位描述
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕