岗位职责:
1.熟练使用Python高效、可靠的开发网络爬虫程序,在不同数据源抓取信息。
2.使用相关的库和工具,如Beautiful Soup、Scrapy等,解析和处理网页内容,从HTML结构中提取所需数据。
3.对抓取数据进行清洗、转换和整理,确保数据质量。
4.理解网站的反爬虫机制,开发应对策略,确保持续稳定地抓取数据。
5.实现自动化的爬取任务调度,定时触发爬虫程序,确保数据的及时更新和同步。
6.领导安排的其他工作。
任职资格:
1. 熟练应用python、Js,熟悉前端开发的相关领域知识,熟悉XPath、正则表达式。熟悉MySql/MongoDB/Redis/ES,对数据库有一定的了解。