数据开发高级工程师
面议
北京 本科
北京-海淀区
岗位职责:
1、负责公司健康医疗大数据平台相关组件的设计、搭建和维护;
2、负责对远程的医疗信息系统的数据收集、处理、存储进行方案设计和开发;
3、利用分布式计算集群对数据进行分析、挖掘、处理、生成报表;
4、负责Hadoop相关业务的性能优化与提升,集群性能优化,不断提高系统运行效率;
5、进行大数据技术培训以及相关项目交付,对客户或团队成员形成知识转移。
任职要求:
1、3年以上Hadoop,Hive,Spark开发经验,精通Hadoop生态系统及相关组件,并拥有实际的实施经验;
2、精通Java/Scala编程,精通Spark计算框架的实时采集和流处理;
3、熟悉整个大数据的处理流程,包括数据的管理,数据的分析挖掘,服务器扩展;
4、熟悉Cassandra、HBase、MangoDB等数据库的设计开发;
5、良好的SQL语句功底,熟悉MySQL/PostgreSQL/Oracle数据库中的一种;
6、熟悉sqoop、flume、azkaban等大数据ETL调度工具,主流的消息队列中间(主流MQ、Kafka等);
7、有大数据系统架构设计、OLAP应用开发(如Kylin)、数据分析挖掘经验者优先考虑;
8、学习能力强,工作作风严谨、积极主动,有较强责任感,乐于协作,善于分析和解决问题。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕