工作职责:
- 负责监控主机的运行状态,主动及时处理项目运行中出现的故障,保障主机系统长期稳定 运行;
- 熟练使用云平台(Aoogle 云、华为云、阿里云、Amazon)的网络架构、存储架构、监控 架构及自定义方案实施;
- 与业务保持紧密的合作,及时发现业务痛点或提升业务效率的机会点,并协调资源实现相 关的系统优化;
- 面向金融支付、游戏、互联网等行业与场景,与运营、研发等团队协作,建设适用于部门 项目运维的方案设计, 并不断地根据需求进行优化;
- 负责管理运维服务的质量,发起和驱动运维服务质量提升的各项工作; 职位要求: 1.大专以上学历,计算机相关专业,3 年以上工作经验; 2.掌握部署常见的网络服务技能,如 vsftp、nfs、samba、bind、dhcp 等; 3.掌握 git,rsync 和 scp, inotify/sersync,crond, nginx 相关技术 4.熟悉 HTTP 协议工作原理和简单的性能调优; 5.熟悉 Mysql,Redis,MongoDB 数据库部署,备份和恢复,会一些简单的 SQL 语句,了解主从复制,性能优化和主流 集群方案如 MHA、MGR 等; 6.掌握主流 Zabbix,Prometheus 开源监控系统的安装部署和使用,主要监控服务器硬件, 性能,API,业务,PV/UV, 日志等方面; 7.掌握日志系统 ELK Stack 的安装部署和使用,能分析日志,排查故障 8.熟练进行服务器安全防范,了解常见攻击类型,如 CC、DDOS、ARP 等 9.精通 Shell 脚本编写,grep,sed,awk 命令使用娴熟; 10.掌握 Python/Go 语言开发基础优先; 11.具有一定的大型项目运维经验,善于总结沉淀,形成高效的解决方案,能够独立高效地解 决系统运维有关问题; 12.有良好的团队合作能力,善于沟通,工作自主驱动,对新技术敏感,乐于尝试,勇于挑 战