童建平-照片

童建平

运维工程师
23+
Experiance
155+
Projects

联系方式

13850001943

个人信息

性        别:男

婚姻状况:已婚

出生年月:1978年4月

教育背景

福建农林大学

毕业 年份: 2002年

学         历: 全日制本科

专         业: 林学

英语等级:  CET4

证书荣誉

网络工程师

全国计算机软件资格考试(全省第15名)

中级职称证书管理号: 08224350143

论文发表

无人参与安装Win2K全攻略

Linkbotpro--测试主页...

用DHTML制作动画一例

网页检索功能的简单实现

组建对等网DIY

主页制作经验拾遗

winimage--制作镜像...

网页颜色不再单调

状态栏上的动态HTML技术

动态HTML技术精彩实例

一道不等式题的简证

求知贵探索

学一点“行列式”知识

轸念陈景润

一道化学题的数学解法

一道数学赛题的别证

个人优势

  • 23年资深服务器运维,专长于云计算、自动化运维、数据库管理及容器化技术,致力于打造高效、稳定、安全的运维环境。
  • 丰富的实践经验:拥有从零构建私有云平台的完整经验,熟悉主流公有云平台的管理和优化,具备大规模服务器集群运维经验。
  • 高效的自动化实践者:擅长利用自动化工具提升运维效率,实现CI/CD流水线自动化,规范化运维管理。
  • 持续学习进取:密切关注行业动态和技术进步,不断更新自身知识体系以适应快速变化的技术领域。

专业技能

【云计算/自动化运维】
  • 私有云:熟悉VMware vCenter和OpenStack H3C CAS虚拟化平台的部署和运维管理。具备丰富的开源系统(如Gitlab、Confluence等)搭建经验,并实现openldap统一认证。
  • 公有云:熟悉阿里云、腾讯云、华为云、AWS、Cloudflare等主流公有云,灵活运用ECS、RDS、SLB等资源,实现业务系统快速部署、弹性扩展与无缝迁移,自编脚本调用SDK,优化日常运维及CI/CD流程,提升运维效率与交付速度。
  • 自动化运维:熟悉Jenkins、Maven、Nexus、Npm、Nacos等安装配置,并结合Ansible、SaltStack、Puppet等工具编写playbook,实现SpringCloud微服务架构的CI/CD持续集成、持续交付,涵盖Gitlab项目自动构建、发布(含灰度发布)、回滚等流程,并实现基础设施、配置、代码审查、单元测试、部署、监控等环节的自动化,显著提升软件交付速度和运维效率。
【容器化/Docker/K8S】
  • 熟悉容器化技术,熟悉Docker容器的使用、Dockerfile/docker-compose镜像编排以及日常运维管理。
  • 具备独立部署 Kubernetes 平台的能力,并成功完成 SpringCloud 微服务架构向 Kubernetes 的迁移。
【服务器运维】
  • 熟悉Linux下Apache、Nginx、Mysql/Mariadb、Php、NFS、zimbra、Haproxy、LVS、Redis(含codis)、MongoDB、PostgreSQL等环境(含集群)部署及运维管理。
  • 熟悉MySQL/Mariadb、SQLServer等数据库的安装部署、主从复制读写分离配置、性能调优、SQL优化、MHA高可用、容灾备份恢复、异地同步、数据迁移、安全防护等。
  • 熟悉Zabbix、Prometheus、Grafana、Nagios等监控软件,并能搭建ELK日志中心以监控实现邮件、短信、钉钉等报警,熟悉性能监控apm skywalking/pinpoint的配置及使用。
  • 能通过sar、vmstat、iostat、jstat等工具链对系统性能进行分析及优化,熟练使用jstack,jmap等工具用于分析和排查问题。
  • 能使用GO、shell及Python编写脚本,利用grep、sed、awk等命令进行复杂脚本编程,并将其应用到日常devops中。
【网络/安全】
  • 熟悉华为/H3C路由器/交换机、山石防火墙、博科光纤交换机等网络设备关于ZONE、LUN、VPN等方面的配置,能独立进行局域网架构设计及组网建设。熟悉Tcpdump、Wireshark等工具进行数据包的分析。
  • 及时关注业界安全资讯,熟悉漏洞扫描和入侵检测,了解黑客常用攻击及防御技术,熟悉网络安全攻防技术,包括SQL注入、XSS、CSRF安全风险等,能运用Nessus、kali等进行渗透测试。
【AI/AIOps】
  • 熟悉Deepseek本地化部署及企业知识库、客服系统的部署。正在探索AIOps。

项目经验

基于Kubernetes的微服务架构环境部署与运维

屯粮积草、联生活
  • 项目描述:该项目旨在为公司核心业务系统构建高可用、可扩展的微服务架构,基于Kubernetes实现容器化部署与自动化运维。
  • 主要职责:
    ★Kubernetes集群搭建与维护:
    ● 使用kubeadm部署并管理多节点Kubernetes集群,包括Master节点和Worker节点。
    ● 配置高可用集群,使用etcd集群和负载均衡器确保集群的稳定性。
    ★环境部署与优化:
    ● 使用Helm Chart管理微服务的部署模板,实现一键部署和版本回滚。
    ● 配置Resource Quota、Limit Range和HPA(Horizontal Pod Autoscaler),优化资源利用率并实现自动扩缩容。
    ● 通过Ingress Controller实现外部流量的负载均衡和SSL终止。
    ★监控与日志管理:
    ● 部署Prometheus和Grafana监控集群状态、节点资源使用率及Pod性能指标。
    ● 使用EFK(Elasticsearch、Fluentd、Kibana)栈集中管理容器日志,实现日志的实时查询与分析。
    ● 设置告警规则,及时发现并处理集群异常。
    ★安全与权限管理:
    ● 配置RBAC(Role-Based Access Control)实现细粒度的权限控制。
    ● 使用Network Policies限制Pod之间的网络通信,提升集群安全性。
    ● 定期进行安全扫描,修复镜像漏洞。
    ★故障排查与性能优化:
    ● 解决因资源竞争、网络延迟等导致的性能问题。
    ● 使用kubectl、kubectl logs、kubectl describe等工具快速定位并修复Pod启动失败、服务不可用等问题。
    ● 优化Pod调度策略,减少节点资源碎片化。
  • 技术栈:
    ● Kubernetes、Docker、Helm、Prometheus、Grafana、EFK、Ingress Nginx、RBAC、Network Policies
  • 项目成果:
    ● 成功将公司核心业务系统迁移至Kubernetes平台,系统可用性提升至99.9%。
    ● 通过自动化运维和资源优化,运维成本降低30%。
    ● 建立了完善的监控和告警体系,故障平均恢复时间(MTTR)缩短50%。

从0到1部署私有云平台

屯粮积草、联生活、海西医药
  • 项目描述:公司业务发展,需要搭建稳定、高效的私有云平台以满足日益增长的业务需求,实现资源的高效分配和灵活调度,并建立完善的运维管理体系,搭建CI/CD平台实现运维流程自动化,保障开发团队的基础设施服务稳定。
  • 主要职责:
    ● 选型及采购华为企业级路由器、博科光纤交换机等网络设备、Dell或浪潮或曙光等服务器、UPS等,自行完成网络设备zone等配置,完成服务器raid、存储等软硬件配置,定制操作系统无人值守自动化安装iso,集成硬件驱动、系统补丁、安全基线安全加固优化等配置,结合Cobbler等实现批量装机,完成搭建公司内网vcenter私有云平台。
    ● 搭建gitlab、jenkins、confluence、禅道、openldap、openvpn、nextcloud、Phabricator、SonarQube、showdoc、yapi、nexus、npm、Archery/Yearning、jumpserver、syspass等系统,且各系统集成ldap统一账号登录,并自编php程序实现短信服务自助重置ldap账号密码功能。
    ● 搭建基于jenkins+ansible的ci/cd持续交付发布系统,按需结合nacos实现灰度发布等流程。
    ● 搭建zabbix、prometheus、grafana监控系统并实现邮件、钉钉、短信报警通知功能。
    ● 强化DevOPS,结合shell、python、go等脚本,实现日常运维工作自动化,如调用阿里云、腾讯云SDK实现自助增、删、改域名解析等功能,并使用terraform高效地配置和管理内网vcenter及公有云资源。
    ● 同时增加市电断电监控脚本,有利保障公司内网机房安全。搭建内网dns解决测试人员手机调试APP问题。
  • 项目成果:
    ● 成功搭建内网私有云平台,节省了约30%的云服务租赁成本,实现了业务系统的快速部署和迭代,软件交付周期缩短了约60%;
    ● 通过完善的监控和报警体系,系统故障响应时间缩短至5分钟以内,有效保障了业务的连续性;
    ● 使用堡垒机审计并管理开发人员对数据库、服务器的相关访问,有效确保了数据的安全性。

开发sql审核平台

联生活
  • 项目描述:公司业务系统生产库需要一个能在微信上收到通知并简单操作审核的高效SQL审核平台来规范数据库操作,保障数据安全,实现SQL语句提交、审核流程自动化。
  • 主要职责:基于php+mysql独立开发,前后端分离、支持手机移动端响应式设计,攻克mysql原生api对部分功能支持度不佳的难题,确保平台的高效运行和良好的用户体验,开发与企业微信的集成功能,实现审核通知的实时推送。
  • 项目成果:成功开发并上线SQL审核平台,审核效率提升了约70%,减少人工错误,后续开发api提供给公司业务系统进行对接,进一步提升了业务流程的自动化程度。

开发员工上网行为管理系统

美亚柏科
  • 项目描述:员工通过远程桌面登录相同外网服务器访问互联网,现有上网行为管理软硬件无法审计具体员工上网行为,公司需要对员工上网行为进行有效管理和审计。
  • 主要职责:基于php+mysql独立开发,设计系统架构,实现对员工上网行为数据的采集、存储和分析,并开发web管理后台,方便管理人员查看和管理员工上网行为记录。
  • 项目成果:成功开发并上线员工上网行为管理系统,及时有效地监控了员工上网行为,极大简化员工上网行为审计工作,为公司每年节省成本逾10万元。

重构DNS服务器架构,化解重大DDOS攻击

东南融通
  • 项目描述:2009年国庆期间,公司业务DNS服务器遭受重大DDOS攻击,攻击流量罕见,影响全国四分之一网站访问,国家网络应急中心无法处置。需要快速解决DDOS攻击问题,恢复DNS服务器正常运行,减少公司经济损失。
  • 主要职责:分析攻击情况,将原单节点的每组dns服务器进行重构,实施分布式部署,并编写shell脚本进行相关数据实时同步。
  • 项目成果:完美解决ddos攻击,效果立竿见影,dns服务恢复正常,同时提升了dns解析服务质量,为公司减少经济损失损失逾400万元,获得东南融通集团全集团通报表扬。

工作经历

厦门屯粮积草网络科技有限公司

2023.06 - 2024.11
高级运维工程师

  • 负责公司各云平台基础网络环境、服务器的规划设计、搭建配置、管理、排错、性能调优及日常运维管理,保障公司业务系统的线上稳定性。
  • 负责公司各项目各云平台微服务运维工作,搭建及运维管理mysql、mongodb、nginx、redis、nacos、seata、rabbitmq、canal、elasticsearch、logstash、kibana、kafka、minio、python、vue等业务系统组件,建立CI/CD运维自动化体系并完善zabbix等监控,并根据需求针对开发人员制定严格的生产库只读受限访问管理,且搭建并开启Archery的数据脱敏功能保障生产数据安全。
  • 负责公司业务系统运维架构重构及mysql参数优化、sql慢查询等方面调优,推动业务系统python及其组件的版本升级,提升系统的响应速度和吞吐量,解决入职前业务系统高峰期宕机无法访问的问题,实现了支撑高并发访问,推动提升服务的可靠性、可扩展性以及性能优化,保障系统SLA。
  • 负责公司业务系统呼叫中心录音模块的开发,基于python+mongodb+mysql。后来为解决高峰期访问录音文件公网带宽瓶颈,对录音模块网络架构进行重构,且优化底层代码逻辑,使录音文件加载时长从原来17.1s变成564ms,速度提升约30倍。
  • 负责基于Go语言开发UDP协议传输文件程序,用于呼叫中心网络质量测试。

联生活(厦门)科技集团有限公司

2021.01 - 2023.06
运维工程师

  • 负责公有云、私有云方案的前瞻性容量规划设计与实施、系统运维,包括系统架构支撑、系统监控、业务变更响应、问题处置、安装部署、性能调优、容灾备份管理、数据迁移、日志分析等,保障各业务环境7×24小时稳定安全运行。
  • 负责公司各项目各云平台SpringCloud微服务运维工作,搭建及运维管理mysql、nginx、redis、nacos、seata、rocketmq、skywalking、xxljob、sentinel、php、uniapp、vue等业务系统组件,建立CI/CD运维自动化体系并实现线上业务的灰度发布,建立并完善zabbix、prometheus、grafana监控系统,实现对业务系统等多维度的告警预警,持续mysql慢查询优化,保障线上业务的稳定运行。
  • 主导公司业务系统的容器化转型,负责架构设计及Docker容器镜像的Dockerfle编排工作,搭建Habor、Rancher等平台,成功将业务系统迁移至Kubernetes平台,实现了平稳过渡与高效运行,验证了架构的可行性和可靠性。
  • 负责公司送水平台小程序等多个基于php+mysql的业务系统的选型、开发和维护工作。

厦门海西医药交易中心有限公司

2018.08–2020.08
运维主管

  • 负责公司运维体系建设,负责编制与优化部门管理制度与流程、运维知识管理体系与文档建设,完善相关流程和规范,制定和执行有效的SOP流程,通过SMART原则激励部门5名员工,使运维流程效率提高了约35%,完善zabbix+prometheus监控,保障基础架构、网络、系统、服务和线上应用7x24健康和稳定运行,通过运维技术的实践落地输出业务价值。
  • 负责公司各项目各云平台(内网私有云、阿里云、腾讯云、政务云等)SpringCloud微服务运维工作,搭建及运维管理nginx集群、mysql主从、redis集群、nacos集群、elasticsearch集群、kafka集群(含zookeeper集群) 、FastDFS分布式存储集群、DolphinScheduler集群、Doris集群、xxl-job、canal、tidb、hadoop、Kudu、DataX、pinpoint等,及时响应并快速定位解决各类问题。
  • 负责设计并实施CI/CD平台,基于jenkins+ansible,结合python脚本自动创建jenkins工程,以代码即架构的理念,实现了自动化多环境交付,一体化运维,自动化、持续集成、代码交付,敏捷迭代,缩短软件交付周期约90%。
  • 面对各省市医保局复杂的网络环境和多样的需求,负责制定针对性的运维方案,如使用Python脚本满足公司向各省市医保局汇报数据的需求,修复政务网XSS漏洞等,得到了医保局领导的肯定和表扬,提升了公司在医保领域的口碑和竞争力。
  • 负责仅通过SSH登录,在几乎不断网情况下,完成厦门总部路由器、核心交换机等网络设备IP段配置的更换,保障了业务连续性,提升了网络架构的灵活性和安全性。后来又独立完成了与北京分公司华为路由器AR2240C-S的IPsec VPN安全隧道配置,确保两地网络无缝对接、数据传输的安全与高效。
  • 完成公司质量管理体系认证(ISO9001、CMMI4、等保2.0)。

厦门贰叁肆玖互联网服务有限公司

2017.11–2018.08
运维主管

  • 负责培训及推行git代码管理规范,负责各业务系统的性能优化,负责zabbix监控告警管理及二次开发,领导部门3位员工与开发团队紧密合作,及时响应处置各种问题及突发情况,定位分析和解决。
  • 负责各应用系统及产品的安全渗透测试、漏洞扫描,持续跟踪发现安全风险并提出修复改进建议。
  • 负责基于php+mysql开发动态二维码系统,规避被封风险,有利提升公司业务发展。
  • 负责二次开发基于php+mysql的在线影视网站系统,并搭建流媒体服务应用于此系统。

厦门市美亚柏科信息股份有限公司

2010.11–2017.11
运维主管

  • 负责对客户行业类门户网站进行安全评估、安全加固、性能优化,成功解决高并发下网站访问瓶颈,项目成功为公司获得了一定经济效益。
  • 负责公司信息化建设整改,包括不限于网络架构vlan改造、DIY定制公司内部安卓刷机包,制定及实施公司外借笔记本双系统双网架构设计,完成内网AD域管理整改优化等,使用巡风、OpenVAS等对内网、业务系统进行漏洞扫描等安全检测,保障公司信息安全,搭建部署维护zimbra邮件服务器,解决邮件外发国外被封问题等,使公司信息安全事件发生率降低了约70%。
  • 负责厦门超级计算中心的运维管理,领导6位员工完成包括不限于优化和改造超算中心机房近千台机架式物理服务器及网络架构整改,做好服务器带外管理,负责运维管理制度、运维操作标准化手册、应急管理流程和应急操作预案(如机房精密空调二次给水)等的制定及实施,设计部署容灾备份方案,完善zabbix监控,搭建openstack平台用于部分业务,提升vcenter虚拟化技术、云技术应用及自动化运维水平等,应用ITIL理念及技术规范于日常运维中,建立ServiceDesk服务台制度,及时响应及落实客户需求,提升服务质量,并做好资产管理及问题管理,客户满意度提升了约35%。
  • 负责基于Infortrend盘阵的神威4000H高性能计算GPU集群及浪潮天梭TS10000高性能云服务平台集群的运维管理,优化GPU资源分配和使用效率,支撑OpenMP、MPI等单行、并行计算任务。
  • 负责制作无人值守安装Centos7光盘,结合cobbler完成快速批量装机,实现服务器快速安装并交付上线,工作效率提升约90%。
  • 上海合作组织首届网络反恐“厦门-2015”演习及金砖会议期间,负责协调UPS厂家提供不间断供电支持,保障相关服务器集群正常运转,团队协作圆满完成任务,获得国家公安部、外交部等部委表彰。
  • 参与公司官网、法眼视频分析系统、学校食品安全管理平台等多个系统的安全渗透测试,发现多个未被安全团队发现的漏洞,突出能力得到领导表扬。

网宿科技股份有限公司厦门分公司

2010.06-2010.11
高级技术支持工程师

  • 负责基于php+mysql的自动化运维平台--网宿CDN平台软件v2.0的架构规划、前后端整体设计及开发、版权申请等,完善开发文档,此项目被纳入国家火炬计划项目及重点新产品计划,为公司带来了显著的技术优势和市场竞争力。
  • 搭建部署gitlab服务器,推进完善部门git代码管理,使代码管理效率提升约55%。

厦门商中在线科技股份有限公司(东南融通)

2004.10-2010.06
资深运维工程师

  • 负责制作无人值守安装RedHat 9 (Shrike)光盘,实现服务器快速安装并交付上线,并完善服务器安全基线优化等标准化配置及管理规范,服务器环境配置标准日臻成熟。
  • 负责协调团队工作的开展、服务器和网络架构的规划优化改进,二次开发nagios+cacti结合zenoss以完善服务器监控报警及巡检,进行运维工作流程改造,制作服务器环境自动化配置脚本,提升运维自动化。
  • 负责公司重要业务系统DNS、CDN、VCP、mysql、mssql、java等服务器的运维管理,负责部门日常运维疑难问题处置,积累了丰富的故障排除、优化、迁移、数据备份等经验。
  • 工信部推出网站备案制度后,主动基于php+mysql开发虚拟主机域名备案信息检索系统,本部门及客服部的工作效率因此提升约80%。
  • 独立负责开发网站舆情通报处置系统,基于php+mysql开发,实现相关舆情信息及详情自动发送邮件通知客户,方便沟通及回访,舆情处置时效率提升约70%,获得C模式大客户及网安部门的好评。
  • 独立负责为公司业务系统C模式大客户开发基于asp+sqlserver的IDC全站业务系统,并接入公司D模式api接口及第三方支付接口等,易用性等各方面超过公司C模式,客户续约率提升约55%。

重庆热点网络技术开发有限公司厦门分公司

2003.04-2004.10
运维部经理

  • 负责运维团队规划和管理,制定团队发展目标计划,制定服务器管理规范流程及落实实施,领导3位员工完成已有问题排查、潜在问题发现,各类故障及事务的应急响应、处理,确保在线业务稳定性及安全性。
  • 根据公司安全现状制定并实施相关安全策略,并跟踪最新的安全形势,对服务器进行安全评估、安全加固等。
  • 独立负责公司主站全站IDC业务系统的前后端设计,基于php+mysql开发,并对接新网互联域名等API接口,极大促进公司业务发展,业务量增长了约55%。
  • 协助大客户进行网站推广,对公司业务发展起到积极作用,大客户业务合作深度提升了约60%。

厦门市数字引擎网络技术有限公司

2002.05-2003.04
服务器运维工程师

  • 利用大学期间发表的论文,制作无人值守安装win2000光盘,实现服务器快速安装并交付上线,交付周期缩短了约80%,促进公司业务发展。
  • 利用大学期间掌握的网络安全攻防经验,及时解决当时各种0-day高危漏洞等安全问题,初步形成服务器安全配置规范。
  • 研究linux下webmin虚拟主机开设管理,使公司linux下虚拟主机产品初具雏形,为公司开拓新业务奠定基础。
  • 负责公司面向客户的动网论坛搭建、二次开发及运维,收集客户反馈意见,为公司发展做出积极贡献,客户满意度达到约85%。