公司信创上线汇点期权系统后,发现汇点机器会出现空间满告警,当出现异常现象后,发现日志中记录很多too much open files的错误信息。查看普米grafana和塔罗斯thanos追踪历史情况如下:从以上二图中可看出,空间满时候,文件描述符也达到6万多。登录机器查看:# 列出所有进程打开的文件数lsof | awk '{print $2}' | sort | uniq -c | sort -
在公司运维时需要写些脚本,解放手工操作,但代码质量是需要环境进行模拟,如程序hang死是一个运维中非常常见的场景,另外较少出现的网络抖动,为保证脚本质量,经常要对二种情况进行模拟。1、程序hang死情况模拟某个程序被hang死通过: kill -STOP 1234(进程id) 执行命令后,运行脚本或API接口等进行验证恢复进程kill -CONT 1234;2、网络抖动情况执行命令:t
我司网络结构复杂,分内外网区,信创与非信创区,云平台与超融合区,中心及灾备等,应用系统在各个区之间会存在访问,访问耗时肯定不一样,在大并发情况下,如果跨区访问,会导致系统性能下降,需要及时关注。通过tcpdump抓包分析也能分析出建立连接耗时,该方式不是很方便,需对网络包比较了解,目前了解到有tcptraceroute命令简单实用,以下是安装使用方法:1、安装:yum install tcptra
近期公司上线国密sslvpn时发现配置完ipv6地址后,外部访问不通,同网段正常,检查ifcfg-bond0配置网关配置正常,也对比了其它centos上bond0配置一致,但就是通过route -6n查看没有网关。最后通过挨次办法在/etc/rc.local中配置如下命令解决:ip -6 route add ::/0 via fc00:10:230:95::90 dev bond0 这
我司安全加固禁止root用户远程登录,对某些需要root操作的批量工作任务执行方法如下:1、在需要远程重启的机器上root用户登录后visudo 追加:**zqoper ALL=(ALL) NOPASSWD: ALL注:youuser ALL=(ALL) ALL%youuser ALL=(ALL) ALLyouuser ALL=(ALL) NOPASSWD: ALL%youuser ALL=(AL
安装
运维
ip配置
数据库连接
运维过程中,经常在linux下netstat-na|grepport或windows下netstat-nao|findstrport杀掉某个链接,需要用到linux下的tcpkill或window下的tcpview:对linux:如没有tcpkill,则yuminstalldsniff安装。干掉某个链接可以用tcpkill-iany-9host10.60.161.89and10.60.167.24
现有硬盘上扩充空间fdisk-l查看空间,如新增加空间没有则可通过如下命令识别ls/sys/class/scsi_disk查看到一块硬盘0:0:0:0则执行如下,如还有其他,类推下面命令。echo'1'>/sys/class/scsi_disk/0\:0\:0\:0/device/rescan便可看到新增空间,又或者直接重启系统,让内核识别新增空间。fdisk-l再次查看空间
ipv6
配置tomcat不显示版本信息1、Tomcat安装目录下的lib目录下,名称为catalina.jar;2、unzipcatalina.jar之后会多出两个文件夹META-INF和org;3、进入org/apache/catalina/util编辑配置文件ServerInfo.properties字段来实现来更改我们tomcat的版本信息server.info=ApacheTomcatserver
nmcli安装命令:yuminstallNetworkManagernmtui安装命令:yuminstallNetworkManager-tui重启网络管理命令systemctlrestartNetworkManager
今日20200707,行情火爆,公司自研相关应用早上9点30左右出现反馈登录打开缓慢,监控显示请求超时,及时登录到服务器,发现登录服务器比较慢,有时登录不上,及时通过其他机器ping,发现出现ping:sendmsg:Operationnotpermitted,但检查服务器负载正常,通过网络度娘,建议停用防火墙,停用后正常,后来分析具体原因,通过dmsg查看日志,发现大量kernel:nf_con
1、AXMLPrinter2.jar反编译xml文件方法apk里的AndroidManifest.xml为二进制文件,可通过AXMLPrinter2.jar包反编译出来cmd命令行运行一下命令:java-jarAXMLPrinter2.jarAndroidManifest.xml>AndroidManifest2.xml打开AndroidManifest2.xml中的package就是包名。
早上出现一台esxi服务器光纤卡故障,相当于模拟小范围存储故障,导致上面虚拟机出现c盘或d盘异常,相关系统或应用无法启动,影响较大,需要修复。对c盘情况,可以用老毛桃引导后运行maxdos工具,调用K.XMGR模式,点击硬盘检测工具,子菜单中点击chkdsk磁盘检查,待chkdsk扫描到硬盘,输入c,接着按y,等待修复结束,之后按f9重启看看是否正常。对d盘情况,可以用桌面的分区助手,右击d盘,高
附:linux几种常见的文件内容查找和替换命令1、vi命令下的查找和替换1.1vi下的查找/pattern<Enter>:向下查找pattern匹配字符串?pattern<Enter>:向上查找pattern匹配字符串使用了查找命令之后,使用如下两个键快速查找:n:按照同一方向继续查找N:按照反方向查找pattern是需要匹配的字符串,例如:/name<Enter&g
最近接管系统时候发现服务器是单硬盘,为防止单硬盘故障,拟考虑购买硬盘实现冗余。为确保实施可行,在dell官网查询到可实现,具体链接如下:DellPowerEdge:如何更改虚拟磁盘的RAID级别:https://www.dell.com/support/article/cn/zh/cnbsd1/sln305744/dell-poweredge-%E5%A6%82%E4%BD%95%E6%9B%B4
1、在windows中启动端口监听方法,可以用大智慧转发工具,一个很简单dos程序便可。2、linux中,直接用nc-lk1025&便可。以下是网上找的说明:在centos7中,nc-lk9000&和nc-lp9000&的区别是什么呢?nc-l开启listen模式,用于指定nc将处于侦听模式。指定该参数,则意味着nc被当作server,侦听并接受连接,而非向其它地址发起连接
日常我司进行app测试,由于终端种类多,其中app有5种,每种又分ios和安卓,还区分测试、准生产,生产,仿真等环境,pc有8种,也区分测试,准生产,生产,仿真等,种类如下:以前是靠通过蒲公英网站做二维码供测试,该网站还经常审核不通过,不允许上传,最近还出现数据全部丢失,不可靠,也需要整理出下载说明,营业部下载测试也非常麻烦。
一、ELK介绍ELK是Elasticsearch、Logstash、Kibana三大开源框架首字母大写简称。二、我司应用1)同花顺PC客户端防外挂报送系统2)同花顺智能客服系统下面简单介绍下我司PC客户端防外挂系统。由于之前没有了解过ELK,在部署同花顺防外挂报送系统时候才逐步知道,同花顺自研了数据流引擎collect及pms,用于采集委托主站上日志到ES上,实时分析功能的kibana未要求安装,
日常运维中,特别是移交系统,需要重启服务器,到bios中查看,非常麻烦。但实际发现,可以通过在系统中执行命令查看,需要安装辅助工具:MegaCli64/MegaCli,具体用法如下:
最近在运维公司一台恒生行情服务器过程中,突然某周一发现之前配置/etc/rc.local中能随机器启动脚本没有随机器启动,但手动执行均正常。根据网上各种眼花缭乱资料,核查相关执行权限都有,但就是不执行,连touch/var/lock/subsys/local都不执行。没办法,想过重装,虽然是虚拟机,克隆安装检查,但感觉如果是物理服务器,那是非常麻烦,故还是希望找到原因。中途考虑过做成服务,在rc5
微信告警
在运维同花顺委托主站时,经常早上检查系统时候,发现transmit报错,创建链接失败,需要手动重启transmit,分析发现是早上6点程序自动重启导致,由于同花顺无法分析出原因,临时解决办法,把程序自动启动时间调整为5点,操作系统计划任务6点自动执行如下脚本实现杀掉transmit进程后自动重启。重启脚本如下restart-transmin.bat:taskkill/imtransmid.exe/
相信大家如果同花顺临时授权很多,手动更新非常麻烦,重复劳动太多,可采用如下powershell脚本downkey.ps1实现自动更新,主要实现判断pauth.ini中证书在一周内,执行则会去自动更新授权,如把脚本放置在计划任务中,定义晚上8点更新,则可做到自动更新授权(前提是同花顺已经重新授权)。具体脚本如下:#同花顺更新委托主站证书,注意key有特殊字符+-等要转义,无转义情况下authcode
相信大家在做同花顺系统运维时候碰到不少重复劳动,如节假日文件,手动更新非常麻烦,可做成如下powershell脚本downholiday.ps1实现自动更新:#定义参数,各服务器根据需要修改此处。$SavePath='c:\ths\'$SaveIni="20181231;20190101;20190204-20190210;20190405-20190407;201905
公司一直有台服务器cpu占用很高,分析出是恒生监控程序java占用很高,且三个java程序,仅其中一个很高,要恒生解决,一直未解决,导致每周重启,我司运维都要手动进行程序相关性设置,给运维带来麻烦。为解决运维重复劳动,拟看看是否可以脚本实现,通过对网上资料查询可通过powershell进行程序相关性设置。参考链接如下:https://www.pstips.net/setting-process-r
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号