Linux连接信息维护

  • 2020 年 3 月 29 日
  • 筆記

近期由于客户端机器连接过多,导致程序报错,详见:《Spark异常:address》。这里总结下该如何查看和维护Linux机器。首先查看机器的连接数统计:

netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'  TIME_WAIT 61  CLOSE_WAIT 5  FIN_WAIT2 5  ESTABLISHED 717

状态定义:

状态:描述  CLOSED:无连接是活动的或正在进行  LISTEN:服务器在等待进入呼叫  SYN_RECV:一个连接请求已经到达,等待确认  SYN_SENT:应用已经开始,打开一个连接  ESTABLISHED:正常数据传输状态  FIN_WAIT1:应用说它已经完成  FIN_WAIT2:另一边已同意释放  ITMED_WAIT:等待所有分组死掉  CLOSING:两边同时尝试关闭  TIME_WAIT:另一边已初始化一个释放  LAST_ACK:等待所有分组死掉

查看某一进程对应的详细信息:

通过 ps -ax|grep "执行文件名",获得进程ID  使用:cd /proc/进程ID  使用:ll -rt|grep cwd,即可获得执行文件的所处路径

也可以直接使用命令查询概览:

ss -s 

分析进程占用端口号:

ps -ef | grep t_dwd_evt_user_bounce_tag  mqq       25891 194072 27 12:46 ?        00:01:20 /data/opt/jdk1.8.0_111/bin/java -cp /data/opt/spark-2.3.1-bin-hadoop2.7//conf/:/data/opt/spark-2.3.1-bin-hadoop2.7/jars/* -Xmx8g org.apache.spark.deploy.SparkSubmit --conf spark.sql.shuffle.partitions=600 --class com.tencent.th.dwd.t_dwd_evt_user_bounce_tag --total-executor-cores 300 SparkV2-1.0.1.jar repartition_num=100  mqq       41742 149384  0 12:51 pts/52   00:00:00 grep t_dwd_evt_user_bounce_tag    netstat -anpo | grep 25891 | awk '{print $4}' | sort -u  (Not all processes could be identified, non-owned process info   will not be shown, you would have to be root to see it all.)  ]