2010年6月8日火曜日

利用sed 命令去掉windows下回车符及空白符



windows下的回车符为 \r\n 而unix下的回车符是 \n

1.去掉所有行的空格
sed -i 's/ //g' df.txt

2.去掉所有行的空格
sed -e 's/ //g' df.txt >cwm.txt

3.将每一行拖尾的“空白字符”(空格,制表符)删除
sed 's/ *$//' df.txt >cwm.txt

4.将每一行中的前导和拖尾的空白字符删除
sed 's/^ *//;s/ *$//' df.txt >cwm.txt

5.去掉空行
sed '/^$/d' df.txt >cwm.txt
sed -e '/^$/d' df.txt >cwm.txt
sed -i '/^$/d' df.txt
这三个是等价的 但第三个会改变原文件

6.去掉windows下的回车符 (注意^M 在linux 下写法 按^M 是回车换行符,输入方法是按住CTRL+v,松开v,按m)
sed -i 's/^M//g' df.txt

7.去掉windows下的回车符 (注意^M 在linux 下写法 按^M 是回车换行符,输入方法是按住CTRL+v,松开v,按m)
sed -e 's/^M//g' df.txt >cwm.txt
8.sed 用正则表达式 8个字符一组换行

echo "aaaaaaaabbbbbbbbccccccccdddddddd"|sed 's/.\{8\}/&\n/g'

aaaaaaaa
bbbbbbbb
cccccccc
dddddddd


也等价于
dos2unix df.txt >cwm.txt


----------------------------------------------------------------------------------------------

******如何去掉文件中行尾的回车符号^M******
sed 's/^M//g w newfilename' oldfilename
其中:
s 表示Searchg 表示搜索全文,缺省是搜索第一个^M 是回车换行符,输入方法是按住CTRL+v,松开v,按m
w 表示写到新文件中.


例子1
86103113234778,
86103145878770,
86103116778768,
86103111879708, sed 's/^86//;s/,$//' user.txt #去掉开头的86 及尾部的,号

例子2
103113234778
103145878770
103116778768
103111879708
sed -e 's/^/86/' user.txt #每行行首加上86
86103113234778
86103145878770
86103116778768
86103111879708
------------------------------------------------------------------
我有一个文件:
aaa,
bbb,

ccc,
ddd,

eee,
fff,


想删除第3,6,9。。。的空行并且合并12,45,78。。。行,
结果如下:
aaa,bbb,
ccc,ddd,
eee,fff,
.......

解法
sed -e '/^$/d' -e 'N;s/\n//g'

sed 'N;N;s/\n//g' (行数必须是3的倍数,不然最后一行不对)

对于替换单引号外层应加双引号

sed "s/^/'/;s/$/'/" 营帐GPRS用户.txt
===========================================================================


用sed 模式空间把时间格式加个空格
[oracle@TestAs4 filter]$ more nd_td.txt
13211124412,2008-08-2613:24:07,2008-08-2615:28:39
13144035749,2008-08-2613:24:06,2008-08-2615:30:39
13144023993,2008-08-2613:19:11,2008-08-2615:37:34
13006601565,2008-08-2612:04:15,2008-08-2615:40:34
13178665198,2008-08-2613:17:49,2008-08-2615:42:35
13058107546,2008-08-2613:08:41,2008-08-2615:49:35
13246005230,2008-08-2613:27:20,2008-08-2615:54:36

[oracle@TestAs4 filter]$ sed 's/\(2008-[0-9][0-9]-[0-9][0-9]\)/& /g' nd_td.txt |more
13211124412,2008-08-26 13:24:07,2008-08-26 15:28:39
13144035749,2008-08-26 13:24:06,2008-08-26 15:30:39
13144023993,2008-08-26 13:19:11,2008-08-26 15:37:34
13006601565,2008-08-26 12:04:15,2008-08-26 15:40:34
13178665198,2008-08-26 13:17:49,2008-08-26 15:42:35
13058107546,2008-08-26 13:08:41,2008-08-26 15:49:35
13246005230,2008-08-26 13:27:20,2008-08-26 15:54:36
13169867085,2008-08-26 13:18:14,2008-08-26 15:58:34
13043484284,2008-08-26 12:04:07,2008-08-26 16:03:35

以下两个都是利用模式空间替换实现的
sed 's/\(2008-[0-9][0-9]-[0-9][0-9]\)/\1 /g' nd_td.txt |more
sed 's/\(2008-[0-9][0-9]-[0-9][0-9]\)\([0-9][0-9]:[0-9][0-9]:[0-9][0-9]\)/\1 \2/g' nd_td.txt |more


#echo ${orjtext0.txt//[!a-z]||[!0-9]} >orjtext1.txt
#sed -e 's/^M//g' orjtext01.txt >orjtext0.txt
#cat orjtext0.txt|sed s/\n\r/\n/ >orjtext01.txt
#doc2unix orjtext0.txt orjtext01.txt
col -b < orjtext0.txt > orjtext01.txt

cat orjtext01.txt|grep -v '^#'|sed '/^$/d' >>orjtext02.txt #把#号注释掉的和空行去掉
#sed -e 's/^#//' orjtext01.txt >orjtext02.txt #把#号注释掉的行去掉
#sed -i '/^[ \t]*\/\#d' orjtext01.txt

有时当进行某些配置文件的查看时,分去除注释(如:"#"),但之后还会发现中间也许会有好多空行,所以,现小结一下去除空行的方法。
1)用tr命令
# grep -v "#" /etc/snmp/snmpd.conf |tr -s '\n'
2)用sed命令
# grep -v "#" /etc/snmp/snmpd.conf |sed '/^$/d'
3)用awk命令
# grep -v "#" /etc/snmp/snmpd.conf |awk '{if($0!="")print}'
4)用grep命令
# grep -v "#" /etc/snmp/snmpd.conf |grep -v "^$"

0 件のコメント: