电脑技术学习

用shell编出来的查看dbf文件的脚本

dn001


不是很完善,但还行了,速度稍慢!

#!/bin/ksh
hd -abdA $1 |sed -n '1p' | cut -c7-70>$HOME/tmp/FIRSTLINE$$
DBFFLAG=`awk '{print $1}' $HOME/tmp/FIRSTLINE$$`
if [ $DBFFLAG -ne 3 ]
then
echo "这不是一个数据库文件!aa"
exit 1
fi
DEFSIZE=`awk '{print ($9+$10*256)}' $HOME/tmp/FIRSTLINE$$`
STEP=`awk '{print ($11+$12*256)}' $HOME/tmp/FIRSTLINE$$`
dd if=$1 of=$HOME/tmp/DBFEND$$ bs=$DEFSIZE skip=1 2>/dev/null
fold -b -w$STEP $HOME/tmp/DBFEND$$
rm $HOME/tmp/FIRSTLINE$$
rm $HOME/tmp/DBFEND$$


DBF结构的一般描述如下(这是低版本,foxpro 2.6以下可用,高的版本我不是很清楚):

第1个字节:DBF的标志,若含有Memory字段则为80H,否则为03H,这是以下的一个判断的一个根据来的;
2-4字节:文件建立或修改的最后日期(年、月、日);
5-8字节:数据库记录个数,低位在前,高位在后。
9-10字节:指出了库说明部分的实际长度,库说明部分的实际长度=第10字节的值*256+第四字节的值;
11-12字节:每条记录的长度=第12字节的值*256+第11字节的值;
13-32字节:未用。

库说明部分从第33个字节开始,依次存放每个字段结构的说明,每32个字节描述一个字段,具体内容这个脚本没有用到,就不说了,想知道了在网上狗一下就可以找到,

#!/bin/ksh
#以上这句不用解释了吧。

hd -abdA $1 |sed -n '1p' | cut -c7-70>$HOME/tmp/FIRSTLINE$$
#hd就作用就是以十六进制格式显示文件,那些参数是什么意思,自己man一下就知道了,而sed -n '1p'就是取其中的第一行,没法,这里对于大的文件要浪费一点时间,因为他要显示整个文件,然后才取第一行嘛;而cut -c7-70就是取DBF文件的前16个字节的那些ASCII的十六进值,而不是原来的文件ASCII字符,这也是最重要的一部分,有了这部分,“下面的问题就容易多了”!一句话,取DBF的文件头的十六进制字串。

DBFFLAG=`awk '{print $1}' $HOME/tmp/FIRSTLINE$$`
#取第一个字节的ASCII值,作为判断是不是DBF文件的标志。

if [ $DBFFLAG -ne 3 ]
then
echo "这不是一个数据库文件!aa"
exit 1
fi
#判断一下,要是数据库文件的话就进下面的工作,要不是的话,就退出,这里忽略掉一个问题,要是有备注字段的话,也当该文件为一个非数据库文件,因为那种情况要复杂一些;曾有人问道,aa是什么意思?意思是响铃,BELL。


DEFSIZE=`awk '{print ($9+$10*256)}' $HOME/tmp/FIRSTLINE$$`
#按部就班,取出库说明部分的实际长度。define size

STEP=`awk '{print ($11+$12*256)}' $HOME/tmp/FIRSTLINE$$`
#取出每条记录的长度,要是没有这个的话,就不能准确定义什么时候换行了!

dd if=$1 of=$HOME/tmp/DBFEND$$ bs=$DEFSIZE skip=1 2>/dev/null
#到这里,我们就可以取出“戏肉”了,不要前面的说明部分,只保留其中的真正的数据部分,bs就是block size,也就是用dd,以每块为define size的长度去复制到另一个文件,skip=1就是不要第一块(即说明部分),留下主要的数据部分。因为dd会有系统提示信息出来的,故用2>/dev/null过滤掉。

fold -b -w$STEP $HOME/tmp/DBFEND$$
#因为刚才得到的是一个连续的文本,没有换行的,而fold 就是实现换行的作用的。这里没有重定向,也就是我们在屏幕看到的了。

rm $HOME/tmp/FIRSTLINE$$
rm $HOME/tmp/DBFEND$$
#这个也要说吗?就是删除临时文件。“$$"就是当前进程的进程号,这样做的原因就是:要是一个很大的数据库在显示时,这个程序相对C编的文件要慢很多,其产生的临时文件也会停留一段时间,而多个数据库文件同时显示时,如果是同一临时文件名的话,那就会产生不可预料的结果!我之所以认为这个脚本慢的原因就是,取文件头的时候,要过一遍整个文件,去除文件头又要过一遍,加换行符时又要过一遍,一共是三遍!!要是谁有更好的方法,请不吝赐教!

wy2k@sina.com

标签: