没有后缀名的文档如何识别?我已经知道可以根据头文件来识别一些文件了,例如zip,rar,xml这些单一的!但是像大家最常用的office,word和excel的头信息是一样的怎么办?望高手指点一二!谢谢!

解决方案 »

  1.   

    word和excel是可以的,但是如果这个文件格式没有头信息就不行。这样识别文件没有任何意义,而且也不可能准确。同一个文件在不同的应用环境下完全可以是不同的文件,做不同的作用。我写一个xml文件,你可以认为它是一个xml文件,我同样也可以认为只是一个普通的文本文件。
      

  2.   

    我是这么去想这个问题的 操作系统在不知道文件类型的前提下是无法打开任何一个文件的 最直接的一个例子就是如果你把word的后缀名由doc改成do,那么操作系统就傻了。但是,如果你尝试通过字节流去打开do这个文件,读取16位的文件头,发现它是个office文件,我想这已经是一个进步了,再想进一步识别,我想得请教高人word和excel到底在编码上有什么不同了 
      

  3.   

    我已经能通过读取流的来识别它是何种文件,主要是office的一套东西的头信息都是一样的,就看有没有其他的信息能区分开始word或者excel!
      

  4.   

    在详细说下就是,跟据2楼的说的,按照头能识别一些文件了,但是office得东西,所有的都是一样的头,不知道里面还有没有区别,因为我必须的判断出是什么文件,才能对应得来解析它的内容!