忘记贴代码了
File file = _file;
        
        try{
        Metadata metadata = new Metadata();
        Parser parser = new AutoDetectParser();
        FileInputStream is = null;
        ContentHandler contenthandler = new BodyContentHandler();
        
        
                is = new FileInputStream(_file);
         parser.parse(is, contenthandler, metadata);
        
        // System.out.println(_file+ "\t"+ CreateDate +"\t"+ metadata.get(Metadata.AUTHOR) );
         
         BufferedWriter rw = new BufferedWriter(new FileWriter("C:\\Documents and Settings\\sp\\Desktop\\files\\test.txt",true));
         rw.write(_file + "\t"+ CreateDate +"\t"+ metadata.get(Metadata.AUTHOR));
         rw.newLine();
         //rw.flush();
         
         rw.close();
         
        }
        catch(Exception e){
        }

解决方案 »

  1.   

    你好,今天在csdn里面才看到你这个问题。我认为有这么几个解决问题的方法:
    1、你的疑问是可以通过查看Tika的源码的啊
    2、你可以通过metadata.Names属性查看所需要的数据时否为空,如果为空的话你可以做特殊处理就行了啊
    3、我现在操作的Tika版本也比较老了1.0版本的,但是里面Parser只有一个带有4个参数的parse函数啊
    我的回答不知道对你是否有帮助