发信人: Roka (好大的棉花糖), 信区: Java 标 题: 利用JAVA操作EXCEL文件 发信站: BBS 水木清华站 (Thu Feb 6 11:06:49 2003), 转信 2003 年 1 月 使用Windows操作系统的朋友对Excel(电子表格)一定不会陌生,但是要使用 Java语言来操纵Excel文件并不是一件容易的事。在Web应用日益盛行的今天,通过 Web来操作Excel文件的需求越来越强烈,目前较为流行的操作是在JSP或Servlet 中创建一个CSV (comma separated values)文件,并将这个文件以MIME, text/csv类型返回给浏览器,接着浏览器调用Excel并且显示CSV文件。这样只是说 可以访问到Excel文件,但是还不能真正的操纵Excel文件,本文将给大家一个惊喜 ,向大家介绍一个开放源码项目,Java Excel API,使用它大家就可以方便地操纵 Excel文件了。 JAVA EXCEL API简介 Java Excel是一开放源码项目,通过它Java开发人员可以读取Excel文件的内容、 创建新的Excel文件、更新已经存在的Excel文件。使用该API非Windows操作系统也 可以通过纯Java应用来处理Excel数据表。因为是使用Java编写的,所以我们在 Web应用中可以通过JSP、Servlet来调用API实现对Excel数据表的访问。 现在发布的稳定版本是V2.0,提供以下功能: 从Excel 95、97、2000等格式的文件中读取数据; 读取Excel公式(可以读取Excel 97以后的公式); 生成Excel数据表(格式为Excel 97); 支持字体、数字、日期的格式化; 支持单元格的阴影操作,以及颜色操作; 修改已经存在的数据表; 现在还不支持以下功能,但不久就会提供了: 不能够读取图表信息; 可以读,但是不能生成公式,任何类型公式最后的计算值都可以读出; 应用示例 1 从Excel文件读取数据表 Java Excel API既可以从本地文件系统的一个文件(.xls),也可以从输入流中读取 Excel数据表。读取Excel数据表的第一步是创建Workbook(术语:工作薄),下面的 代码片段举例说明了应该如何操作:(完整代码见ExcelReading.java) import java.io.*; import jxl.*; … … … … try { //构建Workbook对象, 只读Workbook对象 //直接从本地文件创建Workbook //从输入流创建Workbook InputStream is = new FileInputStream(sourcefile); jxl.Workbook rwb = Workbook.getWorkbook(is); } catch (Exception e) { e.printStackTrace(); } 一旦创建了Workbook,我们就可以通过它来访问Excel Sheet(术语:工作表)。参 考下面的代码片段: //获取第一张Sheet表 Sheet rs = rwb.getSheet(0); 我们既可能通过Sheet的名称来访问它,也可以通过下标来访问它。如果通过下标 来访问的话,要注意的一点是下标从0开始,就像数组一样。 一旦得到了Sheet,我们就可以通过它来访问Excel Cell(术语:单元格)。参考下 面的代码片段: //获取第一行,第一列的值 Cell c00 = rs.getCell(0, 0); String strc00 = c00.getContents(); //获取第一行,第二列的值 Cell c10 = rs.getCell(1, 0); String strc10 = c10.getContents(); //获取第二行,第二列的值 Cell c11 = rs.getCell(1, 1); String strc11 = c11.getContents(); System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " + c00.getType()); System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " + c10.getType()); System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " + c11.getType()); 如果仅仅是取得Cell的值,我们可以方便地通过getContents()方法,它可以将任 何类型的Cell值都作为一个字符串返回。示例代码中Cell(0, 0)是文本型, Cell(1, 0)是数字型,Cell(1,1)是日期型,通过getContents(),三种类型的返回 值都是字符型。 如果有需要知道Cell内容的确切类型,API也提供了一系列的方法。参考下面的代 码片段: String strc00 = null; double strc10 = 0.00; Date strc11 = null; Cell c00 = rs.getCell(0, 0); Cell c10 = rs.getCell(1, 0); Cell c11 = rs.getCell(1, 1); if(c00.getType() == CellType.LABEL) { LabelCell labelc00 = (LabelCell)c00; strc00 = labelc00.getString(); } if(c10.getType() == CellType.NUMBER) { NmberCell numc10 = (NumberCell)c10; strc10 = numc10.getValue(); } if(c11.getType() == CellType.DATE) { DateCell datec11 = (DateCell)c11; strc11 = datec11.getDate(); } System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " + c00.getType()); System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " + c10.getType()); System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " + c11.getType()); 在得到Cell对象后,通过getType()方法可以获得该单元格的类型,然后与API提供 的基本类型相匹配,强制转换成相应的类型,最后调用相应的取值方法getXXX(), 就可以得到确定类型的值。API提供了以下基本类型,与Excel的数据格式相对应, 如下图所示: 每种类型的具体意义,请参见Java Excel API Document。 当你完成对Excel电子表格数据的处理后,一定要使用close()方法来关闭先前创建 的对象,以释放读取数据表的过程中所占用的内存空间,在读取大量数据时显得尤 为重要。参考如下代码片段: //操作完成时,关闭对象,释放占用的内存空间 rwb.close(); Java Excel API提供了许多访问Excel数据表的方法,在这里我只简要地介绍几个 常用的方法,其它的方法请参考附录中的Java Excel API Document。 Workbook类提供的方法 1. int getNumberOfSheets() 获得工作薄(Workbook)中工作表(Sheet)的个数,示例: jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile)); int sheets = rwb.getNumberOfSheets(); 2. Sheet[] getSheets() 返回工作薄(Workbook)中工作表(Sheet)对象数组,示例: jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile)); Sheet[] sheets = rwb.getSheets(); 3. String getVersion() 返回正在使用的API的版本号,好像是没什么太大的作用。 jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile)); String apiVersion = rwb.getVersion(); Sheet
我去看看原文~
不过现在我改用ACCESS和EXCEL结合编辑数据了,那样的话读出和编辑也很方便。
如果用POI,只可以拿到cell的value,如果cell是一个日期,你就惨了,Excel认为日期是一个double number.那么,你把它当number拿出来,没法知道他是日期还是数字。
如果用JXL,可以拿到excel cell的displayed context in String always.看上去很方便。但是,有没有人试过输入0.0001并且不format cell.用getContent()拿到的是"0".因为Excel没有format the cell,那么poi会用它的default DecimalFormat pattern, "#.###"这样就中刀了。POI and JXL都是为Excel97写的,但是谁还用office97呢?我最受不了的是JXL用Colour而不是color,像是印度人写的。