ApacheTika用于文件類型檢測和從各種格局的文件內(nèi)容提取的庫。
將上傳文件至服務(wù)器,進(jìn)行解析文件時(shí),經(jīng)常需要判別文件是否損壞。咱們能夠運(yùn)用tika來檢測文件是否損壞
maven引進(jìn)如下:
org.apache.tikatika-app1.18xercesxercesImpl2.11.0
如果jar包抵觸時(shí)能夠引進(jìn)如下:
org.apache.tikatika-core1.18org.apache.tikatika-parsers1.18xercesxercesImpl2.11.0
運(yùn)用tika檢測文件是否損壞:
如果從輸入流讀取失敗,則parse辦法拋出IOException反常,從流中獲取的文檔不能被解析拋TikaException反常,處理器不能處理事件則拋SAXException反常
當(dāng)文檔不能被解析時(shí),闡明文檔損壞
履行過程:
publicstaticvoidmain(String[]args){
try{
//Assumesample.txtisinyourcurrentdirectory
Filefile=newFile(“D:\\測驗(yàn).txt”);
booleanresult=isParseFile(file);
}catch(Exceptione){
e.printStackTrace();
}
}
/**
*驗(yàn)證文件是否損壞
*
*@paramfile文件
*@returntrue/false
*@throwsException
*/
privatestaticbooleanisParseFile(Filefile)throwsException{
try{
Tikatika=newTika();
Stringfilecontent=tika.parseToString(file);
System.out.println(filecontent);
returntrue;
}catch(TikaExceptione){
returnfalse;
}
}
廣州天河區(qū)珠江新城富力盈力大廈北塔2706
020-38013166(網(wǎng)站咨詢專線)
400-001-5281 (售后服務(wù)熱線)
深圳市坂田十二橡樹莊園F1-7棟
Site/ http://www.szciya.com
E-mail/ itciya@vip.163.com
品牌服務(wù)專線:400-001-5281
長沙市天心區(qū)芙蓉中路三段398號新時(shí)空大廈5樓
聯(lián)系電話/ (+86 0731)88282200
品牌服務(wù)專線/ 400-966-8830
旗下運(yùn)營網(wǎng)站:
Copyright ? 2016 廣州思洋文化傳播有限公司,保留所有權(quán)利。 粵ICP備09033321號