Java解析xml文件遇到特殊符號&會出現異常的解決方案
文/朱季謙
在一次Java解析xml文件的開發過程中,使用SAX解析時,出現了這樣一個異常資訊:
Error on line 60 of document : 對實體 "xxx" 的引用必須以 ';' 分隔符結尾;
我打開xml文件後,發現該「xxx”符號之前跟著一個」&「符號,後來了解到,這類符號在xml里屬於一種特殊符號,而特殊符號若沒用轉義符表示,直接用到xml文件里,就會在使用SAX等方式做解析時出現奇怪的異常。
其實,這都是因為這些特殊字元造成的。
XML當中特殊符號包括< > & ‘ “等,它們是不允許作為xml文件的PCDATA,若想使用話,需用轉義符代替:
< <
> >
& &
" "
' '
那麼,若要正常讀取xml文件數據,應該如何使用轉義符替換呢?
實現思路其實很簡單,我們可以在使用SAX解析前,先把xml文件讀取轉換成String字元串,再使用字元串的全部替換方法替換即可:
String xmlStr=s.replaceAll("&","&");
轉換方法程式碼如下:
StringBuffer buffer = new StringBuffer();
BufferedReader bf= new BufferedReader(new FileReader("D:\\測試.xml"));
String s = null;
while((s = bf.readLine())!=null){
buffer.append(s.trim());
}
String str = buffer.toString();
//在這一步進行字元替換,替換成合法轉義字元
String xml=str.replaceAll("&","&");
//這裡就可以將處理過的xml文件進行讀取解析了
Document document = DocumentHelper.parseText(xml);
至此,就可以解決Java解析xml文件遇到特殊符號&會出現異常的問題了。