问无法读取阿拉伯文本文件的第一个单词
EN

Stack Overflow用户

提问于 2017-07-03 20:36:38

回答 1查看 228关注 0票数 1

我正在使用扫描仪读取一个阿拉伯文件，并将文本文件存储在ArrayList中

我有一本字典，里面有一些单词，正负词和它们的比率。

例如:سعيد+5-4سيء

然后，我用字典检查文本文件中的每个单词，如果这个词是负的，上升是负的，如果是正的，上升是正的，则是正的，然后进行比较，确定该文件是正的还是负的。

它适用于英语，但不适用于阿拉伯语，出于某种原因，它跳过数组中的第一个单词，即使它与“词典”完全匹配；如果我在文本文件开头按Enter键(新行)，它会完美地工作--我尝试向ArrayList添加一条新行，并将文件作为新行的替代，但是它不能工作，必须按Enter Button键来添加。

 for (String word: wordsList) { // loop through user file 

  try { // compare words with dictionary

   String line;
   // read from the Dictionary file 
    File fileDir = new File("C:\\Users\\Ameera\\Desktop\\Dictionary.txt");
            BufferedReader inDict = new BufferedReader(new InputStreamReader(
                    new FileInputStream(fileDir), "utf-8"));

    while ((line = inDict()) != null) {

     String strSplit[] = line.split("\t"); // Split Dictionary line after each tab to get the word only without its rate 
     // example will get (سعيد, سيد) only
     /* سعيد    +5
        سيء         -4
     */

     if (strSplit[0].equals(word)) {


      int rate2 = Integer.parseInt(strSplit[1]); // get word rate  

      sent += rate2; // add word rate to file totoal rate 

     }

    }
   } catch (Exception e) {
    e.printStackTrace();
   }
  }

java

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-07-05 19:12:58

谢谢各位，我真的很感谢你们的回答，我在这里找到了答案(Removing BOM characters using Java)，MC皇帝，非常感谢，问题是因为字节顺序标记。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/44893566

复制

相似问题

问无法读取阿拉伯文本文件的第一个单词
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问无法读取阿拉伯文本文件的第一个单词EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问无法读取阿拉伯文本文件的第一个单词
EN