網友評分: 9.4分
分詞小工具是一款小巧實用的txt文件處理工具,它能將txt上的文字自動分詞并重組,然后生成一份全新的txt文件。操作簡單,功能實用,雖然目前僅支持64位操作系統(tǒng),但仍然受互聯網用戶喜愛。
1、可以將txt文件內的中文自動分詞并重新排版。
2、僅支持64位操作系統(tǒng)。
3、支持txt文本格式。
基于字符串匹配的分詞方法又稱機械分詞方法,它是按照一定的策略將待分析的漢字串與一個“充分大的”機器詞典中的詞條進行配,若在詞典中找到某個字符串,則匹配成功(識別出一個詞)。
按照掃描方向的不同,字符串匹配分詞方法可以分為正向匹配和逆向匹配;按照不同長度優(yōu)先匹配的情況,可以分為最大(最長)匹配和最小(最短)匹配;按照是否與詞性標注過程相結合,可以分為單純分詞方法和分詞與詞性標注相結合的一體化方法。常用的字符串匹配方法有如下幾種:
(1)正向最大匹配法(從左到右的方向);
?。?)逆向最大匹配法(從右到左的方向);
?。?)最小切分(每一句中切出的詞數最?。?;
?。?)雙向最大匹配(進行從左到右、從右到左兩次掃描)
1、點擊“路徑選擇”按鈕,選擇你要分割的txt文件。
2、點擊“一鍵分詞”按鈕。
3、屏幕出現“分詞完成”提示時,在你選取的文件相同目錄下,已生成另一份文件名為“原文件名+( 分詞 版 )”的新txt文件。