SEANLPçŽĺć䝼ä¸ĺč˝ďź
-
ćł°čŻďź
- TCCďźThai Character Clusterďźĺĺ
- éłčĺĺ
- ĺąĺ ćĄäťśéćşĺşĺčŻ
- ĺĺąćĄäťśéćşĺşĺčŻ
- čŻĺ ¸ćéĺčŻ
- čŻĺ ¸ćŁĺćéżĺšé ĺčŻ
- čŻĺ ¸éĺćéżĺšé ĺčŻ
- čŻĺ ¸ćŁĺćçĺšé ĺčŻ
- čŻĺ ¸éĺćçĺšé ĺčŻ
- čŻć§ć 注
- ĺĽĺç¸äźźĺşŚčŽĄçŽ
- ĺ łéŽčŻć˝ĺ
- čŞĺ¨ćčŚ
-
čśĺčŻďź
- ćĄäťśéćşĺşĺčŻ
- čŻĺ ¸ćéĺčŻ
- čŻĺ ¸ćŁĺćéżĺšé ĺčŻ
- čŻĺ ¸éĺćéżĺšé ĺčŻ
- čŻĺ ¸ćŁĺćçĺšé ĺčŻ
- čŻĺ ¸éĺćçĺšé ĺčŻ
- čŻć§ć 注
- ĺĽĺç¸äźźĺşŚčŽĄçŽ
- ĺ łéŽčŻć˝ĺ
- čŞĺ¨ćčŚ
-
ćŹĺ寨čŻďźéŤćŁčŻďźďź
- KCCĺĺ
- ćĄäťśéćşĺşĺčŻ
- čŻĺ ¸ćéĺčŻ
- čŻĺ ¸ćŁĺćéżĺšé ĺčŻ
- čŻĺ ¸éĺćéżĺšé ĺčŻ
- čŻĺ ¸ćŁĺćçĺšé ĺčŻ
- čŻĺ ¸éĺćçĺšé ĺčŻ
- čŻć§ć 注
- ĺĽĺç¸äźźĺşŚčŽĄçŽ
- ĺ łéŽčŻć˝ĺ
- čŞĺ¨ćčŚ
-
čćčŻďź
- čŻĺ ¸ćéĺčŻ
- čŻĺ ¸ćŁĺćéżĺšé ĺčŻ
- čŻĺ ¸éĺćéżĺšé ĺčŻ
- čŻĺ ¸ćŁĺćçĺšé ĺčŻ
- čŻĺ ¸éĺćçĺšé ĺčŻ
- čŻć§ć 注
- ĺĽĺç¸äźźĺşŚčŽĄçŽ
- ĺ łéŽčŻć˝ĺ
- čŞĺ¨ćčŚ
-
çź ç¸čŻďź
- éłčĺĺ
- ćĄäťśéćşĺşĺčŻ
- čŻĺ ¸ćéĺčŻ
- čŻĺ ¸ćŁĺćéżĺšé ĺčŻ
- čŻĺ ¸éĺćéżĺšé ĺčŻ
- čŻĺ ¸ćŁĺćçĺšé ĺčŻ
- čŻĺ ¸éĺćçĺšé ĺčŻ
- ĺĽĺç¸äźźĺşŚčŽĄçŽ
-
äťäšćŻTCC (Thai Character Cluster)ďźĺç¨Wittawat JitkrittumçĺŚä¸ç§TCCĺĺĺŽç°ä¸ç解éďźproposed in Character Cluster Based Thai Information Retrieval is a group of inseparable Thai characters. This inseparability derives from Thai writing system which is independent of any context. As a result, TCC can be determined by a simple list of rules describing e.g., what characters need to follow/precede other characters.
-
ćł°čŻTCCĺéŤćŁčŻKCCĺĺ使ç¨
č§ĺ+ćŁĺ襨螞ĺź
ĺŽç°ďźćçčžä˝ďźćł°čŻTCCĺĺĺŻĺčWittawat JitkrittumçĺŚä¸ç§ĺŽç°ă -
ćł°čŻĺĺąćĄäťśéćşĺşĺčŻć¨ĄĺćŻĺąĺ ćĄäťśéćşĺşĺčŻć¨Ąĺ大ĺžĺ¤ďźéčŚĺžĺ¤§çĺ ĺćč˝čżčĄďź
-Xmx>2G
ďźă -
çź ç¸čŻéłčĺĺč˝ä¸ďźçąäşéłččŻĺ ¸ä¸ĺĺ¨ä¸ĺççźç ĺĺĺşďźä¸ĺççźç ĺĺĺşäšŚĺ饺ĺşĺĺ¨ĺşĺŤďźćç¨çź ç¸čŻéłčĺĺçŽĺĺşćŹä¸č˝ç¨ă
-
çź ç¸čŻć˛ĄćčŻć§ć 注ĺč˝ďźććçź ç¸čŻĺ łéŽčŻć˝ĺäšĺĺ¨éŽé˘ă
-
ĺčŻä¸ĺąĺ ćĄäťśéćşĺşććć弽ďźćçĺšé ĺčŻććć塎ă
-
ĺç¨čŻä¸ĺ¤ĺ ¨ďźä¸ťčŚĺ ĺŤäşćł°čŻĺčśĺčŻçĺç¨čŻă
ĺŻäťĽčŞĺˇąćĽä¸č˝˝ćŹéĄšçŽćşç čżčĄćĺ
wget https://github.com/zhaoshiyu/SEANLP/archive/master.zip
unzip master.zip
cd SEANLP-master
mvn clean package -Dmaven.test.skip=true
ćč git clonećŹéĄšçŽďź
git clone https://github.com/ZhaoShiyu/SEANLP.git
cd SEANLP
mvn clean package -Dmaven.test.skip=true
注ćďźć¤ĺ¤ä¸č˝˝çćşç ä¸ä¸ĺ ĺŤćł°čŻĺĺąćĄäťśéćşĺşĺčŻć¨ĄĺďźéčŚĺŽć´ć¨Ąĺ诡ç¨ćšćłäşă
ä¸č˝˝SEANLP-1.1.0.jar, ćč 使ç¨seanlp-1.1.0-sources.jarä¸ç樥ĺă
SEANLPććçĺč˝é˝ĺŻäťĽéčżĺˇĽĺ
ˇçąťSEANLP
čżčĄč°ç¨ăč°ç¨ć źĺźä¸şSEANLP.čŻč¨.ĺč˝
ă
ĺĺąćĄäťśéćşĺşćł°čŻĺčŻć¨Ąĺĺžĺ¤§ďźéčŚ-Xmx>2G
demoĺŻäťĽĺčä¸ĺä˝ç˝Žďź
1. ĺčŻĺčŻć§ć 注
2. ĺĽĺç¸äźźĺşŚčŽĄçŽ
3. ĺ
łéŽčŻć˝ĺĺčŞĺ¨ćčŚ
package cn.edu.kmust.seanlp.demo;
import cn.edu.kmust.seanlp.SEANLP;
/**
* ĺčŻdemo
* @author Zhao Shiyu
*
*/
public class SegmentDemo {
public static void main(String[] args) {
//ćł°čŻĺčŻ
String thText = "ŕ¸ŕ¸§ŕ¸˛ŕ¸Ąŕ¸Şŕ¸ąŕ¸Ąŕ¸ŕ¸ąŕ¸ŕ¸ŕšŕšŕ¸ŕ¸ŕ¸˛ŕ¸ŕšŕ¸¨ŕ¸Łŕ¸Šŕ¸ŕ¸ŕ¸´ŕ¸ŕ¸ŕ¸ąŕ¸ŕ¸Łŕ¸°ŕ¸ŕ¸ŕ¸ŕ¸§ŕ¸˛ŕ¸Ąŕ¸Şŕ¸ąŕ¸Ąŕ¸ŕ¸ąŕ¸ŕ¸ŕšŕ¸ŕ¸˛ŕ¸ŕ¸ŕ¸ŕ¸Ťŕ¸Ąŕ¸˛ŕ¸˘";
System.out.println(SEANLP.Thai.syllableSegment(thText));
System.out.println(SEANLP.Thai.dCRFSegment(thText));
//System.out.println(SEANLP.Thai.gCRFSegment(thText));
System.out.println(SEANLP.Thai.datSegment(thText));
System.out.println(SEANLP.Thai.maxSegment(thText));
System.out.println(SEANLP.Thai.minSegment(thText));
System.out.println(SEANLP.Thai.reMaxSegment(thText));
System.out.println(SEANLP.Thai.reMinSegment(thText));
//čśĺčŻĺčŻ
String viText = "Háť tháťng tĂn d᝼ng - ngân hĂ ng cĹŠng tÄng trĆ°áťng khĂĄ, ngĂ y cĂ ng giᝯ vai trò quan tráťng trong cĆĄ cẼu kinh táşż Thᝧ ÄĂ´.";
System.out.println(SEANLP.Vietnamese.crfSegment(viText));
System.out.println(SEANLP.Vietnamese.datSegment(viText));
System.out.println(SEANLP.Vietnamese.maxSegment(viText));
System.out.println(SEANLP.Vietnamese.minSegment(viText));
System.out.println(SEANLP.Vietnamese.reMaxSegment(viText));
System.out.println(SEANLP.Vietnamese.reMinSegment(viText));
//ćŹĺ寨čŻďźéŤćŁčŻďźĺčŻ
String khText = "ááśááťááˇáááˇáááśáááááááááśáááá áááááážá˘áááááśáááśáááˇááááˇáááťááááá
áááááťááśááááśáááśááááááááá˘áááážááśáááážáá˘ááááááá";
System.out.println(SEANLP.Khmer.crfSegment(khText));
System.out.println(SEANLP.Khmer.datSegment(khText));
System.out.println(SEANLP.Khmer.maxSegment(khText));
System.out.println(SEANLP.Khmer.minSegment(khText));
System.out.println(SEANLP.Khmer.reMaxSegment(khText));
System.out.println(SEANLP.Khmer.reMinSegment(khText));
//čćčŻĺčŻ
String loText = "ŕşŕťŕş˛ŕşŕş§ŕş´ŕşŕťŕşŕşąŕşŕťŕşŕşąŕşŕşŕş°ŕşŕş˛ŕşŕşŕťŕşĽŕş´ŕşŞŕşąŕşŕşŕş˝ŕş§ŕťŕşŕşľŕş§ŕşľŕťŕşŕşľŕťŕşŕş.ວ຾.ŕşŕş¸ŕťŕşĄŕşŕťŕşĽŕş´ŕşŞŕşąŕşŕşŕş˛ŕşŕşŕş´ŕşĄŕşŕşŕşŕşŕş˛ŕş§ŕşŕşąŕş.";
System.out.println(SEANLP.Lao.datSegment(loText));
System.out.println(SEANLP.Lao.maxSegment(loText));
System.out.println(SEANLP.Lao.minSegment(loText));
System.out.println(SEANLP.Lao.reMaxSegment(loText));
System.out.println(SEANLP.Lao.reMinSegment(loText));
//çź
ç¸čŻĺčŻ
String buText = "ááśáááŻá¸ááśááŹááŹááśáááŻááşááśááááŻááśáážááŻá¸ááąáŹáş";
System.out.println(SEANLP.Burmese.datSegment(buText));
System.out.println(SEANLP.Burmese.maxSegment(buText));
System.out.println(SEANLP.Burmese.minSegment(buText));
System.out.println(SEANLP.Burmese.reMaxSegment(buText));
System.out.println(SEANLP.Burmese.reMinSegment(buText));
System.out.println(SEANLP.Burmese.syllableSegment(buText));
}
}
package cn.edu.kmust.seanlp.demo;
import cn.edu.kmust.seanlp.SEANLP;
/**
* ĺĽĺç¸äźźĺşŚčŽĄçŽdemo
* @author Zhao Shiyu
*
*/
public class SimilarityDemo {
public static void main(String[] args) {
String thText = "ŕ¸ŕ¸§ŕ¸˛ŕ¸Ąŕ¸Şŕ¸ąŕ¸Ąŕ¸ŕ¸ąŕ¸ŕ¸ŕšŕšŕ¸ŕ¸ŕ¸˛ŕ¸ŕšŕ¸¨ŕ¸Łŕ¸Šŕ¸ŕ¸ŕ¸´ŕ¸ŕ¸ŕ¸ąŕ¸ŕ¸Łŕ¸°ŕ¸ŕ¸ŕ¸ŕ¸§ŕ¸˛ŕ¸Ąŕ¸Şŕ¸ąŕ¸Ąŕ¸ŕ¸ąŕ¸ŕ¸ŕšŕ¸ŕ¸˛ŕ¸ŕ¸ŕ¸ŕ¸Ťŕ¸Ąŕ¸˛ŕ¸˘";
String viText = "Háť tháťng tĂn d᝼ng - ngân hĂ ng cĹŠng tÄng trĆ°áťng khĂĄ, ngĂ y cĂ ng giᝯ vai trò quan tráťng trong cĆĄ cẼu kinh táşż Thᝧ ÄĂ´.";
String khText = "ááśááťááˇáááˇáááśáááááááááśáááá áááááážá˘áááááśáááśáááˇááááˇáááťááááá
áááááťááśááááśáááśááááááááá˘áááážááśáááážáá˘ááááááá";
String loText = "ŕşŕťŕş˛ŕşŕş§ŕş´ŕşŕťŕşŕşąŕşŕťŕşŕşąŕşŕşŕş°ŕşŕş˛ŕşŕşŕťŕşĽŕş´ŕşŞŕşąŕşŕşŕş˝ŕş§ŕťŕşŕşľŕş§ŕşľŕťŕşŕşľŕťŕşŕş.ວ຾.ŕşŕş¸ŕťŕşĄŕşŕťŕşĽŕş´ŕşŞŕşąŕşŕşŕş˛ŕşŕşŕş´ŕşĄŕşŕşŕşŕşŕş˛ŕş§ŕşŕşąŕş.";
String buText = "ááśáááŻá¸ááśááŹááŹááśáááŻááşááśááááŻááśáážááŻá¸ááąáŹáş";
System.out.println(SEANLP.Thai.sentenceSimilarity(thText, thText));
System.out.println(SEANLP.Vietnamese.sentenceSimilarity(viText, viText));
System.out.println(SEANLP.Khmer.sentenceSimilarity(khText, khText));
System.out.println(SEANLP.Lao.sentenceSimilarity(loText, loText));
System.out.println(SEANLP.Burmese.sentenceSimilarity(buText, buText));
}
}
package cn.edu.kmust.seanlp.demo;
import cn.edu.kmust.seanlp.SEANLP;
/**
* ĺ
łéŽčŻć˝ĺĺčŞĺ¨ćčŚdemo
* @author Zhao Shiyu
*
*/
public class ExtractDemo {
public static void main(String[] args) {
String thDocument = "ŕ¸ŕ¸ľŕšŕ¸ŕ¸¸ŕšŕ¸ŕ¸ŕ¸§ŕ¸Łŕ¸Łŕ¸°ŕ¸Ąŕ¸ąŕ¸ŕ¸Łŕ¸°ŕ¸§ŕ¸ąŕ¸ŕ¸ŕ¸łŕ¸ŕ¸šŕ¸ŕšŕ¸Ľŕ¸°ŕ¸ŕ¸¤ŕ¸ŕ¸´ŕ¸ŕ¸Łŕ¸Łŕ¸Ąŕšŕ¸ŕ¸ľŕšŕ¸˘ŕ¸§ŕ¸ŕ¸ąŕ¸ŕ¸ŕ¸ąŕ¸ŕ¸Ťŕ¸˛ŕ¸ŕ¸°ŕšŕ¸Ľŕ¸ŕ¸ľŕ¸ŕšŕ¸ŕš \n"
+ "สำŕ¸ŕ¸ąŕ¸ŕ¸ŕšŕ¸˛ŕ¸§ŕšŕ¸Ťŕšŕ¸ŕ¸ŕ¸Łŕ¸°ŕšŕ¸ŕ¸¨ŕ¸ŕ¸ľŕ¸ŕ¸Łŕ¸˛ŕ¸˘ŕ¸ŕ¸˛ŕ¸ŕ¸§ŕšŕ¸˛ ŕ¸ŕ¸˛ŕ¸˘ŕ¸Ťŕ¸ ŕšŕ¸Ťŕ¸Ľŕšŕ¸˘ ŕšŕ¸ŕ¸Šŕ¸ŕ¸ŕ¸Łŕ¸°ŕ¸ŕ¸Łŕ¸§ŕ¸ŕ¸ŕ¸˛ŕ¸Łŕ¸ŕšŕ¸˛ŕ¸ŕ¸ŕ¸Łŕ¸°ŕšŕ¸ŕ¸¨ŕ¸ŕ¸ľŕ¸ŕ¸ŕ¸Ľŕšŕ¸˛ŕ¸§ŕšŕ¸Ąŕ¸ˇŕšŕ¸ŕ¸§ŕ¸ąŕ¸ŕ¸ŕ¸ľŕš 19 ลŕ¸ŕ¸Łŕ¸˛ŕ¸ŕ¸Ąŕ¸§ŕšŕ¸˛ ŕ¸ŕ¸ľŕšŕ¸ŕ¸¸ŕšŕ¸ŕ¸ŕ¸§ŕ¸Łŕ¸ŕ¸ŕ¸ŕ¸łŕ¸ŕ¸Łŕ¸°ŕ¸§ŕ¸ąŕ¸ŕ¸´ŕ¸¨ŕ¸˛ŕ¸Şŕ¸ŕ¸Łŕšŕ¸ŕ¸˛ŕ¸Łŕ¸Łŕ¸¸ŕ¸ŕ¸Łŕ¸˛ŕ¸ŕšŕ¸Ťŕšŕšŕ¸Ąŕšŕ¸ŕ¸˘ŕ¸ł สำŕ¸ŕ¸śŕ¸ŕ¸ŕ¸´ŕ¸ŕ¸ŕ¸˘ŕšŕ¸˛ŕ¸ŕ¸˘ŕ¸´ŕšŕ¸ ŕšŕ¸Ľŕ¸°ŕ¸Łŕ¸°ŕ¸Ąŕ¸ąŕ¸ŕ¸Łŕ¸°ŕ¸§ŕ¸ąŕ¸ŕ¸ŕ¸łŕ¸ŕ¸šŕ¸ŕšŕ¸Ľŕ¸°ŕ¸ŕ¸¤ŕ¸ŕ¸´ŕ¸ŕ¸Łŕ¸Łŕ¸Ąŕšŕ¸ŕ¸ľŕšŕ¸˘ŕ¸§ŕ¸ŕ¸ąŕ¸ŕ¸ŕ¸ąŕ¸ŕ¸Ťŕ¸˛ŕ¸ŕ¸°ŕšŕ¸Ľŕ¸ŕ¸ľŕ¸ŕšŕ¸ŕš \n"
+ "ŕ¸ŕ¸˛ŕ¸˘ŕ¸ŕ¸´ŕ¸ŕšŕ¸ ŕ¸ŕ¸˛ŕšŕ¸ŕ¸° ŕ¸ŕ¸˛ŕ¸˘ŕ¸ŕ¸Łŕ¸ąŕ¸ŕ¸Ąŕ¸ŕ¸ŕ¸Łŕ¸ľŕ¸ŕ¸ľŕšŕ¸ŕ¸¸ŕšŕ¸ŕ¸ŕ¸Ľŕšŕ¸˛ŕ¸§ŕšŕ¸Ąŕ¸ˇŕšŕ¸ŕ¸§ŕ¸ąŕ¸ŕ¸ŕ¸ľŕš 18 ลŕ¸ŕ¸Łŕ¸˛ŕ¸ŕ¸Ąŕ¸§ŕšŕ¸˛ ŕ¸ŕ¸ľŕšŕ¸ŕ¸¸ŕšŕ¸ŕ¸Şŕšŕ¸Şŕšŕšŕ¸ŕ¸ŕ¸˘ŕšŕ¸˛ŕ¸ŕ¸˘ŕ¸´ŕšŕ¸ŕ¸ŕšŕ¸ŕ¸ŕ¸˛ŕ¸Łŕ¸ŕ¸ľŕšŕ¸ŕ¸ľŕ¸ŕ¸Şŕ¸Łŕšŕ¸˛ŕ¸ŕšŕ¸ŕ¸˛ŕ¸°ŕšŕ¸ŕ¸ľŕ¸˘ŕ¸Ąŕ¸ŕ¸Ľŕ¸˛ŕ¸ŕ¸ŕ¸°ŕšŕ¸Ľŕ¸ŕ¸ľŕ¸ŕšŕ¸ŕš ŕšŕ¸Ľŕ¸°ŕ¸ŕ¸ŕ¸Ľŕ¸ŕ¸ŕ¸ŕ¸¸ŕ¸ŕšŕ¸ŕ¸´ŕ¸ŕ¸ŕ¸Łŕ¸ąŕ¸ŕ¸˘ŕ¸˛ŕ¸ŕ¸Łŕ¸ŕ¸ąŕšŕ¸ŕ¸ŕšŕ¸łŕ¸Ąŕ¸ąŕ¸ŕšŕ¸Ľŕ¸°ŕšŕ¸ŕšŕ¸Şŕ¸ŕ¸Łŕ¸Łŕ¸Ąŕ¸ŕ¸˛ŕ¸ŕ¸´ŕšŕ¸ŕ¸ŕ¸°ŕšŕ¸Ľŕ¸ŕ¸ľŕ¸ŕ¸ŕ¸°ŕ¸§ŕ¸ąŕ¸ŕ¸ŕ¸ŕ¸ ŕšŕ¸Łŕ¸ľŕ¸˘ŕ¸ŕ¸Łŕšŕ¸ŕ¸ŕ¸ŕ¸Łŕ¸°ŕ¸ŕ¸˛ŕ¸ŕ¸Ąŕšŕ¸Ľŕ¸ŕšŕ¸Şŕ¸ŕ¸ŕ¸ŕ¸§ŕ¸˛ŕ¸Ąŕšŕ¸Ťŕšŕ¸ŕšŕ¸ŕ¸ľŕšŕ¸˘ŕ¸§ŕ¸ŕ¸ąŕ¸ŕšŕ¸Łŕ¸ˇŕšŕ¸ŕ¸ŕ¸ŕ¸ľŕšŕ¸Ąŕ¸˛ŕ¸ŕ¸ŕ¸śŕšŕ¸ \n"
+ "ŕ¸ŕ¸˛ŕ¸˘ŕ¸Ťŕ¸ ŕšŕ¸Ťŕ¸Ľŕšŕ¸˘ŕ¸ŕ¸Ľŕšŕ¸˛ŕ¸§ŕ¸ŕšŕ¸ŕ¸ŕ¸˛ŕ¸Łŕ¸ŕ¸ľŕšŕ¸§ŕšŕ¸˛ ŕ¸ŕ¸˛ŕ¸Łŕ¸ŕ¸¸ŕ¸ŕšŕ¸ŕ¸´ŕ¸ŕ¸ŕšŕ¸łŕ¸Ąŕ¸ąŕ¸ŕšŕ¸Ľŕ¸°ŕšŕ¸ŕšŕ¸Şŕ¸ŕ¸Łŕ¸Łŕ¸Ąŕ¸ŕ¸˛ŕ¸ŕ¸´ŕ¸ŕ¸ŕ¸ŕ¸ŕ¸ľŕ¸ ฼ŕšŕ¸§ŕ¸ŕ¸ŕ¸Łŕ¸°ŕ¸ŕ¸łŕšŕ¸ŕ¸ŕšŕ¸˛ŕ¸ŕ¸ŕšŕ¸łŕ¸ŕ¸°ŕšŕ¸Ľŕ¸ŕ¸ľŕšŕ¸ŕ¸˘ŕ¸šŕšŕ¸ ายŕšŕ¸ŕšŕ¸ŕ¸˛ŕ¸Łŕ¸ŕ¸§ŕ¸ŕ¸ŕ¸¸ŕ¸Ąŕ¸ŕ¸ŕ¸ŕ¸ŕ¸ľŕ¸ŕšŕ¸ŕ¸ŕšŕ¸ŕ¸˘ŕ¸ŕ¸Łŕ¸˛ŕ¸¨ŕ¸ŕ¸˛ŕ¸ŕ¸ŕšŕ¸ŕ¸ŕ¸ąŕ¸ŕ¸ŕ¸˛ ŕ¸ŕ¸¸ŕ¸ŕ¸Şŕ¸´ŕšŕ¸ŕ¸ŕ¸¸ŕ¸ŕ¸ŕ¸˘ŕšŕ¸˛ŕ¸ŕ¸ŕ¸˘ŕ¸šŕšŕšŕ¸ŕ¸ŕ¸Łŕ¸ŕ¸ŕ¸ŕ¸ŕ¸´ŕ¸ŕšŕ¸ŕ¸˘ŕ¸ŕ¸ŕ¸ŕ¸ŕ¸ľŕ¸ŕšŕ¸ŕ¸ ŕ¸ŕ¸ŕ¸śŕšŕ¸ ŕ¸ŕ¸ľŕ¸ŕ¸ŕ¸Łŕ¸ŕ¸ŕ¸ŕ¸ŕ¸´ŕ¸ŕšŕ¸ŕ¸˘ŕšŕ¸Ťŕ¸ŕ¸ˇŕ¸ŕ¸Ťŕ¸Ąŕ¸šŕšŕšŕ¸ŕ¸˛ŕ¸°ŕ¸Ťŕ¸ŕ¸˛ŕ¸ŕ¸ŕ¸˛ŕšŕ¸Ľŕ¸°ŕ¸ŕšŕ¸˛ŕ¸ŕ¸ŕšŕ¸łŕ¸ŕ¸°ŕšŕ¸Ľŕšŕ¸ŕ¸˘ŕ¸Łŕ¸ŕ¸ŕ¸ŕ¸˘ŕšŕ¸˛ŕ¸ŕ¸Ąŕ¸´ŕ¸ŕ¸˛ŕ¸ŕšŕ¸ŕšŕšŕ¸˘ŕšŕ¸ŕšŕ¸ŕš";
String viDocument = "Äấi háťi lần thᝊ XII cᝧa Äảng háťp phiĂŞn trĂš báť"
+ "NDÄT- SĂĄng 20-1, Äấi háťi Äấi biáťu toĂ n quáťc lần thᝊ XII cᝧa Äảng háťp phiĂŞn trĂš báť, hoĂ n tẼt cĂ´ng tĂĄc chuẊn báť cần thiáşżt cho phiĂŞn khai mấc sáş˝ diáť
n ra vĂ o 8 giáť sĂĄng 21-1."
+ "Máť Äầu phiĂŞn háťp trĂš báť, Äáťng chĂ LĂŞ Háťng Anh, ᝌy viĂŞn Báť ChĂnh tráť, ThĆ°áťng tráťąc Ban BĂ thĆ° Trung Ć°ĆĄng Äảng tuyĂŞn báť lĂ˝ do."
+ "Äáťng chĂ TrĆ°ĆĄng TẼn Sang, ᝌy viĂŞn Báť ChĂnh tráť, Chᝧ táťch nĆ°áťc Äiáťu khiáťn phiĂŞn háťp. Tiáşżp ÄĂł, Chᝧ táťch nĆ°áťc TrĆ°ĆĄng TẼn Sang xin Ă˝ kiáşżn Äấi háťi thĂ´ng qua chĆ°ĆĄng trĂŹnh phiĂŞn háťp trĂš báť, thĂ´ng qua Quy cháşż lĂ m viáťc cᝧa Äấi háťi."
+ "Äấi háťi ÄĂŁ hoĂ n thĂ nh cĂĄc phần viáťc quan tráťng gáťm: bầu ÄoĂ n Chᝧ táťch, ÄoĂ n thĆ° kĂ˝, Ban thẊm tra tĆ° cĂĄch Äấi biáťu, thĂ´ng qua chĆ°ĆĄng trĂŹnh lĂ m viáťc cᝧa Äấi háťi, thĂ´ng qua Quy cháşż bầu cáť cᝧa Äấi háťi vĂ thĂ´ng qua BĂĄo cĂĄo thẊm tra tĆ° cĂĄch Äấi biáťu."
+ "Buáťi chiáťu, cĂĄc Äấi biáťu nghiĂŞn cᝊu tĂ i liáťu tấi ÄoĂ n."
+ "NgĂ y mai 21-1, Äấi háťi Äấi biáťu toĂ n quáťc lần thᝊ XII cᝧa Äảng khai mấc tấi Trung tâm Háťi ngháť quáťc gia, HĂ Náťi. Äấi háťi tiáşżn hĂ nh tᝍ ngĂ y 21 Äáşżn 28-1-2016, cĂł nhiáťm v᝼ ÄĂĄnh giĂĄ viáťc tháťąc hiáťn Ngháť quyáşżt Äấi háťi XI cᝧa Äảng vĂ nhĂŹn lấi chạng ÄĆ°áťng 30 nÄm Äáťi máťi ÄẼt nĆ°áťc; thảo luáşn, thĂ´ng qua BĂĄo cĂĄo ChĂnh tráť cᝧa Ban ChẼp hĂ nh Trung Ć°ĆĄng khĂła XI; cĂĄc bĂĄo cĂĄo: ÄĂĄnh giĂĄ káşżt quả tháťąc hiáťn nhiáťm v᝼ phĂĄt triáťn kinh táşż- xĂŁ háťi nÄm nÄm 2011-2015 vĂ phĆ°ĆĄng hĆ°áťng nhiáťm v᝼ phĂĄt triáťn kinh táşż- xĂŁ háťi nÄm nÄm 2016- 2020; kiáťm Äiáťm sáťą lĂŁnh Äấo, cháť Äấo cᝧa Ban ChẼp hĂ nh Trung Ć°ĆĄng khĂła XI; táťng káşżt thi hĂ nh Äiáťu láť Äảng khĂła XI vĂ Äáť xuẼt báť sung, sáťa Äáťi (náşżu cĂł); viáťc tháťąc hiáťn Ngháť quyáşżt T.ĆŻ 4 khĂła XI váť xây dáťąng Äảng. Äấi háťi bầu Ban ChẼp hĂ nh Trung Ć°ĆĄng khĂła XII. Chᝧ Äáť cᝧa Äấi háťi lĂ TÄng cĆ°áťng xây dáťąng Äảng trong sấch, vᝯng mấnh; phĂĄt huy sᝊc mấnh toĂ n dân táťc vĂ dân chᝧ xĂŁ háťi chᝧ nghÄŠa; ÄẊy mấnh toĂ n diáťn, Äáťng báť cĂ´ng cuáťc Äáťi máťi; bảo váť vᝯng chắc Táť quáťc, giᝯ vᝯng mĂ´i trĆ°áťng hòa bĂŹnh, áťn Äáťnh; phẼn ÄẼu sáťm ÄĆ°a nĆ°áťc ta cĆĄ bản tráť thĂ nh nĆ°áťc cĂ´ng nghiáťp theo hĆ°áťng hiáťn Äấi."
+ "Tham dáťą Äấi háťi XII cĂł 1510 Äấi biáťu, Äấi diáťn cho hĆĄn 4,5 triáťu Äảng viĂŞn, trong ÄĂł Äấi biáťu ÄĆ°ĆĄng nhiĂŞn cĂł 197 Äáťng chĂ là ᝌy viĂŞn Trung Ć°ĆĄng chĂnh thᝊc vĂ dáťą khuyáşżt khĂła XI; 1300 Äấi biáťu Äưᝣc bầu tấi cĂĄc Äấi háťi Äảng báť tráťąc thuáťc Trung Ć°ĆĄng; 13 Äấi biáťu cháť Äáťnh. CĂ´ng tĂĄc chuẊn báť Äấi háťi ÄĂŁ Äưᝣc Ban ChẼp hĂ nh Trung Ć°ĆĄng, tráťąc tiáşżp lĂ Báť ChĂnh tráť, Ban BĂ thĆ° cháť Äấo chạt cháş˝, Äáşżn nay ÄĂŁ hoĂ n tẼt.";
String loDocument = "ŕşŕş°ŕşŕş˛ŕşâŕşŕş°âŕťŕşŕşâŕşŕşľŕşâŕťŕşĽŕşľŕťâລຢŕťŕş˝ŕşĄŕş˘ŕş˛ŕşĄâŕşŕş˛âŕşŕş¸âŕşŕş´ŕşŕşŕş˛ŕşŁŕşąŕşŕşŕşľ \n"
+ "ŕťŕş§ŕşĽŕş˛ 13:35 âŕťŕşĄŕşâŕşŕşŕşâວູŕşâŕşŕşľ 19 ລູŕşŕşŕşŕşâŕşŕşľŕťâŕşŕş˛ŕşĄâŕťŕş§ŕşĽŕş˛âŕşŕťŕşŕşâŕşŕş´ŕťŕş, ŕşŕťŕş˛ŕşâ ສ຾âŕşŕşľŕťâŕşŕşŕş´âŕş ŕşŕş°ŕşŕş˛ŕşâŕşŕş°âŕťŕşŕşâŕşŕşľŕşâŕťŕşŕťâŕťŕşŕşľŕşŕşŕş˛ŕşâŕťŕşâຎŕşŕşâສະŕťŕş˛ŕşĄâŕşŕş´ŕşâສາŕşŕşťŕşŕşŕş°ŕşŞŕşąŕşâŕşŕş˛âŕťŕşĽŕşąŕşâŕşŕşľŕťâŕşŕş°ŕşŕşŕşŕşŤŕşźŕş§ŕşŕşĽŕşľâŕşŕşąŕşâŕşŕťŕş§ŕşâŕşŕşťŕşâŕşŕş´âŕťŕşŞŕş âŕťŕşŕşˇŕťŕşâຢŕťŕş˝ŕşĄŕş˘ŕş˛ŕşĄâŕşŕş˛âŕşŕş¸âŕşŕş´ŕşŕşŕş˛ŕşŁŕşąŕşŕşŕşľŕşŕş˛âŕşŕşĽŕşąŕşŕşŕş°ŕşŕş´ŕş. \n"
+ "ŕşŕťŕş˛ŕş ສ຾âŕşŕş´ŕťŕşŕşŕş´âŕş ŕşŕşľŕťâŕşŕşŕşâວŕťŕş˛, ŕşŕş˛âŕşŕş¸âŕşŕş´ŕşŕşŕş˛ŕşŁŕşąŕşŕşŕşľâŕťŕşĄŕťŕşâŕşŕş°âŕťŕşŕşâŕşŕş˛ŕşŁŕşąŕşâŕťŕşĽŕş°âŕşŕş´ŕşŞŕşĽŕş˛ŕşĄâŕşŕşľŕťâŕťŕşŤŕşŕť, âŕťŕşĽŕş°âŕşŕťâŕťŕşĄŕťŕşâສະລາâŕşŕş´ŕşŕşŕşľŕťŕşŞŕşłŕşŕşąŕşâŕşŕşŕşâŕşŕş¸ŕťŕşĄ 20 ŕşŕş°âŕťŕşŕş. ŕşŕşąŕşâŕťŕşŕťâŕşŕşľŕşâŕşŕşąŕşâŕşŕş˛âŕşŕş¸âŕşŕş´ŕşŕşŕş˛ŕşŁŕşąŕşŕşŕşľâສŕťŕş˛ŕşŕşŞŕş˛âŕşŕşŕşťŕş§ŕşŕşąŕşâŕşŕş˛ŕşâŕşŕşšŕşâŕşŕşłâŕşŕşąŕşâŕťŕşŕşąŕşâŕťŕş§ŕşĽŕş˛ 26 ŕşŕşľâລາâŕşŕşľŕť, ŕşŕş˛ŕşâŕşŕşťŕş§ŕşŕşąŕşâຼະຍວŕťŕş˛ŕşâສŕşŕşâŕşŕťŕş˛ŕşâŕťŕşŕťâຎູŕşâŕşŕş˛ŕşâŕşŕşąŕşŕşŕş°ŕşŕş˛âŕťŕşŕşâŕşŕťŕş˛ŕş§âŕşŕş°âŕťŕşŕş âŕťŕşŕşâລ຾âŕşŕş§ŕş˛ŕşĄâŕťŕş§ŕťâŕťŕşŕşˇŕťŕşâŕťŕşŕşˇŕťŕşâŕťŕşâŕşŕşąŕşâŕşŕťŕş˛ŕşâŕşŕş˛ŕşâŕťŕşĄŕşˇŕşŕşâŕşŕşąŕşâລມŕťâŕşŕşąŕşâŕťŕşĽŕş´ŕşâŕťŕşŕş´ŕťŕş, ŕşŕş˛ŕşâຎŕťŕş§ŕşĄâລມâŕťŕşâŕşŕş¸ŕşâŕşŕşťŕşâŕťŕşŕşââŕťŕşŕťâຎູŕşâŕťŕş˛ŕşŕşŕşťŕşâŕşŕşľŕťâŕşŕş¸ŕşŕşťŕşĄŕşŞŕşťŕşĄŕşŕşšŕş âŕşŕşąŕşŕťŕşŕťâŕşŕşłŕşĄŕş˛âŕťŕşŕş´ŕťŕşŕşŕş§ŕş˛ŕşĄŕşŕş˛ŕşŞŕş¸ŕşŕşŕşľŕťŕťŕşŤŕşŕťŕşŤŕşźŕş§ŕşâŕťŕşŕťâŕşŕş°ŕşŕş˛ŕşŕşťŕşâສŕşŕşâŕşŕş°âŕťŕşŕş. âŕťŕşâŕťŕşĽŕşŕş°âຢŕťŕş˝ŕşĄŕş˘ŕş˛ŕşĄâŕşŕşąŕťŕşŕşŕşľŕť, ŕşŕťŕş˛ŕşŕş°âŕťŕşŕşťŕťŕş˛ŕşŕş°âຎŕťŕş§ŕşĄâŕşŕşąŕşâສຝລâŕťŕşŕşąŕşâ âŕťŕşĄâຎາລâŕťŕşĄŕşąŕş ŕşŕş´ŕş ŕşŕş˛ââŕťŕşĽŕşľŕşĄŕş˛ŕş âŕťŕşŕşˇŕťŕşâŕťŕşĽŕşŕşŕťŕş˝ŕşâŕşŕş§ŕş˛âລŕşŕş´ŕşâŕťŕşŤŕşąŕşâŕşŕťŕş˝ŕş§âŕşŕşąŕşâŕşŕş˛ŕşâŕşŕşťŕş§ŕşŕşąŕşâສŕşŕşâŕşŕťŕş˛ŕşâŕşŕťŕşŕşĄâŕşŕťŕş§ŕşâŕşŕşąŕşŕşŤŕş˛âສາŕşŕşťŕşâŕťŕşĽŕş°âŕşŕş˛ŕşâŕşŕşˇŕťŕşâŕşŕşľŕťâສຝŕşâŕťŕşŕşŽŕťŕş§ŕşĄâŕşŕşąŕş, âŕťŕşĽŕş°âŕťŕşŕşˇŕťŕşâŕşŕş¸ŕşŕşŕşšŕťâສາŕşâŕşŕşťŕş§ŕşŕşąŕşâລິâŕşŕşŕş°ŕşŕş˛ŕşâŕťŕşĽŕş°âŕşŕş˛ŕşâຎŕťŕş§ŕşĄâລມâຼະຍວŕťŕş˛ŕşâŕşŕşľŕşâ-âŕşŕş˛âŕşŕş¸âŕşŕş´ŕşŕşŕş˛ŕşŁŕşąŕşŕşŕşľâŕťŕşŤŕťâŕşŕşąŕşŕşŕş°ŕşŕş˛âວŕťŕşŕşŕťŕş§âŕťŕşĽŕş°âŕťŕşŤŕşŕťŕşŤŕşźŕş§ŕşâŕşŕş§ŕťŕş˛âŕťŕşŕşťŕťŕş˛. ŕşŕťŕş˛ŕşŕş°âŕťŕşŕşťŕťŕş˛âŕťŕşŕşˇŕťŕşâŕťŕşąŕťŕşŕş§ŕťŕş˛, ŕşŕş˛ŕşâຢŕťŕş˝ŕşĄŕş˘ŕş˛ŕşĄâŕťŕşŕşˇŕťŕşâŕşŕşľŕť ŕşŕş°ââŕťŕşŕşąŕşĄâŕťŕşâŕşŕťŕş§ŕşââŕťŕşĄŕşŕşľâŕşŕş´ŕşâລິŕşŕşŕş°ŕşŕş˛ŕşâŕťŕşĽŕş°âŕťŕş˛ŕşŕşŕşťŕşâŕşŕşľŕťâŕşŕş¸ŕşŕşťŕşĄŕşŞŕşťŕşĄŕşŕşšŕş âŕťŕşŕş´ŕťŕşŕşŕş°âŕşŕťŕş§ŕşâŕşŕş¸ŕşŕşŕşšŕťâŕşŕş˛ŕşâຎŕťŕş§ŕşĄâລມâຼະຍວŕťŕş˛ŕşâສŕşŕşâŕşŕťŕş˛ŕşâŕťŕşâŕşŕş¸ŕşâŕşŕşťâŕşâŕťŕşŕşâŕşŕşśŕťŕşŕşŞŕşšŕťâຼະŕşŕşąŕşâŕťŕťŕť ŕşŕşąŕşâŕşŕş°âລ຾âŕşŕşťŕşâŕşŕşľâŕşŕťŕťâŕşŕş˛ŕşâŕşŕşťŕşâຼະŕşŕşąŕşâŕşŕş˛ŕşâຎŕťŕş§ŕşĄâລມâຼະຍວŕťŕş˛ŕşâŕşŕşľŕşâŕşŕşąŕşŕşŕş°âŕťŕşŕşâສະລາŕşŕş´ŕşâŕťŕşâສະŕşŕş˛âຎŕťŕş§ŕşĄŕşĄŕşˇâŕşŕťŕş˛ŕş§ŕťŕşŕşľâŕťŕşŕşâŕťŕşŤŕťâສບŕşâŕşŕşśŕťŕş. \n"
+ "ຍຟູŕşŕşŕş˛ŕşâສິŕťŕşŕşŞŕş¸ŕşâŕşŕş˛ŕşâຢŕťŕş˝ŕşĄŕş˘ŕş˛ŕşĄâŕşŕş˛âŕşŕş¸âŕşŕş´ŕşŕşŕş˛ŕşŁŕşąŕşŕşŕşľâŕťŕşĽŕťŕş§, ŕşŕťŕş˛ŕş ສ຾âŕşŕş´ŕťŕşŕşŕş´âŕş ŕşŕşąŕşâŕşŕş°âŕťŕşŕşľŕşâŕşŕş˛ŕşâŕťŕşâຢŕťŕş˝ŕşĄŕş˘ŕş˛ŕşĄââŕťŕşŕş˘ŕş´ŕşâŕťŕşĽŕş°âŕşŕşľŕşŁŕş˛ŕşŕşŕş˛ŕşâຼູŕşŕşŕş°ŕşŕş´ŕşŕşŕşˇŕťŕşĄâŕşŕşľŕş. ";
String kmDocument = "á˘ááááâá
ááááâááźáá
\n "
+ "áááĄáťáâááááśáâ á˘á á áŠ-á˘á áĄáŁ âáááááááśáâááááááááśáâáá˝áá
ááá˝áâááááźáâááśáâáááá
áâááźá
ááśâ áááááśáâáááâáááá¸áá¸âááśáá˘ááˇááááâáááááááˇááááśâ ááˇáâááááá
âáááááˇáááááˇâáááááśááâáááážáááśáâáááááááááâááááśáâáááááśááâáááááâ ááˇááááśâ ááááááááśáâáááá¸áá¸âááśááśâááťááśáâáááááá¸âáá
âáááááâááˇááááśâ ááˇáâááśáâáááááá˘âááááááˇáá¸ááˇááááśâáâááááááááâááˇáááášáááśáâááááźááááááâ áážááťáááˇááááśâáááˇáááˇááááśâááˇáâááˇááááśááśáááááâááááźáâááśáâáááá
áâá âááááááˇáá¸âááááˇáâáá¸ááˇáâáá
áá
ááááˇááááśâ ááááááśáâ ááˇáâáááá
áááâááááźáâááśáâá˘ááťáááâ ááˇáâáááááááśáâáááááśáááâáá
âáááááááˇááááśâááááťáâáááá
áâááśâááá
áááá¸âááááśáá \n"
+ "ááśáá
áźáááá âááˇáâááťáááśáâáá
âáááááˇáâáááâááśáâááśááááááááá˝áâááˇá
áá˝á
âá âá˘ááááśâáááá˝áâááááśááâááśáâááá
áťáâ ááˇá
áá˝á
âáááťááááâá˘ááááśâááááááâááśáááˇááááśâááˇáááśáâáááááááá˝áááâá âááˇáááâááśáá
ááážâáááśáâáááážááážáâááâááťáááˇááááśâ ááˇááááśááśáááááâááˇáâá âááááááśáááśâáááááâ ááťáááśáâáá
âáááááˇáâáááâááˇáâááśááâá˘áśá
âááśáááááâááśáâáá
âáĄážáâ áááááśáâááťáááśááâááśáâáááážâáááááâááśáâáááááâááááśááâááśááˇâáá
âááááśáááḠáĄá˘âá âá˘áśá áśááźáááááâááśáâáááááâááśâáááááśááâááááśáâá ááˇáááâááśáâááá˝áâááááśáâáážâááťáááˇááááśâáááˇáááˇááááśâááˇáâááˇááááśááśááááá âáá¸âááááááˇáá¸âááááá˝áâááá¸ááâá˘áźá˘áźáĄáśáááááśáâ ááˇáâááááááˇáá¸âááááá˝áâá˘ááááááśááˇâááááááâáááâá \n"
+ "ááááááááâááśááááááâ ááááśááááśááˇâááááźáâááśáâááśáááąááâá˘ááťááááâááˇáâááśáâáááˇááśâáááááśááâáááážáááśáâá ááśáááááĄáâááááśááááśááˇâáá
âááááśááâáá¸â አâááˇáâáḠâáĄá˘â ááááźáâááśáâá˘ááťááááâááśâáááááśááâá \n"
+ "á
ááá˝áâá˘ááťááˇááááśáááâ ááˇáâááˇááááśáááâááśáâáážááĄážáâá âááśááśâáááááâááˇááááśâáááááźááˇâ áĽá âááśáááâ âááśáâá˘ááˇááááâáá
âááśâááśááśâáááááâááˇááááśâááťááˇáááźááˇâá âáááááááááâááááśáâáá
âáááááâááˇááááśâááááźáâááśáâááááśáâáá
âáááááâááśáááśáḠâáááááâá âááśááśâáááááâááˇááááśâáááâááźááˇâá
ááá˝áâ áĄá¤áĄ âááááťáâáááááâ á¨â ááśáâááááááâááťáááááźáááâá ááááááááâááâááśááááááťááááááśáâááˇáâááˇáááášáááśáâááááźááááááâ ááśááˇáááâááááźááááááâáááááˇáâá˘ááááááźáááááśáâáá
âáááááááááâáááťááááááâááźááˇááśáâ ááˇáâááˇááááśááááśáâááśááˇâá˘ááááâááááťáâááááźáâááśáâááááá¸áâá ááśáááśáâááˇáááášáááśáâáážâááťáááˇááááśâáááˇáááˇááááśâááˇáâááˇááááśááśááááá âááâááááťáâááááá¸áâáááááâá âááśááâááśááśâáááááâááˇááááśâááťááˇáááźááˇâááśááá˘ááâ ááˇáâááśááâááśááśâáááááâááˇááááśâáááâááźááˇâáá˝áâá
ááá˝áâááśáâááá˝áâááśáâáááááâáááá¸áá¸â ááśááááááááááâááˇáâáášáááśáâá áááááśáâááááťáâáá
áá
áááááâááâáááááááááâááááśáâáá
âáááááâááˇááááśâááˇáâáááááśáâ ááśááá˘ááâááśáâááá˝áâááśááááááâ áááá¸áá¸âáááááááśáâááááááˇáá¸ááˇááááśâá ááááááááśáááśááśááťááśááááááá¸ááááźáááśáá˘ááťáááááá
ááśááśá
ááá˝á á¨á˘áŁ (áĽá ,á§á¤ ááśáááâááâááśááśâáááááâááˇááááśâáááááźááˇâ)á \n"
+ "áááá áśâáááááâáááâááśáááťáâááşâ ááśáááááážáâáááááâááááťáááśáâá
áźááááâáá
âáááááááˇááááśâ ááśááááâááááážáâá
ááá˝áâááśááśâáááááâááˇááááśâáááâááźááˇâáąááááśáâáááááááťáâ áááááśááâááˇáááˇááááśáááâáá
âáááááááááťáâ ááááâá ááťáááśáâááááâááˇáááâáááá
ááâááááśáááḠâáĄá˘â ááááźáâáážáâááááááâ ááˇáâáááááâááźáâá
áááááášáâááśáááááááâááááááâ áááááśááâááśáá˘ááááâáá
áá
áááááâ ááˇááááśáá¸áá âááˇáâá§ááááááˇááááśâá âááśááśâáááááâááˇááááśâááśáá
ááážáâ ááśááˇáááâáá
âáááááâááááâááááááśáâááśááťâá
áźáâáááâááśáááťáááśáâááźá
ááśâ ááááźááááááâááśáááťáááˇááááś âáááááśááâááááááâááˇáâááááżáâáááˇááááśáâ ááááá
âááˇááááśáááâ ááááááááˇáááâááˇááááśááśáááááâ ááááááâááťáááááźáááâááˇáâááśááśâ ááˇáâáááˇááááśáâáááááśáááâá ááˇáá¸ááśáááááâááááťáááśáâááááááâááááťáâááááá
áá
áťááááááâá˘ááťááááâááśáááááâ ááśáááááâ á
ááááâááśáâ áááááááâ ááˇáâááśáá
áá
áśáâáâ ááˇáá¸ááśáááááâááśáááááâáá˝áâááááźáâáááá
áźáâááźáâááśáááˇáâ ááˇáâááááśáááˇááśáâá âáááááááśáâááááźááááááâáá˝áâááááźáâááˇááˇáááâááśáááśá ááśááááááâ ááˇáâá˘ááˇááááâááśáááá
áśáâá \n"
+ "ááśáá˘ááááâáá
áá
áááááâááśâááťáááśáâáááá¸âáá˝áâááááťáâ ááááá˝áâ ááˇáâáážáááâááśáâá˘ááťáááâááááááááśáâáááá¸áá¸â ááśáá˘ááááâáá
áá
áááááâá âááááťáâááááááááśáâáááâááśáâáážáâáĄážáâáḠâááśáááááážáâááˇááááśáááâá
ááááâááźáá
âááˇáâ áá
áá
áááááâáá
âáááááâááśáááśáḠâáááááâá ááśááááá
áá
áťááááááâ ááśááśâáááááâááˇááááśâá
ááááááźáá
âááˇáâáá
áá
áááááâá
ááá˝ááá¸áâááááťáâáááážáááśá âááˇáâáááááâááźáâááťáááˇááááśâááááśááâáá˝áâáâ ááˇáááâáááâáááá
ááâááśáááˇááááśâáá
âááśááśâááśáááááâ á˘áśá
âááááśáááśáâááśáâá \n"
+ "ááááááˇáḠâá˘ááááâáá
áá
áááááâáááâááááťáâá˘ááťááááâááśááááá
áá
áťáááááá âááśáâáááááááśáâááśááâááááááááâááťáááśáâáááášáááśáâ ááˇáâááśááťâá
áźáâáááâááśáááťáááśáâá ááááááááâááá˝áááááśááâááˇáâááááááááááśááśááťáááśáâááśááśáááâááˇáâááśááâááśáâááááážáâ ááááâááśááâááááśááááááâáááśáâááááááááá˘ááááâááˇáâáá¸ááááśáâááśáááśáâáá
âááśááááááˇáâ á âááááááááâááááááááá ááááááśáâááˇáâá áˇáááááááááťâááśááśáááâááˇáâááśááâááááážáâá ááśáááśáâá˘ááááâáá
áá
áááááâááááźáâááááááˇáááâáá¸ááááááâáááâá ááááźâá˘ááˇááááâááśá
ááážáâááśáâá
áśááá˘áśááááááâááśááááâáááâááááááˇáá¸áááâá";
String buDocument = "ááşáŹááŹááŹ-ááášáąááŤáášá¸ áťááášáá˝áŻáŻáášá¸áťááášááááŹá¸ááášá¸ áąááŤáášááŻáášáááš\n"
+ "áááŻáášááŻááášááśáąááŹášáąááŹáášá
áŽáááš ááášááŻáśáááš áááŻááš-áĄáášááŻáááŽá¸áá˝áŹá¸ áá°á¸áąááŤáášá¸ áąááŹáášááŻáášáąáᏠááşáŹááŹááŹ-ááášáąááŤáášá¸ áťááášáá˝áŻáášá¸áťááášááááŹá¸ á
áááš áąááŤáášááŻáášáąáḠáĄááášá¸áĄááŹá¸ááŻáá ááášáąááŹáášáááš áá- ááášáąáááá˝ áá ááášáąáááĄáá áĄáášááŻáááŽá¸áá˝áŹá¸ááŻáá áááŽá¸ááźáášááźáŹá¸áááš áťáá
ášáąážááŹáášá¸á áĄáášááŻáááŽá¸áá˝áŹá¸ áááźá ááşááłááŻáááášááášá¸ áĄááášá¸áĄááŹá¸ááŻáá ááášáąááŹáášáááš áťáá
ášáąážááŹáášá¸á ááášá¸áááŹá¸ááášá¸áááš áĄáášááŻáááŽá¸áá˝áŹá¸á ááááĽáŽá¸ááŻáśá¸ áťááášáá˝áŻáášá¸áťááášááááŹá¸ááášá¸ áťáá
ášáťááŽá¸ áĄáášááŻáááŽá¸áá˝áŹá¸á áĄáąáťáááś áĄáąááŹáášáĄáĄáŻáś áąááŹáášá¸ááźááš áąá
áąáá¸áá˝áášá áĄáťááášáĄáá˝ááš ááášááźáášáá˝áŻ áĄááášááĄááášá¸ ááŻáá¸áťáá˝áášááąáá¸áĄááźááš áĄááşááłá¸áá˝ááááš áťáá
ášáąážááŹáášá¸ áááŻáášáťááášáá°ááąááá
áĽášáááášá¸á
áŹáá˝ áááášá¸áĄá áááááŤááášá"
+ "ááşáŹááŹááŹ-ááášáąááŤáášá¸ áťááášáá˝áŻáŻáášá¸áťááášááááŹá¸ááášá¸áááš á
áŻá
áŻáąááŤáášá¸ áĄáá˝ááš ááŽááŻáááŽáᏠáá
á áá˝ááťááŽá¸ áá
ášááŹááŽáá˝áşááš áĄáťááášááŻáśá¸ ááŽááŻáááŽáᏠááá ááŻáášáąááŹáášá¸ááŻááášáááš áťáá
ášáᏠáááŹá¸ááášá¸ áąááŤáášááŻáášáťááŽá¸áąááŹááš ááşáŹááŹááŹáá˝ ááášáąááŤáášá¸ááŻáá áąááŤáášáąááŹáášáááš áĄááşááášáá˝áŹ ááášáá˝á ááŻáśá¸ááŹááŽáá˝áąáá áĄáŹááááš áááá
áš áá ááąááşáŹášáąáĄáŹááš áťáá
ášááźáŹá¸áááš áťáá
ášáąážááŹáášá¸á ááşáŹááŹááŹ-ááášáąááŤáášá¸ áťááášáá˝áŻáŻáášá¸áťááášááááŹá¸ááášá¸áááš áĄáášááŻáááŽá¸áá˝áŹá¸ááŻááášááśáᏠáá áĄáąáá˝ááąááŹáášáĄáŹáá˝áąááááźááš ááááĽáŽá¸ááŻáśá¸ áťááášáá˝áŻáášá¸áťááášááááŹá¸ááášá¸ áťáá
ášáááš áťáá
ášáąážááŹáášá¸á áťááášáá˝áŻáášá¸áťááášááááŹá¸ááášá¸ áąááŤáášááŻáášáťááášá¸áááš áĄáášááŻáááŽá¸áá˝áŹá¸ááŻááášááśáĄááźááš áá˝á
ášá
áĽáš áĄááŻáášáĄááŻááášáąááᏠá áąááŹáášá¸áąááşáŹášááŻá áĄáá
áš ááášááŽá¸áąáá¸áááš áťáá
ášáťááŽá¸ áááŹá¸ááášá¸ ááąáá˝áşáŹáášá áąááááşáŹá¸ááźááš á
áŽá¸ááźáŤá¸áąáḠáááášáááŻáḠááźáśááťáááłá¸ááźáŹá¸áááš áťáá
ášáąážááŹáášá¸ áááááŤááášá"
+ "ááşáŹááŹááŹ-ááášáąááŤáášá¸ áťááášáá˝áŻáŻáášá¸áťááášááááŹá¸ááášá¸áááš áááŻáášáťááášá ááŻááášááśáťááŹá¸á ááŽááŻááášá¸áąáá¸áá˛áźáťááášá¸á áąááŹáášááŻáášáťááášá¸á ááášááášáťááášá¸áá˝áášá á
áŽááśááášááá˛áźáťááášá¸ áťáá
ášá
áĽáš áá
ášááášááŻáśá¸ááźááš ááŤááášáąááŹáášááźáášáąáᏠáááááŻáśá¸áąáᏠáťááášáá˝áŻáášá¸áťááášááááŹá¸ááášá¸ áťáá
ášáąážááŹáášá¸á áááŻáášááŻááášááśááźááš áááťáŹáąááááźááš áĄááŻááášá¸áĄáᏠáĄážááŽá¸ááŹá¸ááŻáśá¸á áťááášáá˝áŻáášá¸ áĄáťááášáááŻáśá¸á áĄáąááášááŽááŻáśá¸á á
áŽááśááášááá˛áźáá˝áŻ áĄáąááźááĄážááśáł áĄááášáááşáášááŻáśá¸áąáᏠáťááášáá˝áŻáášá¸áťááášááááŹá¸ááášá¸ ááźáášáááš áá˝ááťááŽá¸ áááŻáášáťááášá áťááášáá˝áŻáášá¸áťááášááááŹá¸ááášá¸ááşáŹá¸áááš ááŻááášááśááᏠá
áśááşááášá
áśáá˝áŻáášá¸ ááŻááášááŽáąáá¸áĄáá˛áźáá ááŻááášááśááᏠááŽá¸áááŹá¸ááŻáášááášá¸ áĄáá˛áźáááşáłáášááŻááá ááášá¸ááᏠá
áśááşááášá
áśáá˝áŻáášá¸áá˝áášá ááášá¸ ááŻááášááŽáąážááŹáášá¸ áťááášáá°ááąááá
áĽášáááášá¸á
áŹááźááš áąáá¸ááŹá¸ááŹá¸ááášá";
//ĺ
łéŽčŻćĺ
System.out.println(SEANLP.Thai.extractKeyword(thDocument, 6));
//čŞĺ¨ćčŚ
System.out.println(SEANLP.Thai.extractSummary(thDocument, 3));
System.out.println(SEANLP.Lao.extractKeyword(loDocument, 6));
System.out.println(SEANLP.Lao.extractSummary(loDocument, 3));
System.out.println(SEANLP.Khmer.extractKeyword(kmDocument, 6));
System.out.println(SEANLP.Khmer.extractSummary(kmDocument, 3));
System.out.println(SEANLP.Vietnamese.extractKeyword(viDocument, 6));
System.out.println(SEANLP.Vietnamese.extractSummary(viDocument, 3));
System.out.println(SEANLP.Burmese.extractKeyword(buDocument, 6));
System.out.println(SEANLP.Burmese.extractSummary(buDocument, 3));
}
}
ćŹéĄšçŽĺčĺĺé´äşäźç§ĺźćşéĄšçŽHanLPăĺ¨ć¤čĄ¨ç¤şćč°˘ďź
ćč°˘ććç塼大ĺŚćşč˝äżĄćŻĺ¤çéçšĺŽéŞĺŽ¤ĺä˝čĺ¸çć察ďźćč°˘çťććäžĺ¸ŽĺŠçććäşşďźč°˘č°˘ďź
ä˝č @Zhao Shiyu