LJCluster文本聚類(lèi)技術(shù)中間件 1.0 官方正式版

2023-04-09發(fā)布者:ylm大小: 下載:0

文件大小:

軟件介紹

LJCluster文本聚類(lèi)技術(shù)中間件下載介紹

   文本聚類(lèi)是基于相似性算法的自動(dòng)聚類(lèi)技術(shù),自動(dòng)對(duì)大量無(wú)類(lèi)別的文檔進(jìn)行歸類(lèi),把內(nèi)容相近的文檔歸為一類(lèi),并自動(dòng)為該類(lèi)生成特征主題詞。適用于自動(dòng)生成熱點(diǎn)輿論專(zhuān)題、重大新聞事件追蹤、情報(bào)的可視化分析等諸多應(yīng)用。

   靈玖Lingjoin基于核心特征發(fā)現(xiàn)技術(shù),突破了傳統(tǒng)聚類(lèi)方法空間消耗大,處理時(shí)間長(zhǎng)的瓶頸;不僅聚類(lèi)速度快,而且準(zhǔn)確率高,內(nèi)存消耗小,特別適合于超大規(guī)模的語(yǔ)料聚類(lèi)和短文本的語(yǔ)料聚類(lèi)。

   靈玖文檔聚類(lèi)組件的主要特色在于:
1、速度快:可以處理海量規(guī)模的網(wǎng)絡(luò)文本數(shù)據(jù),平均每小時(shí)處理至少50萬(wàn)篇文檔;
2、聚類(lèi)精準(zhǔn):Top N的聚類(lèi)中心往往能反映出當(dāng)時(shí)的時(shí)事熱點(diǎn),適合于輿情熱點(diǎn)計(jì)算;與國(guó)際上以聚類(lèi)見(jiàn)長(zhǎng)的Autonomy公司技術(shù)相比,靈玖的各項(xiàng)指標(biāo)遠(yuǎn)遠(yuǎn)領(lǐng)先,或許是靈玖更懂中文吧
3、精準(zhǔn)排序:各個(gè)類(lèi)別按照影響權(quán)重排序,每個(gè)類(lèi)中的文檔按照重要性排序;
4、可定制:可以定制類(lèi)別數(shù)、類(lèi)別中心。
5、開(kāi)放式接口:靈玖文檔聚類(lèi)組件作為L(zhǎng)JParser的一部分,采用靈活的開(kāi)發(fā)接口,可以方便地融入到用戶(hù)的業(yè)務(wù)系統(tǒng)中,可以支持各種操作系統(tǒng),各類(lèi)調(diào)用語(yǔ)言。

   靈玖文檔聚類(lèi)可以應(yīng)用于文本挖掘、知識(shí)管理、搜索聚類(lèi)、輿情監(jiān)測(cè)等多種應(yīng)用中。

發(fā)表評(píng)論(共0條評(píng)論)
請(qǐng)自覺(jué)遵守互聯(lián)網(wǎng)相關(guān)政策法規(guī),評(píng)論內(nèi)容只代表網(wǎng)友觀點(diǎn),發(fā)表審核后顯示!

版權(quán)聲明:

1 本站所有資源(含游戲)均是軟件作者、開(kāi)發(fā)商投稿,任何涉及商業(yè)盈利目的均不得使用,否則產(chǎn)生的一切后果將由您自己承擔(dān)!

2 本站將不對(duì)任何資源負(fù)法律責(zé)任,所有資源請(qǐng)?jiān)谙螺d后24小時(shí)內(nèi)刪除。

3 若有關(guān)在線(xiàn)投稿、無(wú)法下載等問(wèn)題,請(qǐng)與本站客服人員聯(lián)系。

4 如侵犯了您的版權(quán)、商標(biāo)等,請(qǐng)立刻聯(lián)系我們并具體說(shuō)明情況后,本站將盡快處理刪除,聯(lián)系QQ:2499894784

返回頂部