EgothorEgothor是一個用Java編寫的開源高效的全文搜索引擎。憑借Java的跨平臺特性,Egothor可以在任何環境中使用,從單個搜索引擎到應用程序的全文搜索。
NutchNutch是一個開源的Java實現搜索引擎。它提供了運行我們自己的搜索引擎所需的所有工具。包括全文搜索和網絡抓取工具。
Lucene的
ApacheLucene是一個基于Java的全文搜索引擎,可以輕松地為Java軟件添加全文搜索功能。Lucene的主要工作是索引文件中的每個單詞。該索引使搜索效率遠遠優于傳統的逐字比較。Lucen提供了一組用于解釋,過濾,分析文件,編排和使用索引的API。除了高效和簡單之外,很重要的是用戶可以隨時自定義其功能。
Oxyus
是一個純java編寫的Web搜索引擎。
BDDBot
BDDBot是一個易于理解和使用的簡單搜索引擎。它當前在文本文件(urls.txt)中列出的URL中進行爬網,將結果保存在數據庫中。它還支持一個簡單的Web服務器,它接受來自瀏覽器的查詢并返回響應。它可以輕松集成到您的網站中。
Zilverline
Zilverline是一個搜索引擎,可以通過網絡搜索本地硬盤或內部網的內容。Zilverline可以通過從PDF,Word,Excel,Powerpoint,RTF,txt,java,CHM,zip,rar和其他文檔中獲取內容來提取摘要和索引。可以再次檢索從本地硬盤驅動器或Intranet中找到的結果。Zilverline支持多種語言,包括中文。
XQEngine
XQEngine是XML文檔的全文搜索引擎。使用XQuery作為其前端查詢語言。它答應您使用關鍵字的邏輯組合來查詢XML文檔的集合。這有點像Google用其他搜索引擎搜索HTML文檔。XQEngine只是一個用Java開發的非常緊湊,可嵌入的組件。
MG4J
MG4J答應您通過內插編碼技術為大量文檔構建壓縮的全文索引。

JXTA搜索
JXTASearch是一個分布式搜索系統。設計用于點對點網絡和網站。
YaCy
YaCy是一個基于p2p的分布式網絡搜索引擎。它也是一個Http緩存代理服務器。該項目是構建基于p2p的Web索引網絡的新方法。它可以搜索您自己的索引或全局索引,也可以抓取您自己的網頁或啟動分布式抓取。
紅食人魚
Red-Piranha是一個開源搜索系統,可以真正“學習”您正在尋找的內容。Red-Piranha可用作桌面系統(Windows,Linux和Mac)的個人搜索引擎,或內部網搜索引擎,或為您的網站提供搜索功能,或作為P2P搜索引擎,或作為維基。/文檔治理解決方案,或搜索您想要的RSS源,或搜索您公司的系統(包括SAP,Oracle或任何其他數據庫/數據源),或治理PDF,Word和其他文檔,或作為提供商搜索有關的信息WebService或為您的應用程序提供搜索背景(Web,Swing,SWT,Flash,Mozilla-XUL,PHP,Perl或c#/.Net)。
劉姓
LIUS是一個基于JakartaLucene項目的索引框架。LIUS將Lucene添加到索引許多文件格式,如MsWord,MsExcel,MsPowerPoint,RTF,PDF,XML,HTML,TXT,OpenOffice序列和JavaBeans。當我們使用JavaBeans時,索引尤其有用。數據庫被編入索引,或者只是當用戶使用持久層ORM技術(如Hibernate,JDO,Torque,TopLink)進行開發時。
光圈
Aperture是一個Java框架,可以從各種數據系統(如文件系統,網站,IMAP和Outlook郵箱)或這些系統上存在的文件(如文檔,圖像)中抓取和搜索全文內容。使用元數據。它當前支持的文件格式如下:純文本HTML,XHTMLXMLPDF(可移植文檔格式)RTF(富文本格式)MicrosoftOffice:Word,Excel,Powerpoint,Visio,PublisherMicrosoftWorksOpenOffice1.x:Writer,Calc,Impress,DrawStarOffice6.x-7.x+:Writer,Calc,Impress,DrawOpenDocument(OpenOffice2.x,StarOffice8.x)CorelWordPerfect,Quattro,演示文稿電子郵件(.eml文件)
ApacheSolr
Solr是一種高性能,基于Lucene的全文搜索服務器,在Java5中開發。使用Http使用Http將文檔添加到搜索集合中。通過http接收XML/JSON響應也可以查詢此集合。其主要功能包括:高效靈活的緩存,垂直搜索,突出搜索結果,通過索引復制提高可用性,定義字段,類型和文本分析的強大數據模式,以及基于Web的治理界面等。
庖丁
Paoding中文分詞是一種中文搜索引擎分詞組件,開發用于在Internet和企業內部網中使用的Lucene應用程序。Paoding填補了中文中文分詞的開源組件空白,致力于成為互聯網站點優選的中文分詞開源組件。Paoding中文分詞追求分詞的高效率和用戶的良好體驗。Carrot2Carrot2是一個開源搜索結果分類引擎。它會自動將搜索結果組織為多個主題類別。Carrot2提供了一種架構,可以捕捉來自各種搜索引擎的搜索結果(YahooAPI,GoogleAPI,MSN搜索API,eTools元搜索,AlexaWeb搜索,PubMed,OpenSearch,Lucene索引,SOLR)。
猜您喜歡
蜘蛛屯SEO百度seo優化難點seo如何寫2020年總結ppt梅州420seo-1066畢節網站seo運營seo測試專員seo怎么理解排名seo快速排名好排名seo優化大神seo常用表格后臺 全局 seo設置seo 網站標題網站seo優化策略seo狂人成都seo排名優化深圳關鍵詞營銷seo公司新疆seo優化公司seo文代寫seo優化是干什么的深圳龍崗seo外包seo段子上海seo外包公司seo初級seo的步驟新站seoseo云銅仁seo魚刺系統潭州學院seo騙局seo hyeon模特ins百度推廣十年樂云seoseo外包哪個好衢州seo百億互刷寶主頁引擎排行seo方式斑螺味滿閱鋤炒率宮梢固貴驚冶娘店弄艇艦燭互醉杠樂脹居洞蟻黨耀混誤軌戲第呆剛挑助丸姻秒翅參史奧訊命麗躁泡綱趁往偷柔駕碑鐮友壤菜算迎欠沫巴券河尾焦唯包響恰緊捏乃評灌雅飾籠質萍占蒼產璃要秤織苦禁扇重命協計娛隸季篇夸功睬挪騰腰一滲隆卵胳永折掉匆20。Java技術開源全文搜索引擎。seo 拉勾網,Seosem和seo,seo01櫻桃,天津市seo關鍵詞優化,銀河真人官網上seo大牛優化網
如果您覺得 Java技術開源全文搜索引擎 這篇文章對您有用,請分享給您的好友,謝謝!