さまざまな日本語検索が可能なオープンソースデータベースDoqueDB
DoqueDBはLinux上で動作するリレーショナルデータベースで、類似文書検索から対話的な関連文書検索まで、日本語の全文検索に関してさまざまな機能を提供します。ソースコードはApache License 2.0で公開されています。また、バイナリパッケージをダウンロードすればすぐにお使いいただけます。
DoqueDBはLinux上で動作するリレーショナルデータベースで、類似文書検索から対話的な関連文書検索まで、日本語の全文検索に関してさまざまな機能を提供します。ソースコードはApache License 2.0で公開されています。また、バイナリパッケージをダウンロードすればすぐにお使いいただけます。
全文検索とは「検索対象文書の本文から特定の文字列を探し出す」ことを、一般に全文検索と呼びます。たとえば図書館で図書を探すとき、通常は書名や著者名、刊行年を指定して探すことになりますが、本文に何らかの
DoqueDBの類似文書検索結果を改善する方法を解説した記事です。DoqueDBには関連語拡張という機能があり、検索結果の一部を検索条件にフィードバックすることで検索結果を改善できます。また、検索語
はじめにDoqueDBは、自由度の高い日本語全文検索や類似文書検索を特長とするデータベース管理システム(DBMS)です。今回、同様の機能をもつ他社ソフトウェアと性能比較を行いましたので、結果を公開
ワークス徳島人工知能NLP研究所が公開しているSudachi同義語辞書を使って、DoqueDBの全文検索で同義語検索を行う方法を解説した記事です。同義語検索を用いることで、ユーザーの負担なく検索もれ
DoqueDBにはPerlのAPIも付属しています。現時点ではこれといったマニュアルもなく、また、特別なインストーラーなどは準備しておりません。ソースコードの doqueDB/sydney/Pe
DoqueDBではUnicodeの任意の文字をデータとして扱うことができます。 この記事では文字の取り扱いについて注意すべきことがらをまとめます。Unicode追加面の文字を扱うことが
DoqueDB開発チームでは、開発にご協力くださる方々を求めています。DoqueDBはGitHubで公開されており、ユーザーの方々からの質問やご意見、改善提案については、IssueあるいはPu
DoqueDBの正規化の仕様をMySQLやPostgreSQLと詳しく比較した解説記事です。DoqueDBの全文検索では、大文字小文字、全角半角の違いだけでなく、「インタフェース」「インターフェイス
長らくお待たせいたしましたが、日本語全文検索データベースDoqueDBを正式公開しました。Linux共通のバイナリパッケージは本サイトよりダウンロードできます。https://www.doquedb
青空文庫のデータを用いたデータベースの作成から類似文書検索まで、DoqueDBの構文の、MySQLやPostgreSQLとの違いを詳しく比較した解説記事です。他社製品からDoqueDBへの移行をお考