Software Design plusシリーズ[改訂新版]Apache Solr入門
――オープンソース全文検索エンジン
――オープンソース全文検索エンジン
2013年11月29日紙版発売
2013年12月5日電子版発売
大谷純,阿部慎一朗,大須賀稔,北野太郎,鈴木教嗣,平賀一昭 著,株式会社リクルートテクノロジーズ,株式会社ロンウイット 監修
B5変形判/352ページ
定価3,960円(本体3,600円+税10%)
ISBN 978-4-7741-6163-1
ただいま弊社在庫はございません。
書籍の概要
この本の概要
最新版Apaceh Solr Ver.4.5.1に対応するため大幅な書き直しと原稿の追加を行い,現在の開発環境に合わせて完全にアップデートしました。Apache Solrは多様なプログラミング言語に対応した全文検索エンジンです。システムに検索機能を実装することは,自社の情報資産を守ることと,活用することその両方を一挙に実現します。そのためApache Solrを自社の情報資産活用に使うことが注目されています。本書は,Solrの基本機能を原理としくみから詳しく紹介し,どのようにSolrを実装していくか豊富なサンプルとともに解説を行います。
こんな方におすすめ
- 検索システムに興味のある方。前提として,JavaScriptやPHP,Javaなどのプログラミング経験がある方
著者の一言
本書は,情報検索に興味を持つ,あらゆる人を対象としています。学生から社会人,週末プログラマから職業プログラマ,SE,プログラミングをしない情報システムを使うだけの人,検索エンジンを比較検討しようとしている人……制限はありません。それぞれの立場でSolr をお楽しみください。しかしながら,本書はSolr の技術解説書でもあり,Solr をインストールしたりサンプルコードを設定したりする場面もあります。そのときは技術的なバックグラウンドのある方は若干有利でしょう。自分の経験に感謝しつつ,コマンドを入力したり,検索して結果を確認したり,より深くお楽しみください。
サンプルコードのダウンロードと本書のサポート
本書で紹介しているサンプルプログラムや設定ファイルは,技術評論社のホームページをはじめ,執筆陣が勤務する下記の会社のホームページからダウンロードできます。
- 株式会社シーマーク http://www.seamark.co.jp
- 株式会社ロンウィット http://www.rondhuit.com
本書の執筆には万全を期しましたが,ソフトウェア同様,残念ながら不具合が紛れ込む可能性があります。万一誤りを発見したり,手順どおり試したのに動かないことなどがありましたら,上記ホームページの問い合わせフォームなどからお気軽にご連絡ください。また,下記ブログのコメント欄でも受け付けます。
- @johtani の日記2nd http://blog.johtani.info
いただいた問い合わせには,個別に回答したり,ブログの記事上で回答したり,正誤表を作成したりなど,何らかの対応をしたいと思います。なお対応には時間がかかる場合がありますので,あらかじめご了承ください。
本書のサンプル
本書の一部ページを,PDFで確認することができます。
- サンプルPDFファイル(422KB)
本書の紙面イメージは次のとおりです。画像をクリックすることで拡大して確認することができます。
目次
第1章 イントロダクション
Apache Solrとはどのような検索エンジンなのかその特徴を述べ,次に全文検索の基礎知識である転置索引と転置索引を使った検索について説明します。インストールして実行する方法を,次にアーキテクチャを説明します。
第2章 スキーマの設定
Solrのインデックスは,RDBのテーブルの「カラム」に相当する「フィールド」で構成されています。インデックスがどのような型のフィールドで構成されているかという定義は,Solrのスキーマ定義ファイルで設定を行います。
第3章 インデックスの作成
Solrのインデックスの作成,更新の方法,それにかかわる設定や属性について学びます。
第4章 検索する
Solrで,どういった検索が行えるのか(検索式の書き方,ソートの指定方法,取得件数指定方法など),検索の付加機能(ファセット,ハイライト機能,キャッシュ)にどういったものが用意されているのかについて説明していきます。
第5章 クライアントプログラミング
いろいろなプログラミング言語によるSolrサーバへのアクセス方法について学んでいきます。共通の機能を持ったサンプルアプリケーションについてプログラミング言語ごとに説明していきます。
第6章 データのクローリング
検索対象文書のデータクローリングとして,データベースやRSSフィードなどのXMLファイルをSolrに取り込む「データインポートハンドラ(DIH)」機能や,Solrと親和性が高く,ファイルサーバやCMSをクロールしてSolrに取り込むことができる「Apache ManifoldCF」を紹介します。
第7章 より高度な検索
Solrのより高度な検索について学びます。本章前半では,Solrの「サーチコンポーネント」という機能を用いて,検索結果のランキングを調整したり,検索結果にさまざまな関連情報を付加する方法について学びます。
第8章 クラスタ構築と運用
分散インデックス・分散検索とレプリケーションを用いた検索クラスタとSolr4.0から新たに追加されたSolrCloud を用いた検索クラスタの構築および運用方法を紹介します。
第9章 開発および運用のTIPS
Solrを実際のサービスで利用しているリクルートにおける開発・運用上の経験を,TIPSとして紹介します。
Appendix
スキーマ操作/マルチコア操作/コレクション操作について紹介します。
この本に関連する書籍
-
プロになるためのJavaScript入門――node.js、Backbone.js、HTML5、jQueryMobile
本物のオブジェクト指向をJavaScriptで実践する方法を解説し,高い評価を得てきた『Java開発者のためのAjax実践開発入門』が,最新のWeb開発事情に合わせ内容を全面刷新...
-
Apache Solr入門――オープンソース全文検索エンジン
Apache Solrとは,オープンソースの検索エンジンです。Apache LuceneというJavaの全文検索システムをベースに豊富な拡張性をもたせ,多くの開発者が利用できるように作...
-
Apache Lucene 入門 ― Java・オープンソース・全文検索システムの構築
Luceneは全文検索システムを構築するためのJavaのライブラリです。 本書は,全文検索システムの仕組みと機能を初心者にもわかりやすく解説し,豊富なサンプルコードで実...