生命科学データ解析を支える情報技術
-
坊農秀雅 監修・著
山本泰智,粕川雄也,久保竜一,大石直哉 著 - 定価
- 2,838円(本体2,580円+税10%)
- 発売日
- 2019.2.9
- 判型
- B5変形
- 頁数
- 192ページ
- ISBN
- 978-4-297-10319-4 978-4-297-10485-6
サポート情報
概要
遺伝子配列解読装置のハイスループット化にともない,膨大な量の生命科学データが生み出されています。このデータはオープンデータとして提供されており,利活用ははじまったばかりです。
この生命科学データを解析することによって,将来がんになりやすいかどうかはある程度予測可能になっています。たとえば2013年アンジェリーナ・ジョリーによる「乳がん予防のための乳房切除」が話題となったことは記憶に新しいでしょう。このように得られたDNA配列がどういった特徴を持っているかデータベースに登録されたデータと照合していち早く治療方針を決める時代がきています。
生命科学データ解析では,最新の技術が応用されていることはあまり知られていません。本書では,エンジニアに向けて生命科学データを扱う技術の面白さとバイオインフォマティクスのいまをやさしく解説します。
こんな方にオススメ
- バイオインフォマティクスに興味のあるエンジニア
目次
第1章 生命科学データ解析入門
- 1.1 DNAと遺伝情報
- 1.2 生命科学とエンジニアリング
- 1.3 DNA配列データ形式と解析方法
第2章 解析環境の構築
- 2.1 解析環境を構築する必要性
- 2.2 Rでの環境構築:Bioconductor
- 2.3 Bioconda
- 2.4 Homebrew
- 2.5 Dockerの利用
- 2.6 GitHubの利用
- 2.7 GUIによる利用
- 2.8 遺伝子発現データ解析の実際
第3章 データベース
- 3.1 生命科学分野におけるデータベースの利用
- 3.2 生命科学分野のデータベース構築技術
- 3.3 半構造型データ
- 3.4 MongoDB
第4章 テキストマイニング
- 4.1 生命科学とテキストマイニング
- 4.2 生命科学分野の最新のデータ表現方法
- 4.3 英語論文データ
- 4.4 日本語論文データ
第5章 クラウド利用の実際
- 5.1 クラウドとオンプレ環境
- 5.2 クラウド環境を使用したゲノム解析環境の構築例
- 5.3 クラウド環境を活用するにあたっての課題
第6章 データ可視化
- 6.1 生命科学データにおける可視化の重要性
- 6.2 ゲノムブラウザによる配列データの可視化
- 6.3 Cytoscapeによるグラフデータの可視化
- 6.4 探索的なデータ可視化
プロフィール
坊農秀雅
理化学研究所,埼玉医科大学ゲノム医学研究センターを経て,2007 年より大学共同利用機関法人 情報・システム研究機構 ライフサイエンス統合データベースセンター(DBCLS)特任准教授。著書に『Dr.Bono の生命科学データ解析』(2017 年 メディカル・サイエンス・インターナショナル),『次世代シークエンサーDRY 解析教本』(共同監修,2015 年 学研メディカル秀潤社)などがある。生命科学分野の公共データベースを使った研究活動をする傍ら,その利活用普及にも取り組んでいる。本書の監修,はじめに,1 章,2 章の執筆を担当。
山本泰智
2007 年より大学共同利用機関法人 情報・システム研究機構 ライフサイエンス統合データベースセンター(DBCLS)特任准教授。DBCLS 発足当初から文献情報を利用したサービス開発を通じて生命科学分野の研究活動を支える研究開発に取り組む。先人の知見を最大限生かせる環境の構築が目標。本書の4 章の執筆を担当。
粕川雄也
大阪大学大学院基礎工学研究科,NTT ソフトウェア株式会社,理化学研究所発生・再生科学総合研究センター,同ライフサイエンス技術基盤研究センターを経て,2018 年より理化学研究所生命医科学研究センター(IMS)大容量データ管理技術開発ユニット ユニットリーダー。生命科学分野において,特に遺伝子発現に関するデータベースやデータ処理法,大規模データ解析法の開発に関する研究に従事。本書の3 章の執筆を担当。
Twitter:@kasukawa
久保竜一
2014 年より受託ゲノム解析サービス企業でマイクロアレイデータ解析,NGS データ解析業務に従事。2016 年より株式会社DeNA ライフサイエンスにて,個人向け遺伝子検査サービスの研究向けゲノムデータ解析環境の立ち上げを担当。2017 年からは株式会社ディー・エヌ・エー ヘルスケア事業本部ライフサイエンス事業部AI 創薬グループにて製薬企業の化合物データを扱うことのできる機械学習実験環境の整備とセキュリティを担当しながらバイオインフォマティクスエンジニアとして研究に従事。創薬ちゃん(@souyakuchan)のプロデューサーとしても活動中。本書の5 章の執筆を担当。
Twitter:@kubor_
大石直哉
株式会社ドッグラン代表取締役。遺伝子発現データベースや生命科学分野の日本語コンテンツ関連サービスの開発に携わる。公共データベースを有効に活用するためのユーザインターフェースとして,データ探索的なデータ可視化に着目している。本書の6 章の執筆を担当。