April 6, 2020

Databases

データベース一覧

追加事項
(10/9/2021) 「4. 疫学関連」にcellosauruseを追加、「5.バイオインフォマティクス全般」の項を追加
(8/9/2021)   「4. 疫学関連」にDRIVE DATA PORTALを追加
(8/9/2021)   「CCLE」はDepMapに統合されたため、削除線を引きました
(10/7/2020) 「4. 疫学関連 」にサイト(Cell Model Passport)を追加
(22/5/2020) 「1. 塩基配列関連 > 遺伝子発現 」、「4. 疫学関連 > 生存率分析」にサイトを追加
(21/5/2020) 「2. タンパク質関連 > メタボローム関連」、「4. 疫学関連 > 生存率分析」の項を追加

1. 塩基配列関連

DNA/RNAseqなど

以下の3箇所は、塩基配列に関する一次データを受け入れて公開している。これらのデータはSRA (NCBI)に統合され、まとめて検索しやすくなっている。

遺伝子発現 

  • ArrayExpress (EMBL): マイクロアレイ
  • GEO (NCBI): マイクロアレイ
  • Ensemble (EMBL): 遺伝子とアノテーション
  • miRBase: microRNAとアノテーション
  • LINCipedia: non-coding RNA (lncRNA)とアノテーション
  • CellMiner: NCI-60などのデータと分析
  • CCLE (Broad): がん細胞株のmRNA/マイクロアレイデータなど
    ※DepMapに統合されました

その他

  • GeneCards: 遺伝子
  • RefSeq (NCBI): DNA/RNA/タンパク質などの塩基配列
  • 1000 Genomes Project: 世界の26集団からの2500人以上のゲノムデータ (全ゲノム塩基配列、エキソーム、マイクロアレイ) を含むデータベース
  • recount2: TCGAとSRA (GTExを含む)から取得された70,000のRNAseqデータ


2. タンパク質関連

アミノ酸/タンパク質関連


タンパク質立体構造


メタボローム関連

  • Metaboanalyst: メタボライトの探索的解析やエンリッチメント分析など


3. パスウェイ



4. 疫学関連

  • Cell Model Passports (Sanger): がん関連の包括的なデータベース
  • COSIC (Sanger): 変異とがんとの関連など
  • oncomine: がんと正常組織の発現比較
  • ExPASy - Cellosaurus: 細胞株の情報
  • DepMap: ターゲット遺伝子に関する、がん細胞株の依存度
  • DRIVE DATA PORTAL: がん細胞株の依存度(shRNA)
  • OMIM: 遺伝病
  • dbSNP (NCBI): バリアント
  • gnomAD (Broad): バリアントや遺伝子を15,000+人の全ゲノムデータにあてる
  • LINCS: 薬剤、環境、変異による細胞への影響
  • ClinicalTrials.gov: 個別の治験に関する情報

生存率分析

  • KM plotter: 21のがん種に関連する5.4万の遺伝子(GEO, EGA, TCGAから取得)を元に生存曲線を生成
  • UALCAN: TCGAとMET500のデータ分析を助けるサイト
  • prognoscan: GEOデータの表示と、それを元にしたKM曲線の生成
  • The Human Protein Atlas: Pathologyの項目でKM曲線を生成 (2.  タンパク質関連参考)
  • The Cancer Proteome Atlas: がん種ごとに高/低発現で生死を分ける遺伝子の一覧
  • xena: TCGAのデータを元に直感的にKM曲線を生成。フィルタリングしやすい
  • その他、生存率分析に関する様々なwebサイトがこのページにて紹介されている


5. バイオインフォマティクス全般


2 comments:

  1. genecards
    https://www.genecards.org/
    入れたら?

    ReplyDelete
  2. ありがとうございます、genecards入れます!
    コメントをいただいて励みになります。ありがとうございます!

    ReplyDelete