# PDBj入門
## VR分子ビューア
https://numon.pdbj.org/vr/
## 万見プライム
https://numon.pdbj.org/emnavi/pop_molmil.php?prime=1
## ペーパーモデル
https://numon.pdbj.org/papermodel/
## タンパク質構造百科事典(eProtS)
Mediawikiへ移植を計画中。
## 今月の分子
https://numon.pdbj.org/mom/
→現在はPDBjメインサイトにリダイレクトしている。
入門サイト版は現在構築中。
日本語以外に、中国語も対応?
## 各種資料
PDBjメインサイトにある過去の講習会資料+イベント配布チラシのデータなど
単に時系列にならべるだけではなく、教科書・読み物的に使えるよう配列。ないものはつくる。
## ゲーム
https://numon.pdbj.org/games/
# PDBj
※[Google Docs](https://docs.google.com/document/d/1HVeSWV_bUYp7sWyIutRs2VzVws6mLPEhbKtEHHNt9zM/edit?usp=sharing)から移植
[PDBj](https://pdbj.org/)(日本蛋白質構造データバンク、Protein Data Bank Japan)の提供サービスについて。
- PDBjとは、[wwPDB](https://www.wwpdb.org/)の一員、[JST-NBDC](https://biosciencedbc.jp/)、[大阪大学蛋白質研究所](http://www.protein.osaka-u.ac.jp/)により運営
## 登録(OneDep)
- wwPDBで運用している統一システム
- 世界共通、PDB、EMDB、BMRB共通
- 登録、アノテーション、バリデーション一貫
## データフォーマット
## PDBフォーマット
- 最も歴史あるレガシーフォーマットだが、廃止の方向
- 情報がテキストの列番号に基づくため、原子数、分子数などの桁数に制限がある
- メタ情報の拡張が困難なため、不完全なものしか持てない
### PDBx/mmCIF
- 現在のPDB公式フォーマット
- 原子座標だけでなく、実験手法の詳細、登録者の所属情報、文献情報、構成要素の配列、2時構造、由来生物種など、多様なメタ情報を含む
- STAR (Self-defining Text Archive and Retrieval) 形式に基づくCIF(Crystallographic Information File)形式を、生体分子、結晶学以外の手法などへの拡張したもの
- 現状、多くの構造ビューアが対応、解析プログラムは非対応のものもある
### PDBML
- STAR形式コンテナに内包されているPDBx/mmCIFのすべての内容をXML形式に変換したもの(理論上は相互変換可能)
- 長所
- XMLならパーサーがある、スキーマによるデータの検証が容易
- STARは一般的でないため、パーサーがない
- RDFへの拡張が容易
- 短所
- 冗長、ファイルが巨大になりがち
- XMLは時代遅れ(主観?)
### PDBMLadd/plus
PDBjで独自に収集してPDBMLに準拠した書式で作成した実験情報などのメタデータ(例:GO Term)。EBIが作っているSIFTSデータ(UniProtとPDBの配列対応などの情報)も利用してデータをつくっている。
かつてはPDBMLplusとしてPDBMLにデータを付加したものをつくって提供していたが、PDBML部分が冗長になるので、付加部分だけをPDBMLaddと呼んでこれをを提供するよう変更した。
### PDB/RDF
PDBMLから更にRDF形式に変換したもの。内容的には等価。
中身をみると、RDFは名前空間の接頭辞がたくさんあってサイズはPDBMLよりPDB/RDFの方が大きい(PDBID 1a14の場合、29972バイト<67988バイト)。
RDFを使ったしくみは遅いのが欠点。
## 検索
### PDB検索(PDBj Mine)
[ヘルプ](https://pdbj.org/help/mine)
PDBデータ検索システム。
バックエンドに構築した関係データベース(PostgreSQL)にSQLで問い合わせ結果をウェブページなどの形式で返す(少なくともかつては)。
xPSSS(XMLデータベースを使ったシステム)後継
[簡易検索](https://pdbj.org/help/mine-quick)はキーワード検索、アミノ酸配列検索、著者名検索。キーワードは日本語OK。内部で保持している変換辞書を使って英語に変換して検索している。
[詳細検索](https://pdbj.org/help/mine-advanced)はnewwebシステム配下で動作。MySQL DBに問い合わせている(Mine2、げっちゃん作成、Sphinxで作成したインデックスを利用)。この時、PDBだけではなくPDBjウェブページ内の情報、化合物なども横断検索している。SQL検索だけPostgreSQLに聞きに行っている?
この検索用につくった要約版データテーブルが[brief_summary](https://pdbj.org/help/mine-use-brief_summary)。
XPathは継承しているが、内部でSQLに変換して実現している。
CIF QueryはXQuery後継として作成したもの、階層的に検索してmmCIF形式で結果を返す。
[SQL検索](https://pdbj.org/help/mine-sql)が最も詳細な検索が可能だが、利用するにはSQLの文法とPDBx/mmCIFのデータ構造(どこにどんな情報がかかれているのか)を知っておく必要あり。事例増強中。
### 類似配列検索(Sequence Navigator)
BLASTをかけてPDBに登録されている類似配列を探し出してくる。
クエリはPDBID+ChainID、またはアミノ酸配列
PDB Mine結果ページからも呼び出すことができる(Sequence Neighborタブ)
### 類似構造検索(Structure Navigator、Omokage検索、GIRAF)
|サービス名|内容|
|--------|-------|
|[Structure Navigator](https://pdbj.org/struc-navi)|鎖単位、配列に基づく|
|[SeSAW](https://sysimm.ifrec.osaka-u.ac.jp/SeSAW/)|Structure Navigator+予想される機能についての情報も提供。[バージョン2](https://sysimm.ifrec.osaka-u.ac.jp/sesaw.2.0/)もあるが1との違いは?|
|[Omokage検索](https://pdbj.org/emnavi/omo-search.php?lang=ja)|構造全体、概形に基く|
|GIRAF|活性部位のみ、原子配置に基づく、更新が大変らしく金城さんはやめたがっている。 |
### その他検索
|サービス名|内容|
|--------|-------|
|[EM Navigator](https://pdbj.org/emnavi/?&lang=ja)|EMDBのデータを検索・閲覧するウェブサービス<br/>万見のIFを利用|
|[化合物検索(Chemie)](https://pdbj.org/chemie-search)|PDBに登録され3文字以内の記号が割り振られている化合物の構造を検索。|
|[状態検索](https://pdbj.org/status-search)|未公開PDBデータの公開ステータスを検索|
|[BMRB検索](http://bmrbdep.pdbj.org/)|BMRBのデータ検索
|[PDB/RDF検索](https://rdf.wwpdb.org/)||
|[chem_comp/RDF検索](https://rdf.wwpdb.org/cc)|PDB、化合物のRDFデータを検索する|
## 分子ビューア
### jV(3次元分子ビューア)
[ポータルページ](https://pdbj.org/jv/index_j.html)
Javaで書かれた分子ビューア。ウェブページに埋め込むアップレットとしてはほとんど使えなくなっているが、スタンドアロンのJavaアプリとしては引き続き利用可能。
開発は凍結。
### Molmil(WebGL分子ビューア)
[https://pdbj.org/help/molmil](https://pdbj.org/help/molmil)
jVに代わるWebGLベースの分子ビューア。げっちゃん作。
ユーザインタフェースはjVとは必ずしも似ていない。
VR対応もしている
## サービス・ソフトウェア
### 万見(Yorodumi)
[https://pdbj.org/yorodumi/](https://pdbj.org/yorodumi/)
万見 (よろづみ)は生体分子の3次元構造を気軽に眺めて、見て、動かして、回して、学んで、楽しむためのウェブページです。
### ASH
[https://pdbj.org/ash/](https://pdbj.org/ash/)
ASH(Alignment of Structural Homologs、アッシュ)はPDBjで開発されている3次元構造アライメント(立体構造の類似度比較)を行うプログラムです。
ここではブラウザからの利用方法を説明します。まずASHホームページを開くと次の様な画面が現れます。この画面から、どの立体構造を重ね合わせたいのかを指定します。”Query PDB”と”Template PDB”に、それぞれ立体構造を入力しましょう。入力方法は、PDBファイルをアップロードするか、もしくはPDB IDとチェインIDを指定するかの2通りのやり方があります。PDBに登録されていない構造を重ね合わせたいときは、アップロード機能を使うと良いでしょう。
次の”Superposition Options”は重ね合わせの計算を行うための細かい設定ができます。多くの場合は初期設定のままで充分でしょう。rcutは…(謎)です。Choose programで重ね合わせを行うプログラムを、RASH、GASH、PDP-ASHから選べます。RASHは高速ASH(Rapid ASH; ラッシュ)の略称で、重ね合わせを1秒以内に行うことができます。 非常に似た構造を比較するには、通常RASHで十分です。一方GASHは遺伝的アルゴリズムASH(Genetic-algorithm ASH、GASH; ガッシュ)の略称で、RASHの2倍程度の計算時間が必要ですが、精密な重ね合わせが可能です。構造が部分的に似ている場合や、複数の解が必要な場合にGASHは有効です。PDP-ASHは…(なんだこれ?)。

1mbn(A)と1buw(A)の場合、


1mbn\_rot\_with_1buw.pdb

赤が1mbn、緑が1buw。
```
transofrmation data
C_Q : 15.244 21.977 8.333
C_T : 46.693 31.430 35.336
ROT[0] : -0.759 0.557 0.338
ROT[1] : -0.604 -0.795 -0.046
ROT[2] : 0.243 -0.239 0.940
```
並進回転行列っぽい。
プロ向けの説明?
初期のASHは藤 博幸によって作られました\[1\]。 比較アルゴリズムの中心はOrengoとTaylorによる二重動的プログラミングアルゴリズム\[2\]に、Daron M. Standley による NER(Number of Equivalent Residues、等価残基数)に基づく新しいスコア関数\[3,4\]を結合したものが元になっています。
GASH\[4\] はNER\[5\](Number of Equivalent Residues、等価残基数)を最大化することによって蛋白質の立体構造比較を行う強力な手法です。NERは2つの蛋白質の立体構造類似度を示す経験的な尺度です(詳細は下記参照)。GASHは藤 博幸によって開発されたローカルASHプログラムを拡張したものです。局所的に最適化した比較はまず、距離行列比較を使って幾何学的に一貫した補助比較群へと分解し、次にNERを対象関数に適用して擬似的に生成したアルゴリズム(つまり、交差するが変異はない)を使って拡張します。RMSD(平均二乗偏差)とNERの閾値条件を満たす複数の解が得られます。
\[ASH類似度\]
ASH類似度(ASHスコア)は、次の5つの方法を用いて2つの分子が同じ [構造ドメイン](https://pdbj.org/help/structural-domain)に属するのかどうかを判定するものです。ASHスコアから分かることについては [こちら](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1955748/)に詳しく掲載されていますので、ここでは概要を記すだけにとどめます。
1. [NER](https://pdbj.org/help?PID=554) (Number of Equivalent Residues、等価残基数):空間配置が一致するα炭素の数に基づいて算出される。
2. 配列類似性 (sequence similarity):ASHによって整列された配列が属するドメイングループから導かれる。
3. Cα RMSDスコア (SASスコア):位置が一致しなかったα炭素の程度を示す値。
4. 非末端ギャップのギャップペナルティ (gap penalty of non-terminal gaps)
5. 全体の違い (overall difference):アライメントや重ね合わせには依存せず、2次構造の内容、長さ、大きさ、そして2つの構造の接触度合いを見たもの。
上記5つの方法それぞれの比重は、SCOPの同じ折り畳み構造グループ、CATHの同じトポロジーに属するドメインが認識できるように最適化されています。
\[参考文献\]
1. Toh, H. (1997) Introduction of a distance cut-off into structural alignment by the double dynamic programming algorithm. Comput Appl Biosci 13, 387-96.
2. Orengo, C.A. and Thornton, J.M. (2005) Protein families and their evolution-a structural perspective. Annu Rev Biochem 74, 867-900.
3. Standley, D.M., Toh, H. and Nakamura, H. (2004) Detecting local structural similarity in proteins by maximizing number of equivalent residues. Proteins 57, 381-91.
4. Standley, D.M., Toh, H. and Nakamura, H. (2005) GASH: an improved algorithm for maximizing the number of equivalent residues between two protein structures. BMC Bioinformatics 6, 221.
5. Standley DM, Toh H, Nakamura H. (2004) Detecting local structural similarity in proteins by maximizing number of equivalent residues. Proteins 57(2), 381-391
### MAFFTash
[https://pdbj.org/mafftash](https://pdbj.org/mafftash/)
[MAFFTash](https://pdbj.org/help?PID=548) は、配列と立体構造の両方を考慮して類似している分子を検索するツールです。
### NMRToolBox
[https://bmrbdep.pdbj.org/en/nmrtoolbox/](https://bmrbdep.pdbj.org/en/nmrtoolbox/)
NMRデータ解析ツールがダウンロードできる。
### gmfit
[https://pdbj.org/gmfit/](https://pdbj.org/gmfit/)
[gmfit](https://pdbj.org/gmfit/)は、混合正規分布モデルを用いて高速に立体の重ね合わせを行うプログラムです。二つのEMDBの密度マップやPDBの構造の重ね合わせ計算を行うWEBサービスを公開しています。
### CRNPRED
[https://pdbj.org/crnpred/](https://pdbj.org/crnpred/)
[CRNPRED](https://pdbj.org/help?PID=558) (クルンプレッド)はアミノ酸配列に基づき、2次構造(secondary structure)、埋もれ度(contact number)、残基毎コンタクトオーダ(residue-wise contact order)を含む1次元の蛋白質立体構造予測を行うウェブサービスです。
### Spanner
[https://pdbj.org/spanner/](https://pdbj.org/spanner/)
[Spanner](https://pdbj.org/help?PID=560)(スパナー)は既知の立体構造との類似性に基づいて、構造が分かっていないアミノ酸配列の立体構造を予測するプログラムです。
### SFAS
[https://pdbj.org/sfas](https://pdbj.org/sfas/)
SFAS(Sequence to Function Annotation Server)はアミノ酸配列から構造を予測するウェブサービスです。 SFASは配列相同性比較(sequence alignment)と構造予測(structural modeling)を行う外部プログラムの結果を組み合わせて実行されています。 現在、配列相同性比較に数種類が選択できるようになっていますが、構造予測にはまだ1種類しか選択できません。将来選択肢は増える予定です。
### HOMCOS
[https://homcos.pdbj.org/?LANG=ja](https://homcos.pdbj.org/?LANG=ja)
[HOMCOS](https://homcos.pdbj.org/?LANG=ja) は、PDBに収納されている複合体の立体構造データを配列や化学構造から検索し、検索された構造を鋳型として複合体のモデリングを行うサービスです。
## 二次データベース
### eF-site

[https://pdbj.org/efsite/](https://pdbj.org/efsite/)
[eF-site](https://pdbj.org/help?PID=512)(エフサイト: electrostatic-surface of Functional site)は蛋白質の機能部位に関する電子表面形状を見るためのデータベースです。活性部位のコノリー表面(Connolly surface)上に静電ポテンシャルと疎水性を表示します。分子認識機構の解析に用いることができます。
([https://pdbj.org/help/derived-databases-menu](https://pdbj.org/help/derived-databases-menu%EF%BC%89%EF%BC%89))
コノリー表面はMSPプログラム(Connolly, M.L., J. Mol.Graph., 4, 93-96, 1986)により作成されます。
静電ポテンシャルは自己無撞着境界法でPoisson-Boltzmann方程式を解いて計算しています。(Nakamura, H., Nishida, S., J. Ph. Soc. Jpn., 56, 1609-1622, 1987)。
([https://pdbj.org/eF-site/wiki/eF-site_Help](https://pdbj.org/eF-site/wiki/eF-site_Help))
Query: キーワード、PDB ID
### eF-seek

[https://pdbj.org/efseek/](https://pdbj.org/efseek/)
eF-seek(エフシーク)は似たリガンド結合部位を検索するウェブサービスです。eF-siteデータベースの代表結合部位を、クリーク検索アルゴリズム(clique search algorithm)に基づく独自の方法で検索します。
([https://pdbj.org/help/derived-databases-menu](https://pdbj.org/help/derived-databases-menu%EF%BC%89%EF%BC%89))
Query: PDBファイル
使い方
1. PDBファイルをアップロードします
2. 自分のe-mailアドレスを入力
3. タイトル(オプション)
4. Submitボタンをクリック

2. E-mailをチェックし、Job-startぺージにアクセスします。
3. 計算します。
4. 計算結果にアクセスします。
### eF-surf

[https://pdbj.org/efsurf/](https://pdbj.org/efsurf/)
eF-surf(エフサーフ)は分子の静電ポテンシャルと分子表面を計算して作成するウェブサービスです。
([https://pdbj.org/help/derived-databases-menu](https://pdbj.org/help/derived-databases-menu%EF%BC%89%EF%BC%89))
入力QueryはPDBファイル
### ProMode Elastic
[https://pdbj.org/promode-elastic](https://pdbj.org/promode-elastic)
ProMode Elastic (プロモードエラスティック)はプログラムPDBETA(Elastic-network-model based normal mode analysis in Torsional Angle space for PDB data、二面角を独立変数とする弾性ネットワークモデルによる基準振動解析計算プログラム)を使ってPDBデータの基準振動解析を行った結果のデータベースです。
([https://pdbj.org/help/derived-databases-menu](https://pdbj.org/help/derived-databases-menu%EF%BC%89%EF%BC%89))
入力QueryはPDBID。
トップページ下の連絡先メールアドレスがまだ早稲田大になっているが変更すべき?→[PDBj問い合わせページ](https://pdbj.org/contact?tab=PDBjmaster)
### hGTOP
[http://p4d-info.nig.ac.jp/hGTOP/](http://p4d-info.nig.ac.jp/hGTOP/) → [http://pford.info/hGTOP_db/](http://pford.info/hGTOP_db/)
hGTOPはヒト、マウス、ラットのゲノムに含まれる蛋白質をアノテーションしたデータベースです。含まれるアノテーションは、構造既知のホモログ蛋白質、予測(または実際の)2次構造や天然変性領域など立体構造に関するものが主なものですが、その他にも約170種の代表的な生物種のゲノムに含まれるホモログのデータも含まれます。
([https://pdbj.org/help/derived-databases-menu](https://pdbj.org/help/derived-databases-menu%EF%BC%89%EF%BC%89))
入力Queryは生物種(選択式)とキーワード(自由記述)
## 教材
トップページ→ホームに入門サイトへのリンクを追加
初めての利用者向けのガイド
→もう内容が古く実態に合っていない
教育目的は入門サイトへ、などを書くといいかも
→明日のPDBj meetingで提案
入門サイトで稼働しているサービスについては、PDBjトップページメニューのリンク先を入門サイトに変更する。
とりあえず、万見プライム、ゲーム、ペーパークラフトは切り替えOK。
eProtS、今月の分子、過去の講習会(→各種資料)はまだ。
### eProtS
タンパク質構造百科事典(encyclopedia of Protein Structures)

現在:[http://ipr.pdbj.org/eprots/](http://ipr.pdbj.org/eprots/)
将来的には:[https://numon.pdbj.org/eprots](https://numon.pdbj.org/eprots)
生物学的に重要なタンパク質を選び、その立体構造を表示するとともに、タンパク質の構造と機能についてわかりやすく解説したものです。タンパク質構造の専門家でない方にも利用しやすいように、日本語版と英語版を用意しています。出展:[PDBj Help](https://pdbj.org/help/eprots)
WikiPediaと同じようなwikiシステムを採用しており、どなたでも記事を作成することができます。
現在移設作業中(WiLiKi→Mediawiki)
2009年から稼働しているサーバ(pdbjkw1、すでに保守切れ)がこれだけのためにまだ残っている。
### 今月の分子

現在:[https://pdbj.org/mom](https://pdbj.org/mom)
将来的には:[https://numon.pdbj.org/mom](https://numon.pdbj.org/mom)
PDB-101(RCSB PDB)の[Molecule of the Month](http://pdb101.rcsb.org/)(著者:David S. Goodsell博士)の日本語訳。社会で話題となっている内容に関わる分子を蛋白質構造データバンク(PDB)から選び、機能と構造に関して解説しています。
### 万見プライム

URL:[https://numon.pdbj.org/prime/](https://numon.pdbj.org/prime/)
- 万見プライムは、生き物の分子の立体構造を見ながら、生物学を楽しみ学ぶためのサービスです。
- 小中学生の学習にも使えるページを目指しています。
- 立体視用の赤青メガネを利用すると、簡単に立体的に見ることができます。
- スマートフォンから大画面のPCまで、幅広い環境で使えるようにしています。
- 分子構造ビューアとして、[Molmil](https://pdbj.org/emnavi/doc.php?id=molmil)を利用しています。
- [PDBj](https://pdbj.org/)が運営しています。
立体構造からなにがわかるの?
時計がどいう仕組みで動くのか、車がどういう仕組みで走るのか、そういった機械の仕組みを知るには、歯車やエンジンなど部品の構造を知る必要があります。生き物の仕組みを理解するには、生き物の部品である「生体分子」の構造を理解する必要があります。世界中の研究者がさまざまな生命現象の仕組みを解明するために、さまざまな生体分子の構造を研究しています。万見プライムで立体構造を見て、生き物の仕組みにふれてみてください。
### 過去の講習会
URL:[https://pdbj.org/info/previous-workshop](https://pdbj.org/info/previous-workshop)
過去に行われた講習会などの講演資料。
* 時系列に羅列されているだけ。目的がはっきりしていれば検索で目的の資料を見つけられるが、教科書的に読んでいくような見方には適していない。
### PDBjゲーム
蛋白質に関係する2種類のゲームを用意しています。

#### 神経衰弱
札をめくって同じアミノ酸や蛋白質を探す神経衰弱ゲームです。
URL: [https://pdbj.org/pelmanismGame](https://pdbj.org/pelmanismGame)
→[入門サイト](https://numon.pdbj.org/games/)にもある。
* ペアができたらその分子の簡単な解説を出す。可能なら万見プライムページも用意してリンクを張る。あとはWikipediaへのリンクなどもつける。
#### スネークゲーム

蛋白質を合成する「リボソーム」を操作して、指定された配列のペプチド鎖を作るスネークゲームです。壁などにぶつかるとライフが減少し、ライフが0になるとゲームオーバーになります。
URL: [https://pdbj.org/aminoSnakeGame](https://pdbj.org/aminoSnakeGame)
→[入門サイト](https://numon.pdbj.org/games/)にもある。
* ゴールしたらその分子の簡単な解説を出す。万見プライムページも用意してリンクを張る。あとはWikipediaへのリンクなどもつける。
### ペーパーモデル
紙を切ったり折ったりしてタンパク質などの分子をつくる。
[https://numon.pdbj.org/papermodel/](https://numon.pdbj.org/papermodel/)
## PDBjについて
### 出版物
### ニュースレター
### PDBjメンバー
### 蛋白質立体構造データベース専門部会
### 利用規約・プライバシーポリシー
## 設定
### ヘルプ
### パネル
### その他設定
### 設定を初期状態に戻す
→名称は「設定を初期化」の方が分かりやすいのでは?
### ログイン
### ジョブマネージャ