第30回
2016.06.14 Tue
「STAP細胞事件」-石川氏は小保方氏が若山夫人のES細胞を盗み、STAP細胞を捏造したと告発していた(3)



和モガ氏は以下の情報を得ている。
>>
「小保方晴子さんへの不正な報道を追及する有志の会」には2015年3月1日の石川氏のFacebookが紹介され、そこには次のように書かれている。
①2015年1月18日に山梨大を訪問した。
②甲府駅で若山氏が出迎えてくれたが、若山氏とは初対面だった。
③若山氏は精神的に酷くまいっているようで、彼とは5分くらいしか話せなかった。
④代わりに若山研のスタッフから詳細な説明を受け、膨大な証拠を手に入れた。
⑤自宅に戻ってすぐ、告発状の文章を改訂し、司法書士と相談しながら最終版を仕上げた。

④は奥さんと大日向氏だと知られている。
和モガさんは129/GFP ESに関して奥さんが自分のものだと言ったと言うことには疑問を呈している。石川氏が勝手にそう思い込んだという推測である。しかし、この④が犯人の第三者だと言ってるんですね。
>>
「小保方~地獄の底はまだまだ深いぜwww 」。これは、2014年6月18日に投稿されたオホホポエムの最後の一行であるが、この若山研スタッフの行為は、このような感覚に近い。仮に、小保方氏のおかげで研究不正の片棒を担がされてしまった恨みだとしても、実質的な被害を免れた若山研で、とてもここまではいかないはずである。
私はこの「STAP細胞事件」は、STAP細胞を発見した小保方氏に捏造の罪を着せるため、数々の偽装工作を行った事件だと思っている。それには、小保方氏に敵意をもつ第三者が必要であるが、図らずもこの告発騒ぎで、そのことは証明されたと思っている。
告発は虚偽の情報によってなされたものである。それが分かった以上、虚偽の内容とはどのようなものであったのかを石川氏は明らかにする義務があると思う。


奥さんか大日向氏だと言ってるも同じですが、大日向氏は当時理研の別のラボに居ましたからすべての実験にESコンタミさせることはできません。従ってここは奥さんだと言ってるんです。
ここで根本的疑問は桂報告書が2011/11/28の4Nキメラが最初の成功だと言ってるのに、この4Nキメラにどうして奥さんがキメラ成功するようにESコンタミさせなければならないのかという疑問です。そこでまだ検討は先になりますが、和モガさんの説だとこの2011/11/28の4Nキメラの前に最初のキメラが出来ているのだとしたのですが、この推定だと小保方さんの手記には嘘が無いことになりますから、手記に書かれた経緯を日数計算で追っていくとこれより早くにキメラが出来たと言うことはなさそうなんですね。

第31回
2016.08.07 Sun
「STAP細胞事件」-8番染色体はトリソミーだったのか?(1)


遠藤論文で公開データから8番染色体にトリソミーの証拠があって、これはES細胞でできている証拠であるとしているが、それに関して反論したいと言っている。論文論旨の概略説明ですね。

第32回
2016.08.09 Tue
「STAP細胞事件」-8番染色体はトリソミーだったのか?(2)

遠藤論文のFigure 3です。

ル430

レジェンドは以下。
>>
Trisomy detected by SNP analysis of RNA-seq data. (A) Allele frequency distributions of whole chromosomes and chromosome 8. Only chromosome 8 of STAP cells had a peak that was not centered approximately 50%, indicating that chromosome 8 originating from the 129 strain was duplicated to produce trisomy of the chromosome. Unlike the RNA-seq data analyzed in Figs 1 and 2, the RNA-seq data analyzed in this figure were generated using the SMARTer reagent kit. (B) Expression analysis by chromosome. Only genes on chromosome 8 were significantly more expressed, and genes on chromosome 13 were significantly less expressed. P-values were calculated using two-sided Student t-tests.

使われたデータは以下です。
>>
SMARTer-Seq
③SRR1171572 CD45 positive Cells:RNASeq.SMARTer.Rep1 C57BL/6x129/Sv
④SRR1171573 CD45 positive Cells:RNASeq.SMARTer.Rep2 C57BL/6x129/Sv
⑨SRR1171578 Low pH treated CD45 positive Cells:RNASeq.SMARTer.Rep1 Oct3/4 expressing cells C57BL/6x129/Sv
⑩SRR1171579 Low pH treated CD45 positive Cells:RNASeq.SMARTer.Rep2 Oct3/4 expressing cells C57BL/6x129/Sv


これで山が1/3のところにあるからトリソミーだと言ったことに対して和モガさんが又ど素人にはややこし過ぎる推定で違うと言ったということです。
6月の記者会見で若山さんが慌ててキメラできてるからトリソミーは無いと言ってるのに、まだ9月に東北大のGENES TO CELLSに投稿採用されて恥の上塗りをしたわけです。遠藤論文はES細胞のコンタミでキメラが出来たのだと言ってるわけで、トリソミーが有るのがES細胞である何よりの証拠だと鬼の首を取ったかのように勝鬨を上げたらトリソミーがあったらキメラは出来てない筈だねということになる。トリソミーがあったらクローン胚に入れてntES化してすら生まれて来ませんからね。若山さんはES細胞が渡されたと言って逃げようとしているのにそれでは藪蛇だ。慌てた若山さんに否定されて、そのくらいの理屈が分からないで博士になってますか。そんなことは無いんですね。どうして恥の上塗りをしたか。世間には分かりはしないからとことん小保方さんをディスレという指示が出ているわけですね。現に日経サイエンスの馬鹿記者を見ればわかる。トリソミーがあるのは自然細胞ではなくES細胞だからだと書いていながら、それを移植したらキメラも生まれないよねと言うことに気付きもしない。アッポです。何なんでしょうかね、この日本の知的レヴェル低下って。もの考えてるのか。これで賞を取ったり、編集長に昇格してたりするからチャンコロ国並みですね。嘆かわしいなんて話で済むのか。



(2021/7/18)


さて、この公開データのマウス背景は桂報告書15Pに以下の様にある。
>>
(調査結果)
論文や公共データベース登録内容に基づくと、これらの解析に用いている細胞株は CD45+ 細胞、TS 細胞を除いて 129xB6 ヘテロ系統マウス由来であり、挿入されている GFP のタイプは CAG もしくは Oct4 である。しかし、ChIP-seq input データの解析から、FI 幹細胞は Acr-GFP/CAG-GFP が挿入された 129xB6 へテロ系統、CD45+ 細胞は Oct4-GFP が 挿入された B6 ホモ系統STAP 細胞, STAP 幹細胞は CAG-GFP が挿入された 129xB6 へテ ロ系統由来であることが強く示唆された。一方 RNA-seq (Truseq)データの解析からは、 FI 幹細胞は Oct4-GFP が挿入された B6 ホモ系統、CD45+と STAP 細胞は CAG-GFP が挿入さ れた 129xB6 へテロ系統、STAP 幹細胞は Acr-GFP/CAG-GFP が挿入された 129xB6 へテロ系 統由来であることが示唆された。

桂報告書は遠藤氏の解析したSMARTer-Seq分の解析は行わなかったのである。何故かは押して知るべしですね。この事件に関して最初に非難声明を出したのは日本細胞生物学会理事長で東北大歯科出身の大隅でしたね。桂記者会見でヨーク大のアッポ古田と出来質疑応答をしたのは東北大教授の伊藤で、BCA報告書の責任者は昔東北大で教鞭をとっていた松崎ですし、言わずと知れた遠藤も東北大、若山さんがFESを分析に出した黒木も東北大です。裏にミューズ細胞利権もからんでるんですね。若山さんはそれを利用した。松崎と笹井さんがライバル関係にあったのも知ってて利用しているんですね。まあ、こういうことはありがちなことでSTAP事件だけではない。でもそういう問題とここで犯罪が行われたと言うことは別問題です。どこにでも競争はありますがどこででもは犯罪はないのです。

ChIP-seqではCD45+細胞は「GOF」、酸浴STAP細胞は「僕のマウス」
RNA-seq (Truseq)ではCD45+細胞と酸浴STAP細胞は「僕のマウス」

では、SMARTer-Seqではどうでしょうか。公開データの背景にはどちらもC57BL/6x129/Svと書かれていますから一応F1だとされている。また、遠藤氏がその解析結果としてB6のアレルの山が半分に来ているとしていますからどちらもGOFではないわけです。従って、それぞれが「僕のマウス」であるか、「岡部マウスとのF1」であるかのどちらかになる。

因みに、FI幹細胞に関しては

ChIP-seq
では「岡部マウスとのF1」
RNA-seq (Truseq)では「GOF」

STAP幹細胞に関しては

ChIP-seqでは「僕のマウス」
RNA-seq (Truseq)では「岡部マウスとのF1」

ということです。FI幹細胞とSTAP幹細胞の二つに関してはSMARTer-Seq解析はありません。

ところでSTAP幹細胞は何種類作られたのか。

①最初のF1キメラ成功時の幹細胞
❷GL
➌GLS
❹FLB
❺FLS
⑥DBF1の幹細胞
⓻胎盤の光ったSTAPキメラ作成時のB6/129の幹細胞
❽AC129

ChIP-seqのSTAP幹細胞の「僕のマウス」がなぜあるのか。そんなもので幹細胞は作られてはいない。AC129は名づけからして本来129/Svで作られている筈のものだ。ところが後日時点でのAC129の検査結果は「僕のマウス」でした。そして小保方さんが提出したとされているChIP-seqのSTAP幹細胞が「僕のマウス」だったということは、提出時点で既にAC129が「僕のマウス」であったことを証している。

小保方さんはまず129/Svを渡されている。恐らく129X1/Sv-CAG-GFP(ホモ)マウスでしょうね。「僕のマウス」の母親です。ロックフェラー大で作ったB6-CAG-GFP(ホモ)マウスから129にGFPを移した奴です。白毛ですからすぐわかる。実験がこのマウスで行われたことだけは明白で、小保方さんは論文に129/Svのローザだと書いていて、しかもキメラ確認もされていると書いている。にも拘らずGRAS に提出されたSTAP幹細胞の一つが「僕のマウス」であった。そして後日残されていたAC129を解析した結果が同様に「僕のマウス」であった。この培養開始日は2012/8/13とされている。小保方さんが最初にGRASに様々な細胞サンプルを提出したのも8月とされている。小保方さんはSTAP幹細胞の誘導はできないので、当然若山さんからSTAP幹細胞であると言って渡されたものを、後に誰も工作していない限りはC57BL/6x129/Svと書いて提出したことになる。
小保方さんが「僕のマウス」ESをSTAP幹細胞と間違えて提出したと言うことはない。なぜならば後のAC129の中身も「僕のマウス」ESだったからである。小保方さんが犯人でなければ、犯人でないことは24個も証拠を上げているが、真犯人は8月の時点で小保方さんに幹細胞だと言って「僕のマウス」ESを渡し、AC129の中身も「僕のマウス」ESにしておいたのだということになる。小保方さんがC57BL/6x129/Svとそれを書いたのが事実ならそれはFLSか、さもなければ胎盤の光ったキメラ作成時の幹細胞だと言われて渡されているのである。

この胎盤の光った時のキメラはC57BL/6x129/Svであるとレター論文には書かれている。

⓻胎盤の光ったSTAPキメラ作成時のB6/129の幹細胞

これがあったのだとしたら、<STAP幹細胞に関してはChIP-seqでは「僕のマウス」>は不思議でもなんでもないということになるが、桂報告書は親の雌雄確認をしていない。この辺りが次の課題であるXistの実験と絡んでいるんですよね。

さて、和モガさんの主張に戻りましょう。遠藤氏が解析したのはSTAP幹細胞ではありません。小保方さんが酸浴細胞だと書いているものです。これの背景が129とB6のFIだが、8番染色体にトリソミーがあると主張した。これが事実であったか否かは既述したように桂調査は解析していません。そして若山さんは遠藤氏の事前の話に対して、キメラができていると語った。これは論文通りであれ、私のntES論であれ、キメラは出来ているのですから、キメラの出来ている細胞に関してはトリソミーはない。そのことは遠藤論文にも書かれている。
>>
The STAP cells used in the experiments were derived from 129 and B6 cells, and the duplicated chromosome is presumed to be from the 129 parent because it contained only non-B6 SNP alleles. It is notable that trisomy 8 is the most common chromosomal aberration in mouse ESCs, with 31 of 97 examined cell lines reported to carry this abnormality (Mayshar et al. 2010). ESCs having trisomy 8 have a growth advantage, but chimeras will not transmit the mutation to the germ-line (Ben-David et al. 2013), and trisomy 8 in mice results in prenatal death by day 12 or 13 (Kim et al. 2013).

遠藤氏は従って、小保方さんの作って提出したはずのこのSTAP細胞はES細胞であり、かつキメラ確認されていないものだと言ってることになるんです。それに対して若山さんはそんな筈はないよ、その細胞でキメラを作ったよと言ってる。つまり遠藤氏がどの公開データを解析したのかを分かって言ってるということである。
SMARTer解析に出した細胞は自分はみんな知ってるということです。

SMARTer-Seq
①SRR1171570 Blastocyst stage embryos:RNASeq.SMARTer.Rep1 C57BL/6x129/Sv
②SRR1171571 Blastocyst stage embryos:RNASeq.SMARTer.Rep2 C57BL/6x129/Sv
③SRR1171572 CD45 positive Cells:RNASeq.SMARTer.Rep1 C57BL/6x129/Sv
④SRR1171573 CD45 positive Cells:RNASeq.SMARTer.Rep2 C57BL/6x129/Sv

⑤SRR1171574 Embryonic Stem Cells:RNASeq.SMARTer.Rep1 C57BL/6x129/Sv
⑥SRR1171575 Embryonic Stem Cells:RNASeq.SMARTer.Rep2 C57BL/6x129/Sv
⑦SRR1171576 Morula stage embryos:RNASeq.SMARTer.Rep1 C57BL/6x129/Sv
⑧SRR1171577 Morula stage embryos:RNASeq.SMARTer.Rep2 C57BL/6x129/Sv
⑨SRR1171578 Low pH treated CD45 positive Cells:RNASeq.SMARTer.Rep1 Oct3/4 expressing cells C57BL/6x129/Sv
⑩SRR1171579 Low pH treated CD45 positive Cells:RNASeq.SMARTer.Rep2 Oct3/4 expressing cells C57BL/6x129/Sv


どうしても気になるのでここでちょっとXistの問題にもう一度触れておきましょう。メスの細胞でのみ確認しなければならない実験です。以下の写真がある。

ル324


ル325

この中で公共データに登録されたEpiSCは以下です。

Tru-Seq
③SRR1171558 Epi Stem Cells:RNASeq.Rep1 129/Sv
④SRR1171559 Epi Stem Cells:RNASeq.Rep2 129/Sv

これがAC129と同じ129/Svです。マウス背景での出来方の違いを調べるためにAC129の実験を行ったというが、本当にそうかということです。ネイチャーも、セルもリジェクトされているこの8月になってまだそんなことをやってるのか。これって最初はXistの実験ではなかったのか。

仮にそう仮定すると上の写真は本来全てメスの細胞で、かつマウス背景が全部129/Svであることが通常の実験条件になる筈である。CD45+細胞とその酸浴STAP細胞は実際AC129の実験の時に赤ちゃんマウスを渡されているのでそれが全部メスだったとすればいい。ES細胞は若山さんが129/Svから作って一個の細胞を調べてメスのES細胞株を選別しなければならない。EpiSCはこれも129/Svから作って一個の細胞を調べてメスのEpiSCだけを選別しなければならない。で、問題はSTAP幹細胞であるが、これは小保方酸浴細胞を貰ったものを培養誘導で作るか、その核をクローン胚に移植して、ntES化し、それをキメラ胚に入れてキメラ樹立確認された株を選ぶことになる。この分はいずれにせよ雌雄の確認はしなくていい。最初からメスの赤ちゃんを渡している。
で、この実験結果が事実だとする。これはとんでもないことになる。まず酸浴STAP細胞は半分Xistが解除されている。つまり何か知らないがとんでもないリプログラムになっているということである。そして、問題のSTAP幹細胞であるが、ESと同じになっている。小保方さんの作ったSTAP細胞からSTAP幹細胞への培地誘導は丹羽さんができなかった。従って、キメラが出来たのは私のntES論だとして、若山さんがntES化したのだとする。キメラが出来るのは当たり前である。しかし、XistはSTAP細胞では半分リプログラムされているのにそれをntES化したらESと同じになった。これはとんでもなく意味のある実験結果です。
胎盤がなぜ光ったのかという原因は単にntESの性質のけがの功名的発見であったのか、そこに酸浴細胞の何らかの知られざるリプログラム過程が加わったからなのか。

AC129がなぜ「僕のマウス」になってしまったのか。
AC129の培養開始は2012/8/13である。まだサイエンス論文はリジェクトされていない。そして手記によれば同じく8月頃に若山さんは特許手続きを始めて自分に51%だと言い始めた。
サイエンス論文のリジェクトは8/21である。リジェクトを受けて小保方さんは幹細胞化実験のデータを渡されて二報同時だと執筆を急がされた。また8月のいつ頃かは分からないが、GRASに提出したSTAP細胞とSTAP幹細胞が「僕のマウス」になっていたのです。
更に10月一緒に山梨に来いと再び強く誘われたのです。しかし、彼女はヴァカンティ氏の元に帰ることを選んだ。11月10日前後に渡米した。

129のマウスを渡されて捏造に使うマウスが無いからと言って「僕のマウス」ESを使う人がいますかね。そんないい加減な人がGOFとF1は使い分けるなんて。ましてや、BDF1のESは奥さんのラベルのまま残しているなんて。なにか、おかしいですね。捏造は12/27テラトーマから始まってますからね。随分前からおかしなことは始まっていて途中からではない。
AC129とFLS-Tの「僕のマウス」ESによる捏造が最後なんですね。どうしてこうしておかなければならなかったのか。そしてどうしてその始まりが8月のGRAS提出からなのか。

今和モガブログを読み直しているところですが、どうしても自分の方の未解決問題が頭から離れませんね。人の意見を聞いていてヒントになることもあるはずと思って敢えて迂遠な道を選んでいる。何か一つまだ知られていないミッシングリングが有るんですね。
現在閲覧者はだいぶ減ってきていつもの10人から20人に落ち着いているようです。私の熱心な読者のためにここで動かぬ確認事項をもう一度示しておきましょうかね。いろんな可能性にふらふらと揺り戻しながら考え続けているんですが、キメラが既存のES細胞のコンタミで出来たと言うことは無いと言う確認です。


ル175
いいですよね。BDF1のSingleはES細胞を渡したらたくさん出来てしまいます。そしてこのデータは若山さんが小保方さんに渡したものだと言うことはキメラ実験が若山さんにしかできないことなんですから当然です。第三者はBDF1Singleでキメラが一匹だけ出来て、Clusterでたくさん出来るようなコンタミはさせられません。
それと、もう一つ。このデータがあることを小保方さん自身が知っているのにアーティクルではSingleの結果はなかったことにされていること。



流石に僕の長い読者である10人から20人の間の方々はこのことは心底理解されているはずですね。
私の残された謎は若山さんの行為の中でまだ分かってないところです。下世話な言い方ですが、犯人はもう確定しているんです。何をしたのだということですね。WHEN WHERE WHO WHAT HOWの全貌です。
この表を付けて特許のクレームを続けているヴァカンティ兄弟や小島さんがこのことを知らない筈もありませんね。私はど素人だから気づくまで時間がかかったが、彼らはプロです。同盟国たる日米の外交問題になる前に謝った方がいいと思いますがね。彼らは知っていながら事情を理解して黙って日本側の対応を待ってるんじゃないですか。誰か間に入って政治解決して来ないといけないんじゃないか。


(2021/7/19)


こんどこそ和モガブログに戻りましょう。

ル431

先に挙げた遠藤論文のFigure 3の一部ですね。8番染色体部分です。①がCD45陽性細胞、②がその酸浴STAP細胞で、データはSMARTer-Seq分で、桂報告書の触れていない分だと既述した。rep1,2とあるのは登録されている記録だというのも記述している。何度でも再掲しましょう。replicateかreplicaの略なのかどうかはど素人なので定かでない。
>>
SMARTer-Seq
③SRR1171572 CD45 positive Cells:RNASeq.SMARTer.Rep1 C57BL/6x129/Sv
④SRR1171573 CD45 positive Cells:RNASeq.SMARTer.Rep2 C57BL/6x129/Sv

⑨SRR1171578 Low pH treated CD45 positive Cells:RNASeq.SMARTer.Rep1 Oct3/4 expressing cells C57BL/6x129/Sv
⑩SRR1171579 Low pH treated CD45 positive Cells:RNASeq.SMARTer.Rep2 Oct3/4 expressing cells C57BL/6x129/Sv


和モガさんの説明を聞きましょう。
>>
それぞれにrep1とrep2とあるのは公開データベースにRep1とRep2の2種類が登録されているからである。その右横にある数字は調査したSNPの数を表している。
グラフ①のCD45+細胞のピークは50%のところにあり、②のSTAP細胞は33%近くにあるので、これが8番染色体のトリソミーを表しているという主張である。


カッコ内はSNPs数だということです。STAP細胞のrep1で1154個、rep2で1275個と書かれている。
「その右横にある数字は調査したSNPの数を表している。」と書いたのは和モガさんです。
"調査したSNPの数"だとは遠藤論文には書かれていないのでどうしてこんな説明になっているかと考えるに、私の認識でもこんなに少ないSNPs数は変だと思える。マウスのSNPsは全体で約3百万か所あると思ってますからね。和モガさんは「SNPはマウスで約300万個あると言われている。」と言ってますし、そういう記事も見たことがある、25億の塩基対の1000個所に一つあると言う説明からも2.5百万個になる。でもどうやらこれは勘違いですね。
というのもSNPsというのはある集団の中に1%以上ある一塩基変異です。マウスなら100匹に1匹ある変異です。300万個所知られているSNPsを1匹のマウスが持っている確率は1/100ですから3万個です。近交系マウスというのは個人がクローン集団を作っているようなものですから1匹分のSNPsがたまたま完成時に固定されただけのものですから一匹につき大雑把な理解で3万個なんですね。

これも今初めて分かった。

約3万個を20個の染色体で割ると一染色体につき1500個のSNPsだ。B6の8番染色体の登録SNPs数はその程度の数なんですね。

これで桂報告書とBCA報告のFES1とFES2とで違っているSNPs箇所24,649の意味と、そこから交叉要因を除いた1,290の意味の理解が違ってくると分かる。とてつもなく変ですが、後回しにしましょう。

以前和モガさんは「マウスの染色体は性染色体の他、1番~19番まである。このため、ざっくり言うと6番染色体のSNP分布図は約15万個のSNPを色分けしたモザイク画ということになる。」と書いてますから、彼はこの8番染色体のカッコ内のSNPs数を遠藤氏が意図的に選んで調査した数だと理解したんですね。私のSNPs理解は和モガさんに従ってますからね。他人の所為にするわけではないが、こういうのを説明してくれている専門家がいないから一番詳しそうな和モガさんの理解が無意識に摺り込まれてしまうんですね。遠藤氏はバイオインフォマティックスの専門家ですからこんなところを間違えるはずはない。敵の力も利用しないと戦争には勝てませんね。いい勉強になった。

さて、次はグラフの意味ですがSTAP細胞のrep1だけ見てその意味が分かれば後は簡単のはずです。両軸とも%表示です。縦軸はSNPsの数です。目盛りは最大5%です。横軸はB6タイプの塩基ですが意味が分からない。0と100の手前で無限大になっている。つまりこれはSNPs以外の塩基も調べているということですね。129もB6も特異的遺伝子はSNPsと比べればそれは無限に近くありますから両端が持ち上がるのはいいとしましょう。ゼロ側が129で、100側がB6だ。それ以外の違いはSNPsが主になりますから、F1なんですから真ん中にピークが来るでしょうということですね。

どうもおかしいな。違うね。そもそもこれはDNAの全解析ではないですしね。RNA解析なので核外に出ている必要な蛋白質作製用の複写遺伝子ですね。スプライシングも受けてますからDNA のほんの一部です。8番染色体の全SNPsではどういう意味でもあり得ません。ほとんど必要な遺伝子のしかもエクソン部分だけの上に乗っているSNPsだ。そろそろ遠藤論文の検討に入らないといけないでしょうかね。今和モガさんの説の検討中ですけどね。その前にまず調べられているのは公開データなんですから当然RNAデータです。その確認です。Figure 1です。


ル432

レジェンドは以下です。
>>
Allele frequency analysis of RNA-seq data. (A) Simulation of SNP allele frequencies using a modified binomial distribution. Peak position was determined by the composition of two alleles, and variance of the distribution was dependent on sd, standard deviation of simulated PCR bias. (B) SNP distributions in several cell types. ESCs (red, SRR1047502, 129B6F1 background), iPSs derived from fibroblasts (yellow, SRR1047504, 129B6F1), MEFs (blue, SRR104220, 129B6F1), normal fibroblasts (NFs; green, SRR1191170, B6 x BALB/c), cancer-associated fibroblasts (CAFs; purple, SRR1191171, B6 x BALB/c), and HSCs (gray, SRR892995, B6). The number of applied SNPs for each cell type is shown in parentheses in each box. (C) Allele frequency of HSC samples contaminated with different percentages of ESCs as shown.

ESCs<129B6>=23,838SNPs
iPSs<129B6>=24,796SNPs
MEFs<129B6>=5,948SNPs
NFs<B6BALB/c>=5,945SNPs
CAFs<B6BALB/c>=8,580SNPs
HSCs<B6>=29,315SNPs

これは「300万個所知られているSNPsを1匹のマウスが持っている確率は1/100ですから3万個です。」という話とは全く別問題です。例えばB6に3万個あるSNPsがES細胞の段階で細胞質内にRNAとして80%も発現しているのかという問いです。体細胞に近くなるほど発現遺伝子は制約されてくる。HSCというのは造血幹細胞です。



(2021/7/19)


昨日釣りをしながら考えて決めました。和モガブログ検証中ですが、ここで一度遠藤論文のリヴューをやります。以前から何度もこの論文の検証をしようかどうかを悩んだ時点がありましたが、事件解明のためにはもっと重要な関心事が多かったので延び延びになっていた。ここでやりましょう。タイトルにもそれを加えます。
その前に、「300万個所知られているSNPsを1匹のマウスが持っている確率は1/100ですから3万個です。」という新理解がBCAの赤枠問題とどう関係しているかをもう一度調べ直して置きましょう。必要情報は以下でしたね。

*****


ル412


ル413



ル17


ル19


b, SNP mosaicisms of chromosome12 (Chr12) in Acr/cag-GFP+cells. The panel shows SNPs in the 1-megabase resolution. A large SNP mosaic region (a red rectangle) is different betweenFES1 and FES2 ES cells. All Acr/cag-GFP+STAP-cell lines have the same mosaicism as FES1 ES cells (see Extended Data Fig. 1 for Chr6 and Chr11)

b、Acr / cag-GFP陽性細胞における12番染色体(Chr12)のSNPモザイク現象。 パネルには、1メガベース解像度のSNPが表示されている。 大きなSNPモザイク領域(赤い長方形)は、FES1とFES2のES細胞で異なっている。 すべてのAcr / cag-GFP陽性STAP細胞株は、FES1 ES細胞と同じモザイク現象を示している(Chr6およびChr11については拡張データ図1を参照)。

本文

Second, FES1 and the STAP cell lines with Acr/cag-GFP share large SNP clusters that differ between FES1 and FES2 in three chromosomes (Fig. 1b and Extended Data Fig. 1b, c). These differential SNP clusters probably arose from chromosomal heterogeneity in the parental mouse colonies when FES1 and FES2 were established. It is highly unlikely that the Acr/cag-GFP STAP cell lines and FES1 all independently acquired these two unique deletions and inherited the same three mosaic chromosomes from parental mice.An ES cell stock, 129/GFP ES, was also found to share all these genomic features(Extended Data Table 1).
 After the above three SNP clusters reflecting parental heterogeneity are excluded, the remaining 1,290 SNP alleles that distinguish FES1 and FES2 are supposed to have accumulated at or after establishmentin 2005. Regarding these SNPs, STAP cell lines FLS3 and CTS1 and129/GFP ES cells are nearly identical, but differ slightly from FES1 (at30% of these alleles), suggesting that STAP cell lines FLS and CTS were derived from a sub-stock of FES1 ES cells.

第二に、FES1とAcr / cag-GFPを含むSTAP細胞株は、3つの染色体でFES1とFES2の間で異なる大きなSNPクラスターを共有する(図1bおよび拡張データ図1b、c)。これらの差異を示すSNPクラスターは、おそらくFES1とFES2が確立されたときの親マウスコロニーの染色体の不均一から生じたものである。Acr / cag-GFP STAP細胞株とFES1がすべて独立して、これら2つの固有の欠失を獲得し、親マウスから同じ3つのモザイク染色体を継承した可能性はほとんどない。ES細胞ストックである129 / GFP ESも、これらすべてのゲノム機能を共有していることがわかった(拡張データ表1)。
親の異質性を反映する上記の3つのSNPクラスターを除外した後、FES1とFES2を区別する残りの1,290のSNP対立遺伝子は、2005年の設立時またはその後に蓄積したと考えられる。これらのSNPsに関して、STAP細胞株FLS3、CTS1および129 / GFP ES細胞はほぼ同一であるが、FES1とはわずかに異なり(これらの対立遺伝子の30%)、STAP細胞株FLSおよびCTSがFES1ES細胞のサブストックに由来することを示唆している。

サプリ

Whole-genome sequencing and SNP identification

We used the TruSeq DNA PCR-Free LT Sample Prep Kit for sequencing library construction using a standard protocol. 
The insert size of the STAP cell lysate sample is 350 bp and the other 14 samples are 550 bp each. 
We performed paired-end 150 bp sequencing for each DNA sample using 2 flow cells in the rapid-run mode of a HiSeq 2500 sequencer. We aligned paired-end sequence tags to the GRCm38 (mm10) mouse reference genome using BWA software4 (ver. 0.7.10) with “-n 0.02” option for the bwa aln command and “-a 2000000” option for the bwa sampe command.Raw data are available at DDBJ DRA (accession: DRA002862) (http://trace.ddbj.nig.ac.jp/DRASearch/submission?acc=DRA002862). 
After filtering properly mapped tags and then removing PCR duplication with SAMtools (ver. 0.1.19), we identified SNPs from the aligned sequence data using SAMtools Mpileup and BCFtools (ver. 0.1.19) with default options.
We also identified reliable SNVs including heterozygous alleles from aligned sequence data that satisfied the following criteria using SAMtools Mpileup after filtering the properly mapped tags.
 (1) Sequence coverage > 20. 
 (2) At least 25% of reads supported alternative alleles that differed from the B6 reference sequence. 
For comparison to 129/Sv SNPs, we used commonly called SNPs in 129P2/OlaHsd (EMBL ENA: ERP000034), 129S1/SvImJ (EMBL ENA: ERS076385), and 129S5SvEvBrd (EMBL ENA: ERP000036) but not called in C57BL/6NJ (EMBL ENA: ERS076384) provided by the Wellcome Trust Sanger Institute (http://www.sanger.ac.uk/resources/mouse/genomes/).

全ゲノムシーケンスとSNP同定 

我々は、標準プロトコルに従って、シーケンシングライブラリー構築用のTruSeq DNA PCR-Free LT Sample Prep Kitを使用した。STAP細胞溶解物サンプルのインサートサイズは350bpで、他の14サンプルはそれぞれ550bpである。
HiSeq 2500シーケンサーの高速ランモードで2つのフローセルを使用して、各DNAサンプルに対してペアエンド150bpシーケンスを実行した。 bwa alnコマンドに「-n0.02」オプション、bwa sampeコマンドに「-a2000000」オプションを指定したBWAソフトウェア4(バージョン0.7.10)を使用して、ペアエンドシーケンスタグをGRCm38(mm10)マウスリファレンスゲノムにアラインした。生データは、DDBJ DRA(アクセス:DRA002862)で入手できる。(http://trace.ddbj.nig.ac.jp/DRASearch/submission?acc=DRA002862)
適切にマッピングされたタグをフィルタリングし、SAMtools(ver10.1.19)でPCR重複を削除した後、SAMtools MpileupとBCFtools(ver.0.1.19)をデフォルトオプションで使用して、アラインされたシーケンスデータからSNPsを特定した。また、適切にマッピングされたタグをフィルタリングした後、SAMtools Mpileupを使用して、以下の基準を満たすアラインされたシーケンスデータからヘテロ接合対立遺伝子を含む信頼できるSNVsを特定した。
(1)シーケンスカバレッジ> 20.
 (2) 少なくともリードの25%が、B6参照配列とは異なる代替対立遺伝子になっていた。
129 / Sv SNPsとの比較のために、我々は129P2 / OlaHsd(EMBL ENA:ERP000034)、129S1 / SvImJ(EMBL ENA:ERS076385)、および129S5SvEvBrd(EMBL ENA:ERP000036)で共通にSNPとされているものを使用したが、ウェルカムトラストサンガーインスティテュート(http://www.sanger.ac.uk/resources/mouse/genomes/)によって提供されているC57BL / 6NJ( EMBL ENA:ERS076384)についてはそのようなことはしていない。

桂報告書(スライド)

ル2

*****

新理解ですぐに認識訂正されるのは最後の桂報告書の24,649sitesの意味です。DNAの全染色体のなかのSNPs比較です。基本的な全数が300万だという認識だと赤枠の中だとしか考えられなくなる。でも129とB6でそれぞれ3万だと考えると全部異なっていても合計6万です。そしてこれらの7細胞はほぼ同じ親ですからこのうちのFES1とFES2とで異なってるサイトが全染色体で24,649だということになる。6万の約半分です。と、考えたがこれは配偶子で半分になるからやっぱり3万だ。
そしてBCAの「親の異質性を反映する上記の3つのSNPクラスターを除外した後、FES1とFES2を区別する残りの1,290のSNP対立遺伝子は、2005年の設立時またはその後に蓄積したと考えられる。」という説明の意味を考え直すということになる。
すると全染色体の中のSNPs数から親の異質性由来部分である赤枠を除くと1290残ると言う意味になるのがわかる。
誤認の原因がまず基本的SNPs数の3万を3百万だと考えていることにあるわけです。300万というのはマウスという種に認定されているSNPs数であって、これを個体すべてが持っているわけではない。というのもすべてが持っていたらそれはSNPsでも何でもなくなってしまう。1%程度しか持ってないからSNPsなんですね。これって誰も気づいてないね。所謂擁護もアンチも気づかないで議論しているからどちらもトンチンカンだったということで、原因は和モガさんだね。本当の専門家は分かっているんだけど口をつぐんでいるし、そもそもこんな議論には参加してない。本物は居ないから基本の説明がないんだね。誰一人これを指摘したものは居ない。和モガさんが一番信頼されていたと言うことです。ショウガナイよね。ど素人同士で考えてるんだから、少しでも専門の近い人が言うとなんとなく摺り込まれちゃうんだよな。ど素人の悲しさで、先生が居るとすぐ教えてくれるね。居ないんだらショウガナイ。ないものねだりと言うのは子供のやることだ。それにそもそも専門家も自分の専門の最先端にいたら我々と同じで先生はもう居ないからね。胎盤がなぜ光ったか。誰も教えてはくれないよ。自分で調べるしかない。誰もやったことの無いことなんだから先生なんて居ようはずがない。どんな分野でも同じですよね。でも300万が3万だと教えてくれた先生はいたわけです。遠藤だな。呼び捨てだよ。あんな奴。先生でも悪党は悪党だからね。はは。

この理解だと全染色体にパラパラっと散在している1,290がとても少ない数だと分かる。全染色体に24,649あるものから赤枠の中の23,359の交叉原因を取り除くと全染色体にパラパラっと散在している1,290があると言う認識になる。3百万あると思ってたらとても理解できない筈ですよね。それだと赤枠の中の1,290の話にしかなり得ない。でも3万なんだよ。オーダーが二つも違っている。


新しい知見が入って考え違いを訂正したからまずそのまとめをやろう。

①マウスという種に認定されているSNPs数は凡そ3百万個である。これはあちこちに書かれている。但し実際にどう数えたものかどうかは定かでない。地球上に存在する全マウスを調べたわけではない。それと数え方にもよる。特に1%以上のグループに見られる変異という定義が、例えば最近の人間の定義だと5% 以上ともされているようだが、定義によって数は変わってしまう。人間の定義の変更は遺伝子病との関係で代表的な変異を調べたいと言う要求圧力による。5%に見られるものだけ調べたら、次は1%以上に調査を及ぼそうと言う発想ですね。なんでも機械的に調べて統計処理しましたと言う最初の内の調査から、その変異の意味するところまで深入りしているので逆にSNPS数を減らす形で定義が変更されているようですね。今回の間違いは100万から300万という大雑把な話で構わない。要するに100万のオーダーだということです。一応、和モガさんが最初に言い出した300万ということにしておきましょう。

②今回の勘違いは、たとえて言えば100人の人間が居て99人は或る場所の塩基がGなのに私だけAだとする。これがわたしのSNPです。同様に違う場所で99人がCなのにあなただけTだったとする。これがあなたのSNPです。人間は地球上にこの100人しかいないとします。そして他の人はSNPが無かったとします。この時"人間の認定されているSNPs 総数は二個だ"ということになる。"人間の認定されているSNPs 総数は二個だ"から100人全員がこの2個のSNPsを持っていると言う意味では無論ありませんよね。それではSNPにならない。他と違うから変異なんです。普段SNPsなんて考えている素人は居ませんからね。桂報告書を読んで初めて聞いたわけです。勘違いしても仕方ないですね。

③ところで、実際には地球上の人間の人口が100人ということはありませんから、1億倍するとする。100億人です。SNPsが2個しか知られてなければ何億になっても人間のSNPs総数は2個です。でも実際には2個なんてことはありません。100万から300万ある。100万か300万は数え方で1%以上なら300万で5%以上では100万なのかもしれない。そこが"認定されているSNPs"の認定定義によって変わるわけです。

④さて、では実際にはどうやって調べるのか。厳密にいえば全員調べないといけませんが無論そんなことはできません。サンプリングするんですね。私一人のDNAの全解析をやったってSNPは分からない。他人のと比較して違うところを見つける。他人との違いが変異なんですね。その違いの程度は今のところマウスでは全体に占める割合が1%以上ある変異だ。少なくと100匹分のDNA全解析しないと1%以上あるか否かは分かりませんよね。これは1%の判断をするための最小数です。でも実際にマウスのSNPsがいくつあるかは100匹なんていう調査で分かる筈がありませんよね。101匹目には新しいSNPが発見されるかもしれない。一体何匹調べたらマウス全体を調べたことになるのか。
マウスの人口は人間の人口より多いようですが。人間の全員を調べることができないように、マウスの全ての個体を調査することはできませんね。
統計処理するよりないということです。

⑤世界で手分けして調べるわけでしょうね。昔は全解析で1匹100万円くらいかかってたのかな。でも今では10万円を切ってるのかな。それでも日本の研究所ごとに100匹調べると10万円でも1千万の予算です。国家単位で1000億くらい入れたとして、100万匹しか調べられない。日米欧と協力して調べるんでしょ。その時に出来るだけマウスの亜種全体を調べたことになるように統計的に担当分担させる。どこかの国のどこかの研究機関のコンピューターにすべてのデータが集められる。最初はSNPsがどんどん発見される。でも、ある程度データが増えてきた時点で新規SNPの発見増加曲線の下降が始まりゼロに収束し始める。その前に実務的にはもうここいらでよかろうという判断をしないと結局地球上の全マウスを捕まえて尻尾を切るということになってしまう。そんなことはできないし、そんなところに行くずっと手前でマウスゲノム計画は終了するんでしょうよね。

⑥その結論がマウスの認定されたSNPs総数は300万個だということです。何百万匹調べたのか知りません。10万円で百万匹だと1千億円です。1千万匹調べたら1兆円です。日本の出した湾岸拠出金です。たぶんその中間のどこかあたりでしょう。

⓻では、近交系マウスB6の登録SNPs数はいくつなのか。300万個でないことだけは明らかですよね。ある1匹のマウスが全体では1%あると定義されている変異300万個の幾つを持ちうるかと考えた時に3万個だと逆残しましたがね。統計的に正しいかな。最初2匹のマウスから近交化されて行くから6万個だと言うことにはならないよね。ホモに揃ってくる時に片方が捨てられていくのだから3万個でいいと考えた。あ、配偶子で半分になるから結局は3万だね。


(2021/7/21)


さて、続きです。
⑧実際にはSNPsはコンピューター上でどう発見されて行くか。DNA鎖25億塩基対に1番から25億番まで番号が振られる。染色体ナンバーが最初にあってその中が1番から1.5億番程度まで打たれている。その番号の下に左から右に向かってACGGGTTCCCAGGAAA…という具合にシーケンスされた25億の塩基が置かれて行く。一匹分だけではSNPsは分かりませんね。比較するものが無い。そこで2匹目をその下に並べる。すると違ってるところが分る。結論的には亜種を構成している遺伝子群が違うのと、もう一つがこの一塩基変異種です。実際にはもう少し複雑なんですが今は亜種遺伝子群と一塩基変異だけに話を絞る。これも結論的には300万しかありませんから25億に対しては833個に一つしか現れない。
001匹目ACGGGTTCCCAGGAAA…
002匹目ACGGGTTCCCAGGAAA…
003匹目ACGGGTTCCCAGGAAA…



100匹目ACGGGTTCCCAGGAAA…
101匹目ACGGGTTCCCAGGAAA…


縦に並べた同一座はほとんど全部が同じ塩基です。全て同じか、大半が同じものである塩基がワイルドタイプ(野生型)と言われる塩基です。例えば白毛と黒毛みたいに分かりやすいグループだと塊で違っている場所があるからすぐわかる。今はこの亜種の違いを構成している遺伝子群は考えずに1塩基変異だけ考える。どういう風に違っているかというと上の譬えだと以下になる。
001匹目ACGGGTTCCCAGGAAA…
002匹目ACGGGTTCTCAGGAAA…
003匹目ACGGGTTCCCAGGAAA…



100匹目ACGGGTTCCCAGGAAA…
101匹目ACGGGTTCCCAGGAAA…


横列の約1000個に一か所程度現れる、かつ縦の列で10000匹調べたら100匹程度以上ある変異であるときその変異の場所とその塩基をSNPという。この例でいうと、縦に10000匹並べた時に9番目の遺伝子座が99900匹はCだが100匹はTであるときこの9番目のサイトでTである塩基をSNP(一塩基多型)と呼ぶわけです。C はワイルドタイプです。また、変異が1%に満たないものはSNV(一塩基変異)という。だから概念的にはSNPsはSNCsの内包です。基準を変えるとだから変わります。人間みたいに5%以上と定義変更するとマウスでも数は当然変わってきます。多型というのは亜種の一種ですから遺伝子異常ではありません。生き残ってきているんですから病気なのではない。変異が病気の原因になるとその個体は滅びますからその遺伝子は代々引き継がれて行きにくいんですね。創薬の関係で薬の効果がSNPsの違いで異なると言うことが分かってきて、人間の場合は関係研究が進んできているんですね。だから5%基準になった。基準に目的があるわけです。マウスではそこまで行ってないと言うことでしょうね。1%基準のままです。基準が無いと整理するときにとめどないですから統計上の問題から1%を目途としているだけですね。

⑨さて、ではもう一度、B6という近交系マウスは一体幾つのSNPsを持っているのか。理論的に解けるかという問題です。101匹を過ぎてどこまで調べるのかは新しいSNPsが発見されなくなるまでということは既に述べました。新しいのが無いと言うのは全部の生息マウスを調べることはできないので新規報告の無くなるところまでということで、実際に何万匹か何十万匹か何百万匹かは素人には分からない。研究者には情報があるでしょうけどね。でも100万匹調べたら一匹10万円でも1000億円なので、予算の感覚でどの程度かということを検討づけることもできる。
で結論として300万のSNPsということは分かっているので、ある任意のマウスが300万個のSNPsのうちの何個を持ちうるのかということが理論的に分かるかという問題です。その時に参考になるのはSNPs定義が全体で1%ある変異だということです。もう一つは現在のマウス種は進化の歴史の中で長期に渡って自然交配してきた結果としてSNPsを分散的に持っているということです。SNPsを持たないマウスというようなことは考えなくていい。300万のSNPsはランダムに全個体の中にほぼ同数分配されていると考えることができるということです。
この前提を置くと、マウスのSNPsとして認定されている300万はそれぞれがその定義である100匹に1匹存在していることから300万個の1%の3万個を保有していると結論できると、私は考えたのですがね。ここはどうなのでしょうかね。

⑩すると互いに大半が異なるSNPsを3万個持つある任意の二匹のマウスを交配した時その配偶子は1万5千個づつに分割された後に受精して又異なる組み合わせの3万個になるわけですが、ここからは自然交配と違って兄妹交配を20世代繰り返す。新しいSNPsの組み合わせは入ってきませんが、近親交配で互いの遺伝子座が徐々にもともとどちらかであった片方に揃ってきてホモになってくる。20世代以上経過するとほぼすべての遺伝子座がホモになっている。こうなってしまうとどれだけ交叉が起こってもSNPsが変化することはなくなる。そこでこの近交系マウスのSNPsが公開データとして登録されるわけです。従って、SNPsの数は理論的にほぼ3万個だと分かる。

⑪この誰も教えてくれなかった推計値がどうやら遠藤論文の中に記されていたSNPs数と照応しているようだということです。遠藤論文は公開登録データですからRNA調査です。対して今まで述べてきたのはDNAの全解析です。RNAはDNAを複写して更にスプライシングを経て不要なイントロン部分を切り取られてキャップとボリAをくっつけられて細胞質内に出てきたものです。切り取られたイントロン部分にもSNPsはあったはずですからその分だけ数が少なくなる。それとRNAは細胞の分化段階によっても発現数が変ってくる。でもそれを考えてもどうも3万個が基準で300万個はあり得ないと分かる。


さて、それで1290問題を考え直すわけです。
短冊の話から始めましょう。一つの見本再掲です。

ル19

グラフは1Mbでしたね。1本の染色体はほぼ1.25億塩基対です。12番染色体では120百万になっています。短冊は平均125本あるんです。1本の短冊の中に1百万塩基対がある。さてここでSNPs分布はどうかというと、今までは全体で300万だと思ってましたから20で割っても15万もここに分布していると思っていたわけです。それにしては白地部分はSNPsの無い場所なんですが、15万もある割にかたよりすぎてますよね。でも実はここは1/100です。1500個が散在しているのです。そして赤枠の中がFES1とFES2で違っている箇所の内交叉要因の場所です。赤枠は3か所ある。以下も加えます。

ル17


この赤枠部分を除いたというのです。最初の誤認はこの1本の染色体の中に平均15万個のSNPsがあると誤認していましたから、以下の違いの24649サイトは赤枠の中だと考える。

ル2
 というのも6番染色体を見ればわかるがほとんどが緑と白ですからFES1sとFES2で違っている場所は赤枠の中だけです。他の染色体は赤枠が無い。

ル412

すると24649サイトは赤枠の中の話だということになる。ここから交叉要因を除くと1290残ったと言うから、赤枠の中に残ったと解する。すると交叉要因は連続性で認識するよりないから、連続しないSNPs が1290赤枠の中に残ったと思う。するとそんなことはあり得ないと言う話になるわけです。そんな交叉はありません。これは1本の染色体の中に15万のSNPsがある思っていることからくる誤認です。

一本の染色体に1500のSNPsしかないのです。全体で3万個しかない。この理屈で行くと3つの染色体に赤枠があるのですがここには平均最大4500のSNPsしか無いということになる。そこに24649は存在しえない。でも全体を見渡してFES1とFES2で異なっている場所の集中しているところは赤枠の中ですよね。そこに24649が存在できるためには、やはり最初に和モガさんが言ったように、「マウスの染色体は性染色体の他、1番~19番まである。このため、ざっくり言うと6番染色体のSNP分布図は約15万個のSNPを色分けしたモザイク画ということになる。」という理解でないとBCA報告と桂報告書の主張を理解することはできません。この矛盾はなぜなのか。

逆から演繹してみましょう。ある任意のマウスには300万個のSNPsがあると仮定する。これだとマウス全体で認定されているSNPs数はいくつであることになるのかということです。任意のマウスにある300万個のSNPsはそれぞれ全体の中で1%しか存在しない変異です。他の任意のマウスにも同じ変異が同様にみられる確率は1/100です。先ほど推理した論理を逆に使うと全体では100倍あることになる。つまり3億個あるんですね。マウスの塩基は全部で25億です。その中の3億箇所には1/100の確率で変異種があって、それが任意のマウスにランダムに分配されているのだと言う理解です。
一般的な解説で1000個所に1か所SNPsがあると言うのはむしろこちら側を支持しているようですね。これだとBCA 報告の1290の嘘が残り、遠藤RNA解析の数の少なさが問題になってきそうです。

さて、どちらが正しいのか。答えは直接的にはネット検索で分かるような解説は存在しませんね。どちらがより合理的かを自分で考えるしかない。はっきりしているのはBCAの説明のどこかに嘘があるということです。そうで無かったらどちらかで納得に至る筈です。どちらにも矛盾が残っている。どういう嘘なのかということですね。或は自分の読みに何か欠落がある。

イルミナの広告ぺージに「ヒトの全ゲノムの解読が約13年の歳月と約3500億円の費用をかけて完成したのが2003年のこと。それが今では10万円の費用をかければ一日足らずで済むほど、ゲノム解読の技術革新が進んでいます。・・・」とある。中を少し覗くと当時使われたABI3700が一回のランで17,000個の塩基配列を決定していたのに対して2014年発売のイルミナ社のHiSeqは一回のランで1.8兆個の塩基を決定し、3日間で16人分の全ゲノム配列を30X(各塩基を平均30回読む)の信頼度で決定することが出来ると言う。2014年は正にSTAP事件の最中で今既に7年経過している。



(2021/7/22)


129の登録SNPsは一体いくつなのか、B6の129の登録SNPsはいくつになっているのか。知ってて当然の情報が無いんですね。桂記者会見でSNPs関連の説明で理解できていた記者は居なかったんです。
マウスの塩基数は25億というのはいろんなところに書かれている。マウスのSNPsは300万程度といろんなところに書かれている。でもマウスのSNPsは300万あると言う言葉の意味を必要なだけ正しく理解していた人はいないということです。あれだけBCA論文に詳しく説明されているのにそれに見合う基礎情報が無い。無論専門家には自明でしょう。しかし、一般に向かって記者会見しているのにまず25億や300万数値の説明もなく藪から棒に24,649sitesと1290SNPsの話をしているわけです。

300万という数字はネット検索するとあちこちに見られますが、この意味を明確に使ったのは和モガさんだけです。「マウスの染色体は性染色体の他、1番~19番まである。このため、ざっくり言うと6番染色体のSNP分布図は約15万個のSNPを色分けしたモザイク画ということになる。」と明確に自分の理解を書いた。これだと赤枠内24,649sitesの理解が可能です。だから300万という意味を疑うことをしなかった。任意のマウスにはほぼ300万個のSNPsがあると分かっているのだと。SNPsというのは全体に対して1%以上の一塩基多型です。当然ですがたくさんのサンプルを比較した上で決められている。

任意のマウスにはほぼ300万個のSNPsがある、という以上、その内の1個のSNPは他のマウスの99匹ではワイルドタイプの塩基になっているということです。他の99匹にはそのSNPが無いということです。進化の過程でSNPsの拡散が均等になるまで進んでいるとして、任意のマウスのSNPs数が一定なら99匹の無いSNPを補うのは任意のマウスの持つ300万個以外の追加の1個だということになる。他のSNPsに関しても同様のことが言える。するとマウスという種に認定されているSNPs総数はその100倍の3億だと言う理屈になる。

3億であって困ることもないのであるが、すべてのマウスのSNPs数が3億であるのならどこかにそういう記載があってもよさそうだが、見つからない。ただマウスのSNPsは300万程度だと書かれているだけで、そこに任意のマウスのという条件も記載されてはいない。普通はそういう書き方だと、マウスという種で知られているSNPs数が300万だと解する。ただ、この場合、逆の演繹から任意のマウスの持つSNPs数は3万になる。こうなると一本の染色体内にあるSNPs数は1500個ということになって、
赤枠内24,649sitesの理解が不可能になる。

演繹論理に難がありそうであるが、論理以前に事実としてそもそもこんなことは専門分野では分かり切っていることのはずであるからどこかに書かれていてもよさそうだと思われるのにない。無論専門書を買って勉強すれけばわかるに決まっているが、我々はこの分野の研究者じゃない。そんな勉強している無駄な時間も金も無い。他にやらねばならないことは山ほどある。事件解明に必要な知識だけあれば後は良識で判断出来るはずだ。

もう一つやっかいなのはこの分野が今現在どんどん開拓されている分野で、教科書的な合意が形成されてないと言うことがありそうですね。はっきり言ってど素人の入り込める分野ではないということです。にも拘らず小保方さんがこういうまだ誰にも真偽不明の仮説理論の一部を使って犯人に仕立て上げられて桂記者会見で確たる証拠もないのにあたかもあるかのごとくにその噂が世間に流布されたのではないかということが問題なんです。

何故ど素人の私にそんなことが言えるのか。専門知識が無ければ何1つ分からないのであったら裁判官は事件の解明ができないでしょうね。

ル175


いいですよね。BDF1のSingleはES細胞を渡したらたくさん出来てしまいます。そしてこのデータは若山さんが小保方さんに渡したものだと言うことはキメラ実験が若山さんにしかできないことなんですから当然です。第三者はBDF1Singleでキメラが一匹だけ出来て、Clusterでたくさん出来るようなコンタミはさせられません。
それと、もう一つ。このデータがあることを小保方さん自身が知っているのにアーティクルではSingleの結果はなかったことにされていること。



主役の犯人が若山さんであることはSNPsが300万であることの意味が分かっていなくても判断できるんです。犯人であると言う意味は後によほど慎重に検討されなければならないにせよ、です。



(2021/7/23)


さて、300万のSNPs数が任意の一匹のマウスの持つSNPs数なのか、マウス全体のものなのかに関してはまだ解を得ていない。もう一度考えましょう。その時にSNPsではなくてワイルドタイプのマウスの塩基リファレンスから始めて見ましょう。SNPsに関係して考えるときこのワイルドタイプの塩基は簡単ですね。99%が同じものだけを拾っていけばいいわけです。
無論亜種を決めている遺伝子群は別です。そもそも蛋白質を決める遺伝子は2~3万種類くらいしかありませんから25億塩基対の中では「砂漠のオアシス」だと譬えられていますね。他は「ガラクタ」だと譬えられているが、ここは研究中の領域なんですね。まだまだ新発見は続いている。
ヒトゲノム計画が一段落したのは2003年です。今回のBCA 報告書の解析に使われたイルミナの一回のランで1.8兆個の塩基を決定するというHiSeqは2014年に発売された。7年前なんですから昨日の話みたいなものです。アメリカンポップスに譬えるとまだボブディラン本人が歌っているような時期で、音大の学生がいろいろと勉強してその音楽を再構築するなんて時期にすら来ていない。はは。
でも、マウスの全ゲノムは読み終わっています。亜種毎にリファレンス配列がデータバンクに登録されている筈です。
マウスゲノムの野生型塩基のリファレンス配列決定時は99%同じものばかりを並べていく訳です。基本ほとんど全部同じですからどんどん決まっていく。最初はだから亜種の違いを決めている並びがグループ分けされて行くんでしょうね。そして更にSNPsの違いが意識されてくる。この時に調査の歴史があるんでしょうね。最初は実験動物である近交系マウスの、しかもB6で行われたという情報がネット情報内に散見されますね。でもどんどん調査が進んでいってそれ以外のいろんなマウスもデータ内にとり込まれて行って、最終的にワイルドタイプゲノムの配列が決まる。これはど素人でも推測のつくところですよね。まず亜種を決める遺伝子群はそれとして分類した後に、それ以外の部分のワイルドタイプ塩基の配列決定があって後にSNPsの定義がある。これは常識的推測ですよね。

例えば今回BCA 報告書のサプリにはthe GRCm38 (mm10) mouse reference genomeを使ったとされている。
>>
 We aligned paired-end sequence tags to the GRCm38 (mm10) mouse reference genome using BWA software4 (ver. 0.7.10) with “-n 0.02” option for the bwa aln command and “-a 2000000” option for the bwa sampe command.Raw data are available at DDBJ DRA (accession: DRA002862) (http://trace.ddbj.nig.ac.jp/DRASearch/submission?acc=DRA002862). 

ネット検索で調べると、まずGRCm38というのはGenome Reference Consortium Mouse Build 38の略だと分かる。mm10のmmはMus musculusというマウスの学名で10はこのマウスがC57BL/6Jとされているので慣例呼称のようですね。

これは近交系マウスですから単なるワイルドタイプのリファレンスではなくSNPsと認定されている塩基も入っている。どうせSNPsの比較をするんですから、これはこれで構いませんね。
この時にこのB6は近交系マウスなんですからSNPsは登録されていて、ここでその位置と塩基種が決められていて、かつ300万個あるとされているんでしょうね。

どうやらこれがマウスのSNPsは300万個あるという言葉が曖昧に独り歩きしている原因のようですね。これは今まで考え続けてきたことに継続して言うと、ある任意の1匹のマウスが持つSNPsは300万だと言う定義の意味です。この場合、最初に考えていた何でもいいから野原で捕まえたハツカネズミ一匹が300万個のSNPsを持つのかと言う問いに含まれている意味とは少し違うが、これを20世代近交化させて新たに出来て、もはや動かなくなったSNPsが300万個あると言う意味ではほぼ同義の解答になりますよね。野原で捕まえたハツカネズミ1匹はもはや二度と同じSNPs配列を持つことは無いが、一代限りでは近交系マウスと同じように300万のSNPs持つのだということです。

ではそういうSPNsはマウス全体ではどれだけの数があると調べられているのかというと、まだそういう調査まで手が届いていないということなんだと理解できそうなんですね。あれば、どこかに書かれているでしょう。何しろ、7年前にやっと一匹10万円で解析できるようになったんです。昨日始まったんだよ、これからよってことです。

なんてポット出の学問領域なんでしょうかね。何にもまだわかってやしないんですよ。博士って一応日本語としての語源的には文字で書かれた事柄に関しては何でも知ってるという意味よ。まだ何にも文字で書かれていないことを文字にしようとしている人々は博士ではないよ。ただの研究者です。文学なら求道者ですよね。ボブティランです。北島三郎よ。

ということで、和モガさんの「SNPはマウスで約300万個あると言われている。」の意味は例えばB6とワイルドタイプ配列とを比較し、かつ、変異している箇所のそれぞれを全部調べて集団内で1%以上に見られるということが統計的に分かっているものが300万だと言う意味で、その意味で「マウスの染色体は性染色体の他、1番~19番まである。このため、ざっくり言うと6番染色体のSNP分布図は約15万個のSNPを色分けしたモザイク画ということになる。」という理解はこれはこれで正しいと分かったところです。

B6のそれぞれのSNPsが統計処理の上で1%以上であると言うことは調査されている。又、他の近交系マウスの登録SNPsもそれぞれが1%以上であることは確認されている。従ってリファレン上一か所で99%を占めるワイルドタイプの塩基の数、つまり調査マウス個体数は相当の大数であることは言うまでもないということになるが、その系統に関してSNPsが登録されているのは言うまでもなく近交系マウスだけで、野原で捕まえた1匹のマウスは調査対象には入っても、そのSNPsなんて登録しても一代限りなのであるから意味がないからそんな登録データはない。ただワイルドタイプの塩基の一例、SNPsの存在、散在確率の1例として大数の中にカウントされているだけである。

で、結論として近交系マウスのSNPsとして登録されているのは少なくともB6において300万個だとは言えたようなところです。すると129では何個なのかということが問題になる。これも仮に300万個だとする。では129とB6のSNPsには同じものは無いのかという話になる。99%のワイルドタイプ塩基に対して普通は一つの異なる塩基がある。もしB6と129のSNPsに同じものは無いのだと言う前提でかつそれぞれ300万のSNPsがあるのなら、少なくともこの二種の近交系マウスだけで600万のSNPsがあることになってしまう。この論理の延長線上にあるのが、今まで考えてきていたマウスの全体のSNPs数が3億という数字ですね。
対して、SNPs自体はワイルドタイプの塩基に対して違っていれば第一義的定義を満たしているのであるからB6と129と同じであってもいいことになるが、その場合仮に歴史的にB6の解析が最初であったようだから、それを基本としたら、違う場所だけ登録することになる。この場合合計600万にはならない。
しかも、そうするとB6と129とで違っている箇所だけの比較になるということです。こうなると最初に和モガさんの言った、「SNPはマウスで約300万個あると言われている。」まではなんとか正しいことになるが、「マウスの染色体は性染色体の他、1番~19番まである。このため、ざっくり言うと6番染色体のSNP分布図は約15万個のSNPを色分けしたモザイク画ということになる。」は正しくないということになる。B6と129との間で違っている数だけが調べられているとその違ってる数だけの分布ということになるから15万個なんかではなくなりますよね。違っているSNPsの数そのものが書かれていないから分からないことになる。そもそもB6と129とで違っているSNPsを調べたのだと言うことすら説明されていない。

逆に、BCA 報告はどうやって調べたのかということを考える。
まずリファレンスはthe GRCm38 (mm10) mouse reference genomeで、B6です。このリファレンスに例えばFES1の解析リードをアラインメントしたと言うのでしょ。FES1は129B6です。前回使った例を使う。SNPsの無い場所は以下の様になる。どれもマウスなんですから同じなのが大半ですからね。

REF    ACGGGTTCCCAGGAAA…

BL6     ACGGGTTCCCAGGAAA…
129     ACGGGTTCCCAGGAAA…


上図でREFとBL6は同じものですから違うとしたら129です。ここで一塩基変異箇所が2か所あったとする。

REF    ACGGGTTCCCAGGAAA…

BL6     ACGGGTTCCCAGGAAA…
129     ACGAGTTCCTAGGAAA…

これはリファレンスと違う箇所ですから取りあえずB6と違うSNVということです。これを129のSNPsリファレンスで調べて行ったら赤のAが登録SNPだったが、赤のTはSNPs登録されてなかったとする。ただのSNVですね。1%以上ある一塩基多型(SNP)ではないということです。この分は緑で表示しておく。

REF    ACGGGTTCCCAGGAAA…

BL6     ACGGGTTCCCAGGAAA…
129     GCGAGTTCCTAGGAAA…

さて、上で、ではB6の登録SNPsはどうなっているのか。リファレンスそのものがB6ですから登録されているものを調べるしかない。それがたまたま茶色の個所だったとする。たまたまAなのでこの場合ワイルドタイプは普通はGですから129は最初からGだったと言うことになる。最初の出発点を書き直すと以下です。

REF    ACGGGTTCCCAGGAAA…

BL6     ACGGGTTCCCAGGAAA…
129     GCGAGTTCCTAGGAAA…

今度は違うところを赤くします。

REF    ACGGGTTCCCAGGAAA…

BL6     ACGGGTTCCCAGGAAA…
129     GCGAGTTCCTAGGAAA…

彼らが行ったことはまずはB6のリファレンスを使って、FES1を調べた結果、変異のある個所を3個所捕まえたが、一つはB6の登録SNPであった、一つは129の登録SNPであった、もう一つは129のSNVであったと言うことになる。
B6のSNVもあり得るのでもう一つ作りましょう。REFとF1のB6側の違いです。

REF    ACGGGTTCCCAGGAAA…

BL6     ACGGGTTCCCAGGAAG
129     GCGAGTTCCTAGGAAA…

**********
もう一度出発は以下です。

REF    ACGGGTTCCCAGGAAA…

BL6     ACGGGTTCCCAGGAAG…
129     GCGAGTTCCTAGGAAA…

違いの認識は赤表示です。

REF    ACGGGTTCCCAGGAAA…

BL6     ACGGGTTCCCAGGAAG
129     GCGAGTTCCTAGGAAA…

原因は茶色がB6のSNP、赤色が129のSNP、緑色がそれぞれのSNVだとして以下です。

REF    ACGGGTTCCCAGGAAA…

BL6     ACGGGTTCCCAGGAAG
129     GCGAGTTCCTAGGAAA…

**********

こういう具合に調べて行ったのだと仮定してみる。この場合B6の登録SNPs 数が幾つあるかなんて論旨の運びにそんなに影響はしないし、仮にマウス種全体のSNPs数との関係が分からなくても論理を組み立てることはできる。ただし、24649だとか1290だとかの数と整合しないほど少ないと困ると言う程度になる。この時、もう一度挙げると、「SNPはマウスで約300万個あると言われている。」や「マウスの染色体は性染色体の他、1番~19番まである。このため、ざっくり言うと6番染色体のSNP分布図は約15万個のSNPを色分けしたモザイク画ということになる。」という記載は不要な記載だと言うことになる。そういうことはどこにも書かれていない。

書かれていないから間違いかというと、どうやらB6の登録SNPs数は300万個だと言うことは、どこにその数字が書かれているのかは知らないが、正しそうだ。129にも同じだけあるのか、重複はないのか、重複があるなら、F1の半々にある筈のSNPsの数え方は違うところだけなのかはまだ理解できていない。

近交系マウスは400種以上作られている。世界のいろんなマウスを掛け合わせて目的別にいろいろと研究者が作り出し、マウス業者が維持管理している。これらを作る時に大抵のマウス亜種が使われているから、400種の中には当然その辺の野原にいたハツカネズミも入っているということになる。無論野原でたまたま見つけられたハツカネズミが持っていたSNPsが野原全部のハツカネズミのSNPsを代表してはいない。1/100がSNPの二番めの定義です。野原でも条件は同じです。
でも研究の歴史から遡ると、最初にB6を調べた。これは野原のハツカネズミと違って他のB6では別のSNPがあると言うことではないんですね。B6は金太郎あめですからB6の集団は全部野原のハツカネズミ1匹分にしか相当しませんね。では近交系マウス1系統につきそれぞれ300万のSNPsがあるとして400種全部合わせたたらどうなるかというと単純計算では12億というなんか変な数値になるんですね。
これ以上は絶対にないと言う数値は25億です。全塩基が25億なんですからそれ以上になることはできない。それどころか、25億の中には変異すると生きていけなくなったり、マウスであり続けることができなくなったりするような致命的な場所があって大抵は遺伝子群の中です。タンパク質は20種のアミノ酸で構成されていて、それを指定しているコドンは3塩基一組ですから、そこに変異が入ると大抵は必要なたんぱく質が作れなくて死ぬことになりますね。稀には別のタンパク質で多型や亜種遺伝子を構成することもあるでしょうし、また、今残っているのは実際に全て生き残っているんですから稀なものしか残っていないのだということになる。あまり重要なところにはSNPsは進化の結果的に無いんですね。だからといって、だから25億からいくら減らせるかという論理的推定根拠はありません。
任意の1匹のマウスの持つSNPs数は300万だとして、それぞれのSNPs一個ずつの全体の中で占める割合は1%なんだから100をかけての3億という数値は何を意味することになるんですかね。なんか間違えてはいますよね。

ふむ。だんだん大変になってくるな。まずマウスとは何ぞや。ウィキです。
>>
亜種

3亜種が確認されているが、独立種として扱われることもある。
Mus musculus castaneus (アジア南部および南東部)
Mus musculus domesticus (ヨーロッパ西部、アジア南西部、アメリカ、アフリカ、オセアニア)
Mus musculus musculus (ヨーロッパ東部およびアジア北部)
さらに次の2亜種が近年になり確認されている。
Mus musculus bactrianus(アジア中央部)
Mus musculus gentilulus (アラビア半島およびマダガスカル)
他にも様々な名称がハツカネズミに与えられているが、他の亜種のシノニムとして扱われている。日本のハツカネズミ("M. m. molosinus")などのように、いくつかの個体群では異なった亜種の雑種となっている。


実験用マウス

日本では、特に実験用に改良・繁殖した飼養変種(実験動物)を指して「マウス」と呼ぶ。実験用にはモデル生物として用いられる。マウスはあくまでハツカネズミの飼養変種(Mus musculus domesticus)なので、種として記載されるときは「ハツカネズミ」 Mus musculus ということになる。ゲノムプロジェクトによって全ゲノム配列が解読されているラットとともに、ヒトの進化や病理を解明する有力な手がかりである。
実験用マウスは、野生のハツカネズミに比べてかなり大型である。アルビノのものが一般的だが、さまざまな毛色の系統が存在し、体毛のない系統のものは「ヌードマウス」と呼ばれる。ヌードマウスは胸腺が欠如しているため、細胞性免疫が機能しない。そのため拒絶反応が起こらないので、移植実験に多用されている。
マウスの系統化は非常に進んでおり、代表的なクローズドコロニーとしてICR、ddYが、代表的な近交系としてA(アルビノ)、AKR(アルビノ)、BALB/c(アルビノ)、C3H(野生色)、C57BL/6(黒色)、DBA/2(淡チョコレート色)などが知られている。各系統は近親交配を何代にも渡って繰り返したことで確立されたもので、各系統内における個体間の遺伝的な差異はほぼ存在しない。生理的・薬理的な反応のデータを大量に取る上で個体間の遺伝的な差異をほぼ無視できるマウスの存在は、医学・生理学等の発展に大きく寄与している。
マウスは、愛玩動物として飼育されることもある。日本でも、江戸時代から白黒まだらのハツカネズミが飼われていた。ニシキネズミとも呼ばれる。この変種は日本国内では姿を消してしまったが、ヨーロッパでは「ジャパニーズ」と呼ばれる小型のまだらマウスがペットとして飼われており、DNA調査の結果、これが日本から渡ったハツカネズミの子孫であることがわかった。現在は日本でも再び飼われるようになっている。

どうも全体理解が間違ってるようですね。マウスゲノム解読プロジェクトの対象は実験用マウスが対象だということのようです。
そもそも亜種としては世界に5種類しかない。雑種も多いと言うことのようですね。

そしてゲノム解読対象になっている実験用マウスは養育変種(domesticus家畜)だという認識のようです。

実験用マウスは知られているようにクローズドコロニー系と近交系に大別されて、後者は現在450種類くらいありますが、これを検体として数えるときは450頭分です。系統内の変異は全部同じですから野生型の塩基を決定するときは450頭分のサンプルにしかなりません。又クローズドコロニー系も近親交配こそさせませんが最初にあった親の頭数以上のサンプルにはなりません。実験用マウスを検体にするとせいぜい数千サンプルにしかならないでしょうね。
でも、野生型塩基は99%ですから実験用マウス種の範囲内でも決定できそうですね。しかし、SNPはそうはいきません。
SNP定義の1%というのは無論100匹に1匹あるということです。これを統計的にちゃんと調べようと思ったら例えば1000匹を対象にした時10匹ですが、この時には9匹の変異はSNP認定されない。2000匹調べたら10匹になるかもしれませんよね。従ってSNP認定するか否かの調査にはある程度の大数が必要なわけです。1万か、10万か、100万か知りませんが、実験用マウスではとても補充できるサンブル数ではない。そうするとマウスのSNP決定には自然交配で野生で生きているマウスの変異をいろんな意味でランダムにサンプルとして取り入れなければならないことになる。自然のマウスはそれぞれの個体が独自のSNPsを保有している。何匹調べたらマウスの全部のSNPsを調べたことになるか。新しい発見報告が無くなるまででした。100万匹調べたら1千億円かかるのでした。

仮に実験用マウスの中の数千匹が調査対象だったとしたら定義的に漏れているSNPがたくさんあるということになる。
でも、そういう定義なんだと言うことならそれでもかまいませんよね。そういう定義でB6の登録SNPs数は300万だという理解になるだけです。でもそういう場合はそういう定義をすると思いますよ。何しろ一応博士さんたちが仕事でやってることです。アッポがやってるわけではない。



(2021/7/24)


今年は50上はダメか。ちょっと弱気になって来た。今釣りが本気モードなのでこちらに時間が取れない言い訳。



(2021/7/25)


最後に考えた最大25億が正しいのかもしれない。ここから致命的な場所に変異が入った個体は進化の過程で死滅して行ったので現在生き残っているマウスの全てにそういう場所に変異の入った個体は存在しないのだと考える。そういう場所はそんなにたくさんは無いとする。そうするとまず変異はどこにでも入り得ると言うことになって、その中で1%以上あるものも無数にあり得ると、まず考える。つまり最初に考えてみた3億というような調査結果はまだ無いのだと前提してみる。種全体でのSNPsの総数はまだ調べられていないのだと。
この前提でまずB6のSNPs数は300万個だというのが事実だとしてみる。まだそういう決定的な証言は自分に調べられる範囲では今のところ得ていないが「マウスのSNPs数は300万程度だ」という文章はあちこちに散見される。
B6の登録SNPsがあると言うことは事実である。また、B6の全塩基配列が知られているのも事実である。更にB6に限らず養育変種(domesticus家畜)である実験用マウス毎の全塩基配列が知られているのも事実でいろんな研究所のデータで見れる。従って、これは確認してないがワイルドタイプの標準塩基配列もどこかにあるはずである。ど素人なので探し方が分からないが、まあ、今はいいとしよう。99%の塩基確認は実験用マウス範囲内のみの調査で十分確認可能である。何しろ変異はそんなに多くないのに対してワイルドタイプの塩基はほとんど同じだと言うのだからここはど素人であっても、まず論理的に間違いのないところですね。

まずそういう前提で、では例えばB6のSNPs認定はどういう統計処理によるのかという問題を考えることになる。少なくともB6のSNPsは300万個程度なのである。なぜ決定されているにも関わらず確定数値が無いのかというところにチラチラと見え隠れするものがある。B6の全塩基配列は分かっているのである。そしてB6のSNPsは登録されているのである。概数ではあり得ない。一個の単位まで分かっているのである。
その数値がちょっと探しただけではどこにも見当たらない理由に心当たりがそろそろできてきたと言うところであろうか。つまり、数が決まってないのではなく、SNPs認定している認定自体に曖昧さがあるので、既述した10個ならSNPs だが9個ならSNPs では無いと言う定義を厳密に成立されるだけの大数が無いから、はっきり書きたくないと言うことではないかという心当たりである。

しかし、事実として例えばB6の SNPsは登録されている。当然だが定義の範囲で決定されているのだ。それは調べた範囲内で決定されているということである。調べた範囲は理想的には世界中のマウスを一匹残らず捕まえて調べることであるが、そんなことはできないので、ランダムサンプリングすることにならないといけない。しかし、今のところ行ったのは養育変種(domesticus家畜)の範囲内だということです。いわば家猫を全部調べたのであってライオンや虎やチーターは入ってない。
でも、この譬えもうまく事実を言いあらわせてないですね。ネコ科の動物で近交系家猫が作られていると言う事実はない。近交系マウスというのは実験マウスとしてとても特殊なんですよね。猫なら品種改良で例えばノルウィジャン・フォーリスト・キャットという私の好きな品種があるが、あれは一応品種が固定されてから血統書管理されていて、姿形が安易な雑種交雑の所為で崩れないようにしている。馬ならサラブレッドですし、ヘラブナなら河内ベラですが、近交系マウスというのはそんな適当なものではない。猫は所詮見た目です。馬は早く駆けっこできる性質だけを見ている。ヘラブナは体高が高ければいい。20世代の長期にわたって、最初の親以外の遺伝子が入らないように交雑させているのではない。

最初の2匹の親になにを選んだかによってマウス系統が決まる。実験用ですからその目的によっていろんな性質のマウス種を作ります。B6や129もその中の一つですね。大事なことはB6を使って実験した結果が他のB6を使ったらマウスの所為で違う結果になっては困るんですね。B6の系統内は全部クローンでDNA配列が同じでないといけないのみならず交配を繰り返しても違う配列にならないという条件が必要です。遺伝子は交叉によって混ぜ合わされるんですから、交叉しても変わらないようにしておかないといけない。それは全ての相同染色体の遺伝子座が互いにホモになっているという条件を満たさないといけないのでした。それが最低でも20世代近親交配をすると言うことです。理論がある。実際にはもっと交配を続けないといけなくて、それは生き残りやすいものが交配させられると言う実際上のバイアスがあるので理論値以上に交配を続けないといけないようですよね。

マウスゲノム計画というのは実験用マウスの範囲内なのであろうか。仮にそれならそれでいいじゃないか。ただし、SNPsは全体の中で1%以上ある変異という定義のもとでは検体は大数でなくてはならなくなるので、実験用マウスの中では決められないかもしれないと言うことを忘れなければいいだけですね。この時の近交系マウスごとのSNPsは実験用マウスの最大検体数の範囲内で決められたSNPsであるということになるだけです。たぶん、これが研究者たちの前提なのではないでしょうか。これは本当に昨日始まったような研究の歴史の中で取りあえずSNPsを1%と定義したのであって、最初に実験用マウスの範囲内でゲノム計画を行うとされていたから、そんな当然の前提はあえて説明しないのだということなら、まあ、博士さんたちはアッポではないということくらいは証明できたようです。

でも、桂記者会見は全国民の前で行われたのですから、SNPs定義は実験用マウス範囲内なんだよということすら説明しないでも他者に達意できると思っていたのだとしたら、それは博士さんとしてはお粗末なアカウンタビリティねという嫌味くらいは言っていいはずです。それどころか、お前たちはわざと説明しなかったよなということはど素人でもわかることでしたよね。

ル175
いいですよね。BDF1のSingleはES細胞を渡したらたくさん出来てしまいます。そしてこのデータは若山さんが小保方さんに渡したものだと言うことはキメラ実験が若山さんにしかできないことなんですから当然です。第三者はBDF1Singleでキメラが一匹だけ出来て、Clusterでたくさん出来るようなコンタミはさせられません。
それと、もう一つ。このデータがあることを小保方さん自身が知っているのにアーティクルではSingleの結果はなかったことにされていること。




一般にSNPsを語る時人間が例に出る。アルコールに強いとか、兄弟で顔が違うとか。人間には品種改良どころか、(domesticus家畜)はないので自然の亜種分類はされていても基本70億個体が前提されている。マウスでは違うということである。
人間のワイルドタイプ塩基は既にヒトゲノム計画で読まれている。SNPsは必要に応じて調べられているに過ぎない。近交系人間は居ませんからね。人間の場合は医療目的なので5%基準に今なっているようです。ある意味実用基準です。

さて、はっきりしないから仮定を置きます。検体は450近交系マウスだけだという仮定です。B6のSNPsはその範囲で決められたもので、300万あると言うことにする。まだまだFES1とFES2とで違っているSNPsが何を意味しているかなんてところにはとても行けてませんよね。それどころか129の登録SNPsがいくつあって、B6とかぶっているSNPsがあるのかないのかということすらまだ分かってない。一応、範囲が実験マウス範囲らしいと言う前提に立ってみるということがやっと出来た段階です。そして単純化のためにクローズドコロニーははずしておこうと言う仮定を置いた段階です。これで129の登録SNPsが何であり得るかということを考える土台ができたところです。いつもの例を出す。99%のワイルドタイプ塩基のリファレンスが一番上にあるとしてその下に450の検体の塩基配列が並ぶ。

ACGGGTTCCCAGGAAA…


ACGGGTTCCCAGGAAA…





これが450並列に置かれるということです。最初の塩基を例にとればAが縦に450並んでいてSNPsもSNVもなければ450全部がAです。ここでどれかが450の1%以上、つまり4.5個以上、だから5個あればSNPsだと認定するんです。ワイルドタイプの塩基配列リファレンス自体が450の検体の一個一個の縦の塩基の種類確認で大半の同じ塩基を確定させたものだと言うことは自明ですね。こちらは簡単ですよね。
横の並びは25億の並びで、B6はその横の並びに関して300万か所にその縦の確認で5個以上ある変異があってSNPs登録されているということです。5個以上ないときはSNVsに過ぎません。2個や3個は変異箇所ではあってもSNPsではない。ここまでは簡単ですよね。

では129のSNPsはどう調べるのか。B6と同じです。そこまでは分かる。同じように調べるのは簡単なんで、かつ、B6が300万なら129も同程度だと言うことまでは推測がつく。問題はB6と129でSNPsの重なりはあるのかないのか。あるのならどの程度あるのか。これが分らなかったことですよね。今相当に制約できたので考えやすくなったわけです。



(2021/7/26)

つくづく恐ろしい表が残されていましたね。この表は事件が始まる前から作られていて、三誌論文に載せられていたものが、現在ヴァカンテイ氏の継続申請している特許出願申請書類に残されているのです。キメラ実験ですから若山さんが行ったもので、小保方さんは酸浴細胞を若山さんに渡しただけです。事件化後桂報告書とBCA 報告は既存ESのコンタミだと結論しましたから、このBDF1の実験も桂報告書とBCA報告によって小保方さんだと仄めかされている犯人が若山さんにBDF1の酸浴細胞を渡したことになっている。和モガさんの説ではなぜか嫉妬した奥さんがその研究を後に捏造と判明させるためにインキュベーター内に置かれてあったであろう小保方さんの酸浴細胞にESをポトリと垂らしたのだというストーリーになっている。でもそんなことはどちらも不可能だという証明がこの表だったわけです。

ル175
インキュベーター内でポトリと落とされたES細胞はそのまま若山さんの手に渡され、若山さんがそれを二つに分けて、一つはトリプシンでバラし、一つはナイフ切り分けでキメラを作ったという表です。ClusterでできたのはESを垂らしたのなら当然ですが、驚くなかれSingleでもやってみたという表です。ESがポトリと垂らされていたらトリプシンでバラしてもできますよね。ES細胞はそもそもフィーダー細胞と分離するためにトリプシン処理して剥離乖離させた後、顕微鏡下でESだけ回収した後にキメラ実験に使う。STAP細胞はそもそも非接着培養ですから、トリプシンで乖離する目的もESとは違いますが、博論実験の手伝い時からスフィア塊として細胞同士が凝集しているだけのものをバラすために使っていたのでしょうね。バラさないとピペットで一個ずつ拾ってキメラ胚に挿入することができないからです。ここでSingleでもできたというのですが、でも不完全に1匹だけそれらしくできたことにされている。この表のキメラは全部2Nキメラだと言うことがGFPの蛍光確認で貢献度が調査されているのでわかる。4Nならその調査の必要はありません。

事件化後の事情聴取ではSingleではキメラは出来ないとされていましたよね。また、ESコンタミならどちらでも簡単に出来てしまう理屈です。この実験結果は小保方さんも知っているのです。2012年4月の最初のネイチャー投稿時に既に添付されていた表です。ACCsと書かれている。SACsの文字のある注はサイエンス時に追加された注です。
この論文はヴァカンティ氏も若山さんも共著者です。特にキメラ実験は若山さんしかできないのですから、この表に書かれた実験は若山さんが行ったもので、小保方さんはこの表を捏造することはできません。大胆にも大先生の行った実験だと言って先生が行ってもない実験を共著者の先生に見てもらっている論文に掲載することはできません。この表は若山さんがこれを使って論文を提出しなさいと言って渡した物なんです。

最初の成功時はトリプシン乖離でキメラができないからナイフ切り分けしたら出来たと証言していたわけです。小保方さんもそう証言している。2011年の11月のことだと自己点検委員会の調査報告書に書かれているので11/28の4Nキメラが最初だったのだなと推測されたわけです。後に出された手記に記載されている日程ともあっている。
ところが翌年初頭の1/23の小保方さんの帰日を待って再度確認実験が行われて、FLSやFLBやGLSやの幹細胞も作られた。
ところがこの時にBDF1でもキメラ実験が行われていたことはArticle Extended Data Figure 7-bの表や、その4Nキメラ写真で知られていましたが、幹細胞が作られたのかどうかも知られていなかったし、そもそもそのサンプルが無かった。

AC129-17

AC129-19


アーティクル論文ではSingleの実験結果はなかったことにされている。Clusterの実験分は数値データが特許の表と一致していることが確認できる。
サイエンスの論文までは若山さんが共著者です。今なぜ特許申請書類にこの表が添付されているかというと、2012/4/24にヴァカンティ氏が米国特許の仮出願を行った際に添付していたものが三誌論文で明らかになった事柄を加えつつ残されているのです。最終的には理研が参加した後に、笹井さんがまとめた二報の論文のデータも取り込まれましたが、後の論文リトラクトに伴って、二報論文での実験事実はデータも含めて全部抹消されました。今残っているのは理研が小保方さんを呼び戻す前の段階までのデータなんです。ヴァカンティ氏はまだこの申請を継続しているんです。

余談ですが勝海舟の全集を読むと西洋人の根の強さを強調する文章が散見されて、日本人の淡泊さに警鐘を鳴らしている。彼は当時軍艦奉行を務めていた時期もあって、ペリー来航以来の米国側と幕府との交渉の経緯をよく知っているし、資料も又たくさん集めています。建白書もたくさん書いている。彼は愛国者でしたからね。

事件は2014年に発生しました。今2021年です。8年目です。ヴァカンティ氏はまだ特許申請継続していますよ。

小保方さんがなぜSingleの行を二報論文時に外したのか。この表は既にヴァカンティ氏が申請書に添付済みのものです。私は若山さんがあれは論文を書かせるための昔の飾りのデータだから、この論文では外してくれと頼んだのだと見ていますがね。二人の間には呉越同舟的ではあるが何かまだ信頼関係がありますよね。
私の説では小保方さんを山梨に誘った後の若山さんは論文を書かせてヴァカンティ氏に小保方さんを手放してもらおうと考えていたことになります。キメラができたのはntES化しているのですから若山さんにとっては当たり前ですが、ヴァカンティ氏と小保方さんにはそれをまだ打ち明けてない。論文はntESに関しては触れないでキメラが出来たと書かせているのですから、これは捏造論文なんです。でも、若山さんは絶対にアクセプトされないと分かっていて、安心しているんです。
と、同時に二人には隠していて、特にヴァカンティ氏には隠しているが、小保方酸浴細胞核を使用したntESの実験結果がまだ出ていないのです。つまり自分は捏造実験なんてしてない。結論が出た暁にはこんな悪戯程度のことは笑い話で終わるであろうといわば高をくくっている。大発見の予感があるんです。

呉越同舟的という意味はそういう意味です。小保方さんは真ん中に居て若山さんは連れて行く気ですから本心としては本当のことを言いたいのだが、ヴァカンティ氏には知られたくないから、まだ本当のことが言えないでいる上に、小保方酸浴細胞核使用ntESの正体もまだ実験している最中ですから自分でも分かってないわけです。大発見の予感と期待だけです。

事件にはまだなっていませんよ。そういうことがヴァカンティ研と若山さんとの間で小保方さんのリクルートを巡ってあったのだと言うだけのことです。そんなことってどこにでもゴロゴロしているでしょう。それがなぜ事件になったか。最大の原因は無論理研が小保方さんを呼び戻したからです。無論呼び戻したに関しては理研に責任があるわけではない。理研は誰を雇おうが自由で他者にとやかく言われる筋合いもない。でも結果論としてこれが契機となって事件へと進展していくわけです。
ですから、もしこの理研による呼び戻しが無かったらどうなったかと考えてみることには意味があるんです。

時間を戻してみる。小保方さんは先生方の間に挟まれて嫌になったのと、若山さんが強引に自分を幹細胞化実験に引き込もうとしていることが、自分のやりたい研究方針と違っているので、悩んだ末に、突然ヴァカンティ研に帰ってしまった。その前に小島さんや、大和氏、常田氏なんかと相談しているんですね。この時期は既に特許に関係して不穏な空気が漂っている。戻って来いと言う話になる。
ただし、手記に書いてあるように若山さんが特許申請したかというと、そういう相談は知財窓口との間であったかもしれないが、事実としては報告されていないわけです。若山さんは密かに自分の行っている研究もある上に、小保方さんがなかなか山梨に来ると言ってくれない裏にはヴァカンティ氏の意向が働いていると考えますから、約束と違うじゃないかということで腹も立つと言うことで、自分に51%だと不満を漏らしただけかもしれない。こういうところは手記の記載だけを一方的に信じるなんてことはできませんよね。でも事実として小保方さんは米国に帰ったんです。
デイナ・グッドイヤー氏が小保方さんと小島氏のE・メールでのやり取りを聞き書きしていますね。若山先生があれはやったか、これはどうなってると自分に強いると言う不満です。ここは若山さんは一応弟子にしようとしているんですから当然の教育である可能性もありますよね。でも小保方さんはそちらには関心がない。原因はキメラが出来てると信じ込んでいるからです。若山さんも無理をしてますよね。本当のことを言わないままで小保方さんに自分で気づかせようとしても、キメラが出来たと言う言葉はのめり込んでいる人には捨て去るにあまりに重たいでしょうね。無意識にも捨てると何にも自分に残らなくなるという虚脱感でしょうかね。キメラが出来る前はできないならできないということで論文を纏めて、自分の細胞が何であるかを極めたいと考えていた。でも、一度出来たと写真まで見せられた。幹細胞もできたと。

さて、そういう心理状態で米国に戻った小保方さんはヒト細胞での実験許可を米国で取っていた。キメラのできる細胞だと信じたまま、若山さんに一度やってみろと言われて、その血液の提供まで受けたヒト細胞での酸浴実験を行おうとしていたと手記に書いているわけです。理研が呼び戻さなかったらどうなったかという推測です。

私の仮説ではヒト細胞で酸浴細胞は作れると思いますね。ヒト細胞ですからキメラ実験は絶対にできません。というより逆にキメラは作らなくていいのですから、若山先生の手伝いを必要としないから、自分だけでできると考えたわけです。小保方さんの証明方法は遺伝子発現解析です。マウスではありませんからGFPも使えません。PCRによるRNA発現解析と発現蛋白質の免疫染色による証明です。これはティシュー論文時からの多能性マーカー発現による証明方法です。たぶん、試験管内三胚葉分化実験は許可されるでしょうね。免疫不全マウスを使ったテラトーマ実験も、元が体細胞ですから許可されるでしょう。無論、キメラはダメです。ヒトの卵を無暗に実験に使うことは許されません。精々不妊治療時の廃棄予定卵くらいですね。仮親は有りませんからね。人道問題になってしまいます。

これで論文は書けるでしょうね。でも、マウスでキメラが出来たということになってますからね。この実験事実は消えないわけです。ヒト細胞の論文にもマウスではキメラまでできていると書くことになる。これは通りませんね。どこにも通らないから、又ヴァカンティ氏主宰のティシュー誌に掲載しておくだけのことになる。小保方さんはその内TWINsに帰って、アカポス待ちの先生になっていく予定なんでしょうね。
でも、そうはならないんです。なぜならヴァカンティ氏は米国特許仮出願をしているからです。理研は関係ありませんよ。出願は2012/4/24に米国で行われているだけです。この想定では笹井さんは参加してませんから関係ありません。この本出願時にヴァカンティ氏がどうするかということです。三誌論文は全部リジェクトされていますが、リトラクトはされていない。若山さんが共著者でキメラが出来てると書いている。再掲しましょう。

ル175

キメラが出来たと明確に書いてありますよね。これをもって本申請することになる。ヒト細胞でも三胚葉分化したと。できたと書いているのは若山さんです。笹井さんも、丹羽さんもいません。
特許ですからぶら下げて消え去っていく論文はいくらでもあると笑ってはいられません。これは出来ていないのだという言い訳が若山さんに必要なんですが、一番手っ取り早いのはESのコンタミがあったみたいと言い訳すればいいんですね。とても簡単です。自分でやってるんですから、どうもピペットの先に前のESがくっついてたみたいと言えばいい。ではどうして事件化後にもそういわなかったのか。無関係な人たちが入り込んできた後にそんなことは言いだせませんね。理研で特許申請すると言い出した。何もまだ事件化してないのにいきなりあれは実験ミスだよとは言えませんね。あの時点となってしまっては、小保方さんが自分にESを渡したのだとする以外に言い逃れる手立てがなかったわけです。理研が入り込まずに、ヴァカンティ研が特許本申請したらどうもあれは実験ミスでESコンタミしてたと言いわけできたし、いざという時に備えてその準備もしてました。キメラ子にGFCが半分しか来なかったんだよと。そしてそのことは小保方さんの日報を通してヴァカンティ氏の耳にも入っている。そういう伏線は張っていたわけです。でも、予期せぬことに理研が入り込んで、しかも大々的な記者会見まで開かれて、もはやヴァカンティとの間だけで、済まんすまん間違ったよ、と言う解決方法はなくなっていたわけです。
どうしてもう少し早くに正直に告白しなかったかについても、三誌リジェクトされていると言う経験があるんですね。こんな論文通るわけないという思いがある。特に自分でキメラはntES化したからだという事実を知ってる。そしてそれを誰にも言わなくても査読者はちゃんとリジェクトしてくれる。当たり前だと思ってるわけです。二報同時でも落ちる。特にレター論文は落ちると見ている。Xistの実験がどういう風に行われたのか記載されていない。誰でもちゃんと説明しろよとクレームするはずだ。

ところが、若山、笹井、丹羽という大物の名前が並び、理研の絶大なバックアップがあるのだという予断がこの論文を通してしまったんですね。2013年の8月に若山さんは小保方研の中にいる寺下さんからの説明で、この論文のリヴァイズが順調だということを聞いて不安になり、責任著者を降りたいと笹井さんに相談することになったわけです。でも結果的にはそのまま残って記者会見に三人で並んで写真を撮られて桃子本の表紙となった。
キメラを作った本人がレター論文の責任著者を降りたいと言ったら、これは相当の事ですよね。笹井さんものめり込んでいたんですね。なんでやと疑義しなかったか。どうして引き留めてしまったのか。何か言いたかったのではと立ち止まらなかったか。そのあたりを後に笹井さんはとても悔やんだかもしれませんね。
でもそういうことは今となっては分かりません。笹井さんが生きててくれたらこんな深刻なことにはならなかったんでしょうがね。何が原因かは本人にしかわかりませんね。インテリってこんなに弱いかなあ。と言っても、鍛錬された政治家ではないからねえ。人間関係の板挟みには普通の人は弱いよな。にっちもさっちも身動きできなくなるのを嵐の通り過ぎるまで耐え続けて又捲土重来を期すなんてそうそう常人にやれることでもない。政治家でも自死するときがあるからね。こういうのって経験もしない人間の批評できることではないね。いろいろあるんだろうねと判断保留しておくしかない。

ル175

何度でも見ておきましょう。この表があって、若山さんはヴァカンティに対してあれはどうも実験ミスでESコンタミしたみたいだと言い訳できるか考えてみる。無論この時は言い訳する相手はヴァカンティ氏とラボ仲間だけです。そうだったのか、仕方ないねと納得してくれるか。BDF1と129B6F1とGOFの三種類やって、どれもESコンタミ事故だったのと問われるでしょう。事件化後にも問われましたよね。しかも世間の注目している記者会見の場です。
でもこの場合は相手はヴァカンティ氏だけだ。自分のラボではしょっちゅうこれらのntESは作っていていつもキメラの樹立率の検証をしているんで、自分が同時にあれこれやってたから不注意で偶然全部にそれぞれのESが入ってしまったようだと説明するしかないですね。で、ヴァカンティ氏がそれで納得してくれたら、後は小保方さんが自分の研究をするだけで関係は切れる。

でも、この表のBDF1でSingleでわずかに1匹にGFPが確認されているが、これは何だと問われる。どうしてClusterではたくさん出来ているのだと問われそうですよね。私の説では無論ntESですから、このキメラ実験は幹細胞キメラなんです。STAP細胞から直接のキメラなんて一度もできてない。それを最初にナイフ切り分けでやってみると言って出来たと引き留めのための嘘をついた。そして翌年に山梨においでと誘ったらまだ論文が出来てないと言う理由で返事が先延ばしされたから、論文作成用にこの表を渡して論文を書かせた訳です。ここではまだバラしたらできないと言う主張はないんですね。ただ最初の嘘でナイフ切り分けで出来たと言ったから、もっともらしくSingleではわずかに1匹は一部GFP蛍光していたと言う結果にしたわけです。無論、繰り返しますがそもそも酸浴細胞から直接のキメラは出来てないんです。全部嘘です。嘘でないのは小保方酸浴細胞核使用ntESのキメラはできて、これからそれを調べようとしていることです。
ところがこの論文を書かせて目論見通りにリジェクトされてよかった、これでこの論文はティシュー誌にぶら下げられて、小保方さんは手放してくれるんだねと思っていたら、ヴァカンティ氏がこの表を添付して特許仮出願してしまった。2012/4/24です。若山さんがジャームライントランスミッション実験時にGFPが半分にしか来なかったと言ったのは5月のはじめなんです。キメラ実験から逆残しないとわからない日程です。この時に後の言い訳の伏線を張ったんです。
言うまでもありませんが若山さんはこの時に後に理研が参加してくるなんて考えても居ません。自分は翌年には山梨大に居るんです。小保方さんを連れていきたいだけですから、いざという時の言い訳の相手はヴァカンティ兄弟と小島さんだけです。自分が間違えた。ごめんなさいで終わると見ていたんです。一つにはまさか特許申請するなんて予期もしてなかったんですね。慌てて伏線を張っておいたが深くは考えてない。それどころか、胎盤が光ったことを発見しているわけです。両方やってるんです。二兎を追っている。片方が他方の言い訳になってる。一つづつは嘘で不正じゃないかということが自分の中では自己欺瞞されている。

①幹細胞化の実験は本物の実験で不正でも何でもない。(ntES化していることを誰にも言ってない)
②酸浴細胞から直接キメラが出来たと言うのは引き留めのためのちょっとした方便の嘘にすぎないので自分の捏造論文ではない。(方便でも後にそのまま不正論文を書かせてしまっている)

どちらもヴァカンティ氏側には分からないことですよね。何しろ何も本当のことを言ってない。ただ、この程度の論文はリジェクトされると確信しているのはシニアの研究者の常識的判断なんでしょうね。リジェクトされる以上は論文捏造にはならない。間違った論文に過ぎない。いずれ消え去る運命だ。
ヴァカンティ氏は論文を書かせたら小保方さんを手放すと言ったじゃないか、、、
深みにはまっていったんでしょうね。

で、どういう嘘なんですか、これは、ということです。少なくとも小保方さんが、まして第三者がこんな器用なコンタミのさせ方はできませんよね。そもそも若山さんにもできません。表自体が嘘なんです。

ル175
そして、小保方さんなり、第三者が犯人ではないのに、理研の報告書とBCA報告書は小保方さんと名指しこそしないが、ESのコンタミだと言う結論にして若山さんはキメラ捏造の犯人ではないと結論しているのです。ここから演繹できる事実は桂報告書とBCA 報告書を作成した責任者たちは犯人の仲間だということです。報告書には嘘が書かれていると言うことです。虚偽報告書なんです。

遠藤論文を検討すると言い出してからずっと前置きが長いですが、彼も又明らかに犯人の仲間ですから、その論文は虚偽だとあらかじめ分かっているということです。

さて、SNPsの問題に戻りましょう。BCA 報告です。既に虚偽報告書だと言うことは分かっているのですから、どのあたりに彼らの欺瞞が隠されているのかという視点で考え続けているわけです。そしてこのSNPs解析からトリソミーがあると言い出してESコンタミだと騒ぎを広めたのがKahoこと遠藤氏なんです。全部繋がっていますよね。

ACGGGTTCCCAGGAAA…(ワイルドタイプリファレンス 99%同一塩基種であるもの)

ACGGGTTCCCAGGAAA…(サンプル1番 B6塩基配列)
ACGGGTTCCCAGGAAA…(サンプル2番 129塩基配列)
ACGGGTTCCCAGGAAA…(サンプル3番 DBA/2塩基配列)
ACGGGTTCCCAGGAAA…(サンプル4番 BALB/c塩基配列)
ACGGGTTCCCAGGAAA…(サンプル5番 塩基配列)
ACGGGTTCCCAGGAAA…(サンプル6番 塩基配列)
ACGGGTTCCCAGGAAA…(サンプル7番 塩基配列)



ACGGGTTCCCAGGAAA…(サンプル450番 塩基配列)

横に25億の塩基配列が続き、縦に450のサンプルがある。縦に5個以上の変異があるものがまずSNPsであることの第一定義です。全集団で1%以上に存在する変異を一塩基多型(SNPs)と呼ぶ。この場合の全集団は近交系マウスの450種類です。今まではマウス種全体の統計処理だと思ってましたからランダムサンプリング手法による自然生息マウスの大数調査が行われていると思っていましたが、それは前提として実験用マウスのゲノム解読という計画の中で説明が省略されているだけだと分かったわけです。今極端に近交系マウスだけに絞った。これによってそれぞれの近交系マウスに特異的登録SNPsにどの程度の重複があるのかという言うことを知りたいわけです。簡単でしたね。1%ですね。ある一つのDNAサイトにSNPsがある場合、450種の近交系マウスの中でそれが共有されている系統は5種類程度なんです。そしてこれは全てのSNPsサイトで同じ条件です。
今、B6の登録SNPsは300万か所だと言われている。B6と全く同じSNPsを持つマウスは5系統はあっても定義に反しませんね。でもそういうことが実際にあったとしたら。残りの445系統はそのSNPsを持つことがもはやできません。
129が仮にもはやB6と同じSNPsと同じものを一切持てないマウスだったと仮定します。この129も又5系統の全く同じSNPsを持ち得ますが、その時この別々の5系統同士は横の並びである25億サイトの別の場所に300万SNPsを持たなければならないでしょう。
逆に、横の並びである25億サイトに300万SNPsをそれぞれの450系統が全部違った場所に持つとすると、その掛け算は13.5億となります。つまりその可能性はないわけではないということです。でもそういうことはあり得ないので、すべてのSNPsは450の1%である5系統と重複していなければなりません。ということは13.5億の1%である1350万か所は必ず他のどれかの4系統と重複しているということです。しかし、これは99%それぞれの系統は互いに別の場所にSNPsを持つと言えますよね。つまり、B6の登録SNPsサイトである300万か所は129の登録SNPsサイトである300万か所とほとんど違う場所にあると言えているわけです。