So-net無料ブログ作成

少しもEasyでないEZR [統計学もどき]

いろいろやってる場合ではないといいながら、エクセルばかりになるといけんのでRも試したいが、RStudioが英語につき日本語で使いやすいのはないかと探してみたらEZR(Easy R)なるものがあるというのでちょいとインストしてみました。

なんと自治医科大学のさいたま医療センターなんですねえ。
http://www.jichi.ac.jp/saitama-sct/SaitamaHP.files/statmed.html

勝手が違うのか、弁当屋のサンプルを試してみようとしてもでてこん、というかデモの起動の仕方がわからないという、初歩の初歩状態です。

EZR.png

一応起動はしますが、簡単なマニュアルはあるけど、これで使いこなすようになるのは、私には無理なので、またぞろ本を物色する必要があるのかな。

初心者でもすぐにできるフリー統計ソフトEZR(Easy R)で誰でも簡単統計解析
http://www.nankodo.co.jp/g/g9784524261581/
EZRでやさしく学ぶ統計学 改訂2版
http://www.chugaiigaku.jp/item/detail.php?id=1660

以上2冊が出てますが、結構高い。
nice!(3)  コメント(22)  トラックバック(0) 
共通テーマ:blog

nice! 3

コメント 22

ryu-ron

統計ネタ専用コメントの場所を確保しましたが、当面あまり書けそうにありません。 本だけはなんとか読み続けます。
多変量解析のはなしも、重回帰分析のところまできました。ここまで読んでしまえばいいでしょう。
なかなか二級受検宣言が出せませんが、なんとか乗り切るかなあ。
by ryu-ron (2015-11-20 08:45) 

ryu-ron

おお これはありがたい。
http://minato.sip21c.org/ebhc-text.pdf

ちゃんとロジスティック回帰分析があります。120ページ

ロジスティック回帰分析の思想としては,例えば疾病の有無を,複数のカテゴリ変数によって表される要因の有無と年齢のような交絡因子によって説明するモデルをデータに当てはめようとする。量的な変数によって表される交絡を調整しながらオッズ比を計算できるのが利点であり,医学統計ではもっともよく使われる手法の一つである。
疾病の有無は0/1 で表され,データとしては有病割合(総数のうち疾病有りの人数の割合)となるので,そのままではモデルの左辺は0 から1 の範囲しかとらないが,右辺は複数のカテゴリ変数と量的変数(多くは交絡因子)からなるので実数のすべての範囲をとる。
そのため,左辺をロジット変換(自身を1 から引いた値で割って自然対数をとる)する。
つまり,疾病の有病割合をP とすると,ロジスティック回帰モデルは次のように定式化できる。

疫学では重要な理論ですね。
by ryu-ron (2015-11-20 11:50) 

ryu-ron

先ほどのPDFにはポアソン分布はないけど、ポアソン回帰はあったので、ちょいと検索したら

http://www.snap-tck.com/room04/c01/stat/stat15/stat1501.html

ちと難しいのですが、医療統計に使われているので、今回の津田先生の分析はこっちでいったのかもしれませんね。

これはエクセルでなんとかなるかな。
by ryu-ron (2015-11-20 12:16) 

ryu-ron

津田先生のこっちにポアソン分布がわりと詳しく書いてました。
http://www.foejapan.org/energy/evt/pdf/130526_t.pdf

うー 意味がわかるようになるか?
by ryu-ron (2015-11-20 13:19) 

ryu-ron

ポアソン解析はけっして古臭いやり方ではなくて

平沼さんがいろいろ翻訳をしていただいてますが

「放射線モニタリングを受けた作業者(INWORKS)における電離放射線と白血病およびリンパ腫の死亡リスク:国際コホート研究」
http://fukushimavoice2.blogspot.fr/2015/07/inworks.html

方法:フランスの原子力・新エネルギー庁、 アレヴァ原子燃料部門、またはフランス電力会社、米国のエネルギー省と防衛省、そして英国の放射線業務従事者登録に含まれている原子力産業作業者で、最低1年間雇用され、被ばく線量の個人モニタリングをされた308,297人の作業者のコホートを構築した。コホートは、計8,220,000人・年に達するまで追跡された。白血病、リンパ腫と多発性骨髄腫による死亡者を確認した。ポアソン回帰を用いて、骨髄吸収線量推計値と白血病とリンパ腫の死亡率との間の関連性を定量化した。

けっこう世界的に使われてますね。
by ryu-ron (2015-11-20 13:35) 

ryu-ron

ここに津田先生の説明が出てきました。

http://www.kinyobi.co.jp/blog/wp-content/uploads/2013/03/fefc48e1bcaef4b4191bb12c61f176731.pdf

3ページに

9 例ですと 33.73 倍(95%信頼区間:16.72 倍-64.84 倍)、10 例ですと 37.48 倍(95%信頼区間:19.95 倍-68.74 倍)となり、3 例で計算した場合よりさらにはっきりとした統計学的に有意ながんの多発ということになります。いわゆる「5%有意」という言葉で有名な有意差検定で用いる確率値を示しますと、10 のマイナス何乗という通常あり得ない確率が求まり、極めて希な現象が起こっていることが分かります。ちなみに 9 例ですと 1.5×10のマイナス 9 乗%有意、10 例ですと 3.9×10 のマイナス 11 乗%有意です。マイクロソフト・エクセルの関数機能のポアソン分布累積確率の計算を使いイベント数がこれより 1 少ない確率を出し、1 から引きますとできますので、実際にやってみてください。なお、9 例や 10例全員を発生症例と見るべきだと考えた場合は、すでに述べましたように平均有病期間を 1年としてください。

https://dekiru.net/article/4579/
このあたりを見ながら

=POISSON(78,3, TRUE)

とかやってるけど、なんちゃわからん。
by ryu-ron (2015-11-20 18:11) 

ryu-ron

週刊金曜日のPDFはわりと前の分で、けっこう津田先生の記事はでていたんですねえ。

だれかひとりくらいエクセルで試しているかと思ったけど見つからない。
by ryu-ron (2015-11-21 09:17) 

ryu-ron

多変量解析のはなしも、一応重回帰分析まで読んだので、ちと早いが返してしましました。まあコピーはとってるから、他の本でこのあたりがでてきたら、読み返すことはできます。
これで仕事モードに突入したかったのですが、早朝ふとん中読書用に、まだ読みあげずに返してしまった「統計のはなし」をまた借りてしまいました。
異常に早く目が覚めてしまったときに読むとすぐ眠れるので、まあこれもいいかな。

ポアソン分布を悶々と考えてると目がさえてしまうので、これはしばし休戦いたします。
by ryu-ron (2015-11-21 10:58) 

ryu-ron

ここを見てなんとなくポアソン分布がわかりつつありますが、
http://homepage1.nifty.com/gfk/Poisson-Prob.htm

年間に100万人につき3人しか甲状腺がんにかからないということで、1人づつ増やして行って、その人数が発症する確率をポアソン分布で表すと

=POISSON(人数,平均人数*1年,FALSE)

平均人数*1年=3にしてみました。

として、年に10人発症する確率はほぼ0なので、やはり福島は異常だといえると。まこんな簡単でいいのかな。グラフはそれとなくいい形になったのですが。
多分ポアソン回帰分析はもっと複雑なのでしょう。
by ryu-ron (2015-11-21 15:16) 

ryu-ron

あれ、FALSEと TRUEでがらりと変わる。あんまり深く考えまい。
ちと仕事に励まねば。

niceのお返しができなくてすんません。
by ryu-ron (2015-11-21 16:17) 

ryu-ron

おおさかダブル選挙も気にならんでもないのですが、どうも事前情勢通りになってしまうのですかね。

大きな選挙でちっとは違う結果を期待したいのですがねえ。

さて、ちと仕事のとっかかりが遅い。がんばらねば。
by ryu-ron (2015-11-22 11:16) 

ryu-ron

こっちに書いておきましょうかねえ。選挙ネタ 思った以上に差がつきました。
橋の下を復活させてしまいますね。

どうなんだろうなあ。自民が批判されたのならよしとすべきだが、維新は憲法に関してはただの別働隊。

そういうのをぬきにして大阪の改革だけを託したと受け取るしかないのでしょうね。

世に倦むさんは
https://twitter.com/yoniumuhibi/status/668421496725897216
明き変わらずの共産党、SEALDs批判でした。
by ryu-ron (2015-11-23 10:51) 

ryu-ron

EZRのマニュアルにもなる
保健・医療研究の進め方入門—R と EZR を用いて—
のPDFですが、印刷するのもしんどいのでiPad miniで見ようとすると、1ページを縦1面に表示する字が小さすぎてしんどい。
拡大して読めばいいのでしょうが、なんとなく動きが遅い。
印刷するしかないのかな。
by ryu-ron (2015-11-23 13:04) 

ryu-ron

統計ネタだけど、津田先生の方でもよかったみたい。
http://www.ourplanet-tv.org/?q=node/1549

ここにもポアソン分布が出てきて表もあるのですが、

厳密に計算する〜ポアソン分布の限界値
 
がんのように、発生率が低いものを統計学的に考察する際、ポアソン分布という確率分布を用いるという。ポアソン分布は、「平均がん患者数(対象者数×がん発生率)」が示す分布だ。がん発生率=平均がん患者数÷対象者数となり、今回のように3例だと、0.818例から8.808例という95%信頼限界を取る。平均有病期間7倍というやや長めの値を仮に当てはめても、有意差のある多発となる。

これの意味がわかるようになるには、やっぱ「確率のはなし」を読まなければならないか、来月最初の日曜に県立図書館に行く機会ができそうだが、それまでに、あれこれこなしておかないといけません。
by ryu-ron (2015-11-23 15:49) 

ryu-ron

どうでもいい話しながら、来月の県立図書館行きが延びそうでわからなくなったのですが、正月までには、ジュンク堂あたりに行く機会もあるでしょうから、「確率のはなし」の中身を見て、ポアソン分布や、ベイズのところが詳しければまた考えましょう。と気の長い話。

明日の津田先生のインタビューも全部見る時間がとれるかわからないので、小分けに見るといたしましょう。
来月中旬に一回仕事の山がくるので、それを乗り越えたら次の記事も考えねばなりませんねえ。
もう冬眠宣言はしませんが、実質冬眠に近くなるかも。
by ryu-ron (2015-11-25 11:00) 

ryu-ron

統計のはなしもやっとこさ基礎編が終わりに近づいていた、t検定のところにきてますが、布団の中では計算式を追うのが面倒で、ついつい飛ばしぎみになります。
http://homepage1.nifty.com/gfk/t-Prob.htm
このへんを見てエクセルで確認しながらいくといいのでしょう。

結局気になって「確率のはなし」もリクエストしてしまいました。
まあ目次が気になったからなのですが、アマゾンでも中身が見れないのでこれも仕方ないか。
by ryu-ron (2015-11-26 09:21) 

ryu-ron

あらここにあったわ。
http://www.tradersshop.com/bin/showprod?c=9784817180117

目次

基礎編
1. 確率と人生
2. 確率とは?
3. ことがらの性質
4. 確率の計算のしかた(その1 簡単な場合)
5. 確率の計算のしかた(その2 ちょっと複雑な場合)
6. 分布のはなし
応用編
7. もうけを予測する
8. ゲームの理論
9. 偶然を作り出す
10. ぺテンにかかりそうな確率
11. 確率の大学院

娯楽編
12. パチンコの確率
13. ダイス遊びの確率
14. トランプ占いの確率
15. ブリッジの確率
16. 競馬の確率
付録
クイズの答

なんか「統計のはなし」とよく似た目次です。まあ中身を見るしかないですね。
by ryu-ron (2015-11-26 09:32) 

ryu-ron

確率のはなしは、来週金曜日に来るので、それまで統計のはなしを読み進めるかというところですが、さすがにまだ100ページ以上もあるので、X(カイ)2乗検定とF検定をじっくり1週間読むとします。
といってもあんまり時間もとれないのですが、昨日は、iPadの電卓の科学計算のほうで、本に出てくる数式を確かめましたが、まあ特殊なのは√ぐらいで、あとは()を計算で使えるので、普通の電卓のメモリー組み合わせよりはかなり使いやすいです。
iPhoneにもあるから、もっと本格的なマニュアルがネットにないか探したけどあまりないですねえ。
持ち込みはできんので、ふつうの電卓にも慣れておかねばなりませんが、いくらか受験を意識してきてはおります。
by ryu-ron (2015-11-27 09:24) 

ryu-ron

検索の仕方をちょっと変えると欲しい情報は手に入るもので
http://www.mm-labo.com/ambookreview/asin/4817180110.html

書は「基礎・応用・娯楽」とサブタイトルにも書かれているように,基本的な内容からかなり高度な内容まで扱われています.高度でありながら,その筆致はいたって平易なため,スラスラと読み進めることが可能です.<P>まず基礎編では,確率の意味から始まり,条件付確率や中・上級レベルの分布にまで話が及んでいます.応用編にいたっては,ゲーム理論や待ち行列の理論,果てはマルコフ連鎖,マルチンゲールそしてエルゴード性にまで言及されています.細かい数理的な説明ではなく,言葉を中心とした分かりやすい説明がなされています.<P>私自身,高校時代に確率・統計をほとんど勉強しないまま,大学では経済学部に入学してしまい,学部時代の必修科目であった統計学をクリアするべく,同著者による『統計のはなし』と『統計解析のはなし』とともに本書を通読しました.あまりの分かりやすさに,今では統計学を専攻するにいたっています.ある意味で,私の人生を規定した偉大な書物でもあります.<P>それはさておき,まずは騙されたと思って読んでみてください.きっと確率・統計をもっと勉強したくなること請け合いです.<P>なお,本書の最後の付録では,最低限の数理展開による証明も付されているので,数学が得意な人にとっても,読み物として最適な一冊だと思います.

検定準一級の範囲もカバーされているなら買いなのですが。マルコフ連鎖もそこそこ詳しいならなんとかなるかも。
by ryu-ron (2015-11-27 10:23) 

ryu-ron

こういう難しい部分も確率のはなしでなんとかなってるみたいです。
http://www002.upp.so-net.ne.jp/self/elements/ergodic/ergodic_0.html

準1級の問題では
http://www.toukei-kentei.jp/about/pastpaper/2015j/2015j_grade1semi.pdf
論述の選択式にはマルコフ連鎖が出てますが、穴埋め式には出ておりません。といってもまだ1回しか実施されてないので、この先どうなるやらわかりませんが、最初から捨ててかかってもなんとかなるか。
などと2級も受けないうちから先走ったことを考えておるアホであります。
ま そのうちそのうち。

試験はともかくRの達人になれば、マルコフ連鎖、モンテカルロ法にも対応できるのだな。
http://d.hatena.ne.jp/isseing333/20100611/1276235951

凄いもんだ。高価なソフトでなくてもなんとかなるんだ。
by ryu-ron (2015-11-27 12:20) 

ryu-ron

準一級の合格体験記ですが
http://www.toukei-kentei.jp/koe/koe01semi-01.html
弁護士さんですので、元々頭のいい人だから参考にはできないが

準1級は、基本的には2級の参考書に加え多変量分析や統計分析の入門書を読めば十分に対応できる印象があります。もっとも、2級よりも計算量が多いため、2級の過去問題集を、選択肢や問題文の誘導なしに最後まで解く練習をすることや、余裕があれば(すべて記述式である)1級の過去問題集の基礎的な部分を解いてみるのも有効だと思います。実際の準1級試験は時間不足でした。配点を踏まえた時間配分の計画をあらかじめ立てることをお勧めします。

この辺だけつまみ食いをすると、確率のとんでもなく難解な本を読まなくてもいけるのですかね。私の場合は関数電卓をしゃかりきに使えるようにならないと駄目だが、まあ夢だけ見させていただきましょう。
by ryu-ron (2015-11-27 13:14) 

ryu-ron

アスベストによる中皮腫などの肺疾患については、保険所レベルでロジスティック回帰分析を使っているというのが

全国保健所のアスベスト相談業務の現状と相談に対する担当者 ...
arch.luke.ac.jp/.../全国保健所のアスベスト相談業務の現状と相談に対す...

で検索すると出てくるワードファイルでわかります。

救済法申請については51.4%が「自信がない」と回答した。自信に関する要因:ロジスティック回帰分析の結果、マニュアルを用いる、心理支援を行う、労災認定職場を把握している、相談件数が多い保健所は担当者の自信が高かった。

ホットパーティクルによる肺腺がんもなにか、こういう解決の糸口がつかめるといいのですが、原子力村は全力で潰しにかかるでしょうね。
by ryu-ron (2015-11-27 16:50) 

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

※ブログオーナーが承認したコメントのみ表示されます。

トラックバック 0