Hiroshi Shimizu
Latest answers

クラスタ頑健標準誤差を用いて分析した場合の、標準化係数について、質問させて頂きます。マルチレベルモデルの場合、標準化係数をどのように求めるかについて議論があるようですが、クラスタ頑健標準誤差を用いた場合は、ソフトウェアの出力をそのまま論文で報告しても問題ないでしょうか。突然の質問で恐縮ではありますが、ご回答いただけますとありがたく存じます。

問題ないと思います。そもそも、マルチレベルモデルでも、ランダム係数を仮定しなければ標準化偏回帰係数の推定は問題ないように思います。ただ、「モデリングが先、補正は後」というのが近年の主流な考え方かなーと思うので、クラスタ頑健標準誤差に頼りしぎるのもどうか、と思ったりなんかしちゃったりなんかします。

View more

さきほどファイルが開けないと質問した者です。DropboxからDLしたものだけが,先に質問いたしましたように開けなくなってしまうようです。ミラーサイトのgoogleドライブからDLしたものは開きました。

ご報告ありがとうございます。今のところうまく再現できませんでしたが、DropboxとOSになにか相性があるのかもしれません。ほかの人に同じ症状がないかも今度聞いてみます。

View more

初歩的な質問になってしまって恐縮なのですが、HADを使用して二次因子を得るために高次因子分析を行うことは可能なのでしょうか。お時間のある際にお答えいただけたら幸いです。何卒宜しくお願い致します。

SEMを使えばできます。

View more

お世話になっております。HADでの共分散分析についての質問です。結果には,共分散分析の前提条件とされている回帰係数の等質性や有意性についての検定結果が表示されません。この点についてのお考えをお聞かせいただけないでしょうか。よろしくお願いします。

回帰係数の平行性については、群と共変量の交互作用項の有意性で判断が可能です。ただ、回帰係数が平行であるかどうかを検定で判断して、共分散分析を使うか否かを判断するのは、検定の多重性につながるので個人的には推奨しません。

View more

一昨日、Stanを用いた回帰分析での標準化係数の求め方について質問させて頂いたものです。重回帰分析で説明変数の分散も同時に推定する場合、各説明変数がそれぞれ正規分布に従うというコードか、多変量正規分布に従うというコードのどちらがいいでしょうか。それとも、説明変数の分散は、回帰分析とは別個の分析で求めるという意味で仰られたのでしょうか。度々恐縮ですが、ご回答頂けますと有難く存じます。

基本的には、回帰分析の場合説明変数の分散や共分散は推定しません。ただ、構造方程式モデルではそういうことをする場合があります。
回帰分析のStanでの書き方は、アヒル本(StanとRでベイズ統計モデリング)の4章、5章あたりを見てください。

View more

Stanの使用法について質問させて頂きます。論文投稿の際に、効果量を示すことが求められることが多いと思いますが、回帰分析の際の、標準化回帰係数はどのように求めればいいでしょうか。恐れ入りますが、ご教示頂けますと有難く存じます。

データを標準化してからStanで回帰をすれば計算できます。ただ説明変数の分散を推定している場合は、generated quantitiesブロックで回帰係数に説明変数の推定されたSDをかけて、目的変数のSDを割れば計算できます。

View more

パス図を作成したのですが カイ2乗検定は棄却されず cfi.987 rmsea0.07 gfi.871 agfi.700 とagfiが低い状態なのですが この場合どのように判断すればよろしくでしょうか 変数は9因子 またサンプル数は25名と少ない状態です agfiを記載しないという選択肢もあるのでしょうか?

どういうモデルを組んでるのかがわからないので何とも言えませんが、とりあえずサンプルサイズ25名で構造方程式モデルは少し小さいと思います。適合指標はどんなモデルかによって判断がまた変わると思うので、何とも言えません。あと、悪いから記載しないというのは僕からは提案できません。

View more

線形代数の良い教科書を教えてください。心理統計、ベイズ統計の理解に必要と考えています。

このあたりが有名っぽいです。
https://www.amazon.co.jp/%E7%B7%9A%E5%BD%A2%E4%BB%A3%E6%95%B0%E5%AD%A6%EF%BC%88%E6%96%B0%E8%A3%85%E7%89%88%EF%BC%89-%E5%B7%9D%E4%B9%85%E4%BF%9D-%E5%8B%9D%E5%A4%AB/dp/4535786542

心理統計やベイズ統計の理解に必要,ということで言うと,
行列の掛け算,逆行列,固有値分解あたりを知ってれば十分だと思います。

View more

多母母集団分析についてお聞きします 現在患者の自己評価とセラピストの評価差とadl、心身機能、認知機能の関係性を研究しています 初回評価と最終評価時でパス図を作成し配置不変性、差の検定をしたいのですが可能でしょうか また状態悪化、急きょの退院で一部サンプルサイズが違う状況です

同じ参加者に2回とったデータなら、それは多母集団分析ではなく、Time1、Time2みたいな感じで同じモデルの中で変化をモデリングする必要があると思います。

View more

マルチレベルSEMについて質問させて頂きます。Withinレベルの変数のランダム傾斜が、Betweenレベルに設定されますが、このランダム傾斜が、さらに他の変数のランダム切片を説明するというモデルを組むのは、間違っていますでしょうか。突然の質問で恐縮ですが、ご回答頂けますと、有難く存じます。

ちょっと整理すると、他の変数のランダム切片もBetweenレベルですよね?なのでBetweenのモデルとしてパスを設定したりすることはできます。たとえば潜在曲線モデルなんかは、ランダム切片・傾き間のパスを仮定したりすることはあると思います。複雑になるし、収束がうまくいかない場合もあるかもしれませんが、一度試してみてはどうでしょう。

View more

HADでの重回帰分析,ステップワイズを行った際,"Stepwise"のシートが表示されませんでした。これはどんな問題がある可能性があるのでしょうか。使用しているのはHAD15_106, windows10になります。よろしくお願いします。

これはどっかのバージョンから出力しなくなりました。マニュアルが修正できてないのだと思います。

View more

先生のウェブサイトを拝見して、最尤法でSEMをする場合、50から100のサンプルサイズが必要ということを知りました。推定方法がベイズ(MCMC)の場合、これよりも少ないサンプルサイズでもSEMでの分析は可能でしょうか。突然の質問で恐縮ですが、ご回答頂けますと有難く存じます。

どういう観点で「可能」かと考えるかによりますが,最尤法と比べてでいえば,ベイズのほうが少ないサンプルサイズでも妥当な推論ができると思います。最尤法に限って言えば,パラメータの分布が正規分布になるという前提で検定しますが,前提が小さいサンプルだと成り立たないためです。ベイズは分布への近似という手法を使わずに推論できますので,そういう意味では小さくてもそれなりには大丈夫じゃないでしょうか。

どっちにしろ,サンプルは大きい方がいいです。

View more

HADの順序回帰(ロジスティック)とRのglmで説明変数の係数は完全一致するのですが,切片が一致しません。これは何が原因なのでしょうか。

順序回帰は,2値の場合,普通のロジスティック回帰と切片の符号が逆になります。一致させたい場合はHADの名義回帰をつかってください。あと,HADは交互作用をいれると自動的に中心化をするのがデフォルト設定になっています。中心化の設定はオプションから選択できます。

View more

Stanでノンパラ検定は「できるかもしれないし、できないかもしれない」と先生でも答えるぐらい難しいという理解でいいですか?Stanでスピアマン相関分析なども興味があったのですが。心理学だとノンパラを良く扱うので少したじろぎました。先ほどStanでBrunner-Munzel検定の質問した者です。ご多忙のところ申し訳ないです。よろしくお願いいたします。

いや,僕を基準に難しいかどうかを判断するのは良くないと思います。僕の知識も偏ってますし,ノンパラについてはあまり詳しくないです。知っている人からすれば簡単にできるかもしれません。

View more

StanでBrunner-Munzel検定を実行したいのですが、先生のStanの資料にあるStanによる差の検定のコードでよいのでしょうか。よろしくお願いいたします。 http://norimune.net/2319

Stanでノンパラ検定をやる方法は僕は知りません。できるかもしれないし,できないかもしれません。すみません。

View more

StanでSEMしたいですが、Stanマニュアルを見てもわかりませんでした。例えば、2つの潜在変数と各潜在変数に5つの観測変数がある確認的因子分析を実行するには、どんなコードを書いたらよいですか?お忙しいところすいませんが、よろしくお願いいたします。

確認的因子分析をするのは比較的簡単です。ざっくりとだけ書いておきます。

パラメータで因子得点を2つ用意します。で,平均値パラメータに次のような構造を仮定します。10個観測変数があるなら,mu[10]と配列で。alphaは切片,betaを因子負荷量とします。alphaは観測変数の数分だけ,つまりalpha[10]とします。betaは観測変数×因子数が必要ですが,もしひとつの観測変数に1つの因子だけが付加するならbeta[10]でもOKです。
第一因子に付加する項目は
mu[1] = alpha[1] + beta[1]*f1
mu[2] = alpha[2] + beta[2] *f1

みたいに。
第二因子は
mu[6] = alpha[6] + beta[6]*f2

みたいにします。
あとは,y[1] ~ normal(mu[1], sigma[1]);という感じで,各項目ごとにサンプリング式を書きます。for文で回して書いてもOKです。

f1とf2についてはf1 ~ normal(0,1);という風に,標準正規分布を仮定することが多いです。もし因子間相関を仮定したいなら,fをベクトルで宣言しておきます。つまり,
vector[2] f;
として,
f ~ multi_normal(rep_vector(0,2), Sig);
とします。Sigは因子の共分散行列です。この辺は僕が上げた資料なんかを見て書いてみてください。

では。

View more

MCMC(;´Д`)ハアハアを楽しむためには、パソコンのスペックはどれくらいあればよいですか?パソコンの買い換えを検討しています。よろしくお願いします。

あまり考えたことがなかったですが,性能はよいならよいだけいいんじゃないですかね。

少なくともコアは8つあるほうがいいです。4つだと少ないですね。
目盛りは最近のPCが積んでるぐらいあれば十分です。
CPUは早ければ早いほどいいです。現状「これで十分」というものはないと思います。

View more

ベイズで研究仮説が正しい確率だと主張できるロジックがピンときません.頻度主義であれば,データが得られる確率を推定し,5%未満だったら帰無仮説を棄却し,対立仮説を採用するというロジックです.これは何となくわかります.でもベイズによる研究仮説が正しい確率はどんなロジックなのかが理解しにくいです.先ほど,同様の質問をした者です.わかりにくい聞き方でたいへん失礼しました.お忙しいところ申し訳ありませんが,ご教授のほどよろしくお願いいたします.

ベイズと頻度主義の違いは,パラメータが確率分布で推定されるか否かが違います。ベイズの場合はパラメータが確率分布で推定されるので,パラメータが仮説に当てはまる場合(パラメータがある値からある値の範囲になる,とか)の面積,つまり確率が直接計算できます。
A>Bという仮説の場合,AがBよりも大きい確率をそのまま計算すればいいのです。

一方頻度主義の場合はパラメータが固定値なので,仮説が正しいつまり,パラメータが特定の値の範囲に入る確率というものが計算できません。なので,あるパラメータが正しい場合のデータが得られる確率しかわからないのです。

View more

ベイズ推定では,研究仮説が正しい確率を直に推定できるとされていますが,その理屈がいまいちよく理解できません.以下の資料と豊田本は読みした,わかりやすく教えていただけますか?よろしくお願いいたします. http://www.slideshare.net/simizu706/ss-57721033

豊田先生の緑と青の本以上に僕は分かりやすく説明はできない・・・ですかね。どこがどう具体的にわからないのかわからないので,なんとも言えないというのもあります。全部説明しようと思ったら本1冊分は必要じゃないでしょうか。

View more

先生はStanコードはどのように書いているのですか?数式から直接書き起こしているのですか?それとも、既知のStanコードを元に修正しながら書いているのですか?先生のblogを見ると自在にStanコードを書かれている印象があるので興味を持ちました。よろしくお願いいたします。

簡単なモデル(一般化線形モデルとか)なら直で書いてます。でも難しいモデルとかは,数式が書いてある論文や本を見ながら書いています。
Stanコードを効率的に書くためには,線形代数などの知識があったほうがいいですが,効率さを求めずにただ単に推定するだけなら,数学とかの知識はあまり必要ないと思います。もちろんそれは,モデルの複雑さにもよりますが・・・

View more

Stanを使いこなすためには数式の理解が必要だと思うのですが、文系出身なので数式理解が全く追いつきません。オススメの書籍、勉強法はありますか?お忙しいところすいませんが、ご助言よろしくお願いいたします。

最近出た,「StanとRでベイズ統計モデリング」がオススメです。数式もそんなに出てこないです。あと,この本の読書会を11月23日,大阪梅田で行います。枠があと一つしかないですが興味あるようでしたらぜひ。
https://atnd.org/events/83097

View more

いつも大変お世話になっております。GLMMで応答変数が順序カテゴリカル分布(三項分布)のときはどのようにコードを記述すればよいのでしょうか?glmmstanを愛用させていただいているのですが、コードの記述方法がいまいちわかりません。教えていただければ幸いです。 P.S. Osaka.Stan楽しみにしています。

名義ロジスティック回帰は,確かに面倒ですね。Stanマニュアルの6.5節にあるMulti-Logit Regressionを参考にされるといいと思います。マニュアルには識別可能にするための工夫についても書いてるので,よく読んでみてください。

気が向けば多項ロジスティック回帰の例をブログに書いてみます。

View more

m-plusでベイズ推定すると情報量基準でDICが出力されます。しかし渡辺澄夫先生の「ベイズ統計の理論と方法」をみるとDICよりもWAIC、WBICが良いと書いています。m-plusの結果からWAIC、WBICを計算する方法があれば教えてください。よろしくお願いいたします。

MplusはWAICは出力しないですが,対数尤度を取り出す方法があれば,そこから計算することはできるとは思います。しかし,その方法は僕もわかりません。Muthenに直接問い合わせるのがいいかと思います。WBICは現状はMplusが対応しない限りは計算が難しいと思います。

View more

HAD15_105版でSEMのパス図モードでモデル図を描く際、一番最初に指定した使用変数が2つ表示され、変数が1つだけモデル図以外のところに表示されてしまいます。HADを再ダウンロードしても同じ現象が起きたのですが、解決方法がありましたら、教えてください。よろしくお願い致します。

僕の環境では再現できませんでした。できれば,OSとExcelのバージョン,そしてその現象が生じるファイルをデータごと送ってもらえないでしょうか。よろしくお願いします。

View more

いつもお世話になっております。Preacherのサイトで単純効果分析を行ったのですが、その結果の中に「 At w1(1).simple intercept = 0.043(0.0093), t=4.6246, p=0」という表記がありました。このP=0というのは、何かこちらの計算(入力ミス)のためでしょうか?もしくは、こうした結果が出ることもあるのでしょうか? お忙しいところ申し訳ありませんがよろしくお願いいたします。

あまりに小さいと0と表記されるのかもしれませんが,どういう桁表記をしているかは僕にはわかりません。Preacher本人に訪ねてみるのが早いと思います。

View more

Loading…

Ask @simizu706:

About Hiroshi Shimizu:

関西学院大学で教員をしています。社会心理学を研究しています。

Hyogo, Japan

http://norimune.net