Ask @simizu706:

下記のMplusについて質問をしたものです。すみません、用語が混乱しておりました。経験サンプリング法ですので、個人間と個人内の2層構造です。ですので、集団レベルではなく、個人間のレベル2の相関を求めたいと思っています。このとき、予め各変数の平均値を参加者ごとに算出し、BETWEEN変数として指定しておく必要があるのでしょうか?

Mplusでやる場合はそのままデータを入れればOKです。平均値などを計算する必要はないです。詳しくはマニュアルを見てください。

View more

いつもお世話になっております。経験サンプリング法で取得したデータ(質的変数と量的変数のどちらもあります)のマルチレベル相関分析をMplusで行いたいと思っています。この場合、集団レベルの相関を出すには、あらかじめ各集団の平均値を変数として作成しておく必要があるでしょうか?

よくわかってないのですが、経験サンプリングを個人単位でとりつつ、さらに集団レベルの単位でもデータがあるということでしょうか?(つまり3レベルデータ?)ちょっとデータの構造がこれだけではわからないので答えいようがないです。

View more

SEMでの欠損値の扱いについて質問させて頂きます。SEMの測定モデルで、最尤法の場合は欠損値があっても推定できたと思いますが、ベイズ推定の場合も同様の推定は可能でしょうか。突然恐縮ですが、ご回答頂けますと有難く存じます。

可能です。Amosでもおそらく、Mplusは確実にできます。

View more

HADの構造方程式モデルの検討についてお伺いします。分析結果に決定係数を出力させることは可能でしょうか?ご教示頂けましたら幸いです。よろしくお願いします。

今のところできません。ただ、残差分散の標準化係数を1から引けば決定係数になるので、それで計算してみてください。

View more

Rstanで対応のあるt検定を行っているのですが、効果量の算出の仕方がよくわかりません。どうコードを書けばよろしいでしょうか。お時間があるときにでもよろしくお願いいたします。

対応がある場合は、効果量の算出の仕方にいくつかタイプがあります。伝えるための心理統計を読んでみてください。で、Rstanでその本に書いている通りにGenerated quantitiesに数式を書いて生成すればOKです。

View more

豊田本「はじめての統計データ分析」133頁に「ベイズ統計学ではデータの二度使いを禁じている」と書いています。これは、モデル比較のために複数回にわたるデータ解析(統計モデリング)を実施することと折りあいが悪いように感じるのですが、どう解釈したら良いでしょうか?よろしくお願いいたします。

ここで書いてる二度使いはダメ,という話は,同じデータセットで2回分析して,それらの結果を合わせて一つの主張をしてはいけない,ということだと思います。
モデル比較は,どの分析結果がいいかを判断するものなので,ここでの論点にはかかわらないと思います。

View more

いつもお世話になっております。HADでマルチレベル相関分析を行いたいと思っております。データは繰り返し測定データで連続変数なのですが、分析可能でしょうか?よろしくお願いいたします。

分析自体はもちろん可能ですが,その推定値(特に標準誤差)が正しい値になるかどうかは,自己相関の強さによって変わってきます。マルチレベル相関分析は単純な入れ子構造のデータについてのみ正しい結果が出ます。時系列によって生じうる残差共分散が絡む場合には標準誤差は正しい推定値にはなりません。

View more

HADの分散分析の出力についてお尋ねします。各セルの平均値(CellMeanシート)の標準誤差は「標準偏差/sqrt(データ数)」が出力されますが、単純主効果の検定(Sliceシート)の標準誤差は、それとは異なる値が出力されます。後者はどのように算出しているのでしょうか。よろしくお願いいたします。

一般線形モデル(最小二乗法)による推定値です。要因計画や共変量の有無,データサイズのバランス度合いによって標準誤差は微妙に数値が変わります。標準偏差をデータ数の平方根で割ったものが標準誤差と一致するのは,バランスドデータでかつ共変量がない場合に限りますので,必ずしも一致するわけではないです。

View more

JAGSでもStanと同じように研究仮説が正しい確率を推定できますか?よろしくお願いします。

すみません、JAGSを使ったことがないのですが、豊田本で書かれているような意味での研究仮説が正しい確率の推定は、MCMCを使うソフトならどれでも計算できると思います。というのも、MCMCサンプルのうち特定の値より大きいサンプルの数の割合を計算すればいいだけなので。

View more

ベイズ推定によるGLMMでリンク先のような多重比較を行うことはできますか?よろしくお願いいたします。http://www.ibaraki-kodomo.com/toukei/posthoc.html

ベイズ推定では、帰無仮説検定という考え方を使わないので、多重比較もありません。ただ、複数の仮説が正しい確率を計算することができます。豊田先生の「はじめての統計データ分析」などが参考になります。

View more

お返事ありがとうございます。下記でマルチレベル相関係数について質問したものです。ご推察の通り、HADでの分析を想定しておりました。HADのマルチレベル相関分析ではできない、ということは別のソフトでならダミー変数と量的変数の混在で計算できるのでしょうか?重ねての質問で恐縮ですが、よろしくお願いいたします。

Mplusなどを使えばできると思います。

View more

いつもお世話になっております。マルチレベル相関分析は、変数にダミー変数と量的変数が混在していても使用できるのでしょうか?よろしくお願いいたします。

HADで実行できるマルチレベル相関分析の話だと,ダミー変数には適用できません。個人レベルの実現値が2値になるような確率モデルを書けば,変数が2値であっても相関係数を推定することはできるかもしれません。

View more

クロス集計について質問です。こちらの画像http://imgur.com/7knP2iaのように、11,15,13,10...とバラバラに並んでしまいとても見にくくなってしまっています。どのようにすれば1から順番に並べることができますでしょうか。

HADでしょうか。列のほうのデータが文字列として認識されている可能性がありますね。一度度数分布を見て,数値以外の文字列が紛れ込んでないかチェックしてみてください。

View more

長文恐縮です。困っておりご意見伺えれば大変助かります。 ある母集団から標本を採取する際の必要最低標本数を何からの根拠から見積る必要があります。母集団は10万人(例)程度とし、母分散は不明です。標本のある目的変数の予測モデルを構築しその予測モデルが母集団に対して適用してもXX%信頼できる、と言えるのが理想です。予測モデルは多変量を使用しニューラルネットなどパフォーマンスを最大化する為に必要なことを全て実施します。ここでいうパフォーマンスとは、PPV>70%、検出力>80%程度のことを指します。この場合に必要な標本サイズはどのようにきめるべきでしょうか。(決める上で何が足りないでしょうか)

NNN
検定をするなら,検定力分析でサンプルサイズを決定したらいいと思います。もちろんそれは実施する分析に依存するので,それに合わせて検討してみてはどうでしょう。検定ではなく,信頼区間を一定の精度以上にしたい場合についても,「サンプルサイズの決め方」という本にのってるので,それを参考にしてみてはどうでしょう。あとはサンプルを集めるコストなども実際は考慮に入れる必要があるでしょう。

View more

Windows10、Office2016を使っています。32bit版のExcelだとHADのソルバーオンが開いている途中で落ちてしまいました。32bit版だと動かないんでしょうか。ちなみに、ソルバーオフなら動きました。

すみません,32bitの環境が手元にないのでわかりませんが,ソルバーオンはそもそもExcelにソルバーがはいってないと動かないのでそれが原因かもしれません。ソルバーオンはSEMが使えますが,それ以外はソルバーオフでも何も変わりません。問題なければオフのほうを使ってください。

View more

お忙しいところ失礼致します。怒り顔と喜び顔を10段階で割合を合成し,それら10個の顔一つ一つが怒りと喜びのどちらであるのかを判断させる実験をしております。10回の判断を反復測定されたデータとして扱えればと考えており,この判断を従属変数として,「介入の有無」×「介入の前後」で,どのように変化するのかをみたいと考えております。また,介入前に測定したパーソナリティ要因(連続変量)によって,どのように「介入の有無」×「介入の前後」で判断が変わるのかも検討できればと考えております。文章が拙くて分かりにくいかもしれませんが,どうすればこのデータを上手く分析できるのかを,ご助言頂けますと幸いです。

目的変数は2値データみたいなので,変量効果を仮定したロジスティック回帰分析でいいのではないでしょうか。説明変数として介入の有無と前後,パーソナリティを投入して,それぞれの交互作用効果を検討するモデルでいいと思います。

View more

先ほど質問させて頂いた者です。ご多忙のところ、どうもありがとうございます。恐れ入りますが、もう一点だけ質問させて頂けないでしょうか。EXAMPLE 9.6では(p273の終わりからp274の初めにかけて)、Betweenレベルの因子が、Withinレベルの因子のランダム切片となるといったことが書かれていますが、これは、観測変数のBetweenの分散を0にすることと関係があるのでしょうか。恐れ入りますが、ご教示頂けますようお願い申し上げます。

特に関係ないと思います。

View more

マルチレベルSEMについて質問させて頂きます。Mplus Users’ Guide (7th ed.) p.272のEXAMPLE 9.6のモデルをベイズ推定しました。このモデルでは、Betweenレベルの変数の残差が0に固定されていますが、分析すると「分散を0に固定した状態で平均を推定すると、収束とMixingが上手くいかない」という警告が出ます。恐れ入りますが、アドバイスを頂けますと有難く存じます。

Betweenの残差分散を0にするのは最尤法で安定的に解くための処方だと思いますので,ベイズだとその制約を外してもいいかもしれません。あるいは,微小値で固定してもいいかもしれません。0.1とか。一度前者を試してみてください。

View more

HADで特定の値をもつケースのみを分析対象としたい(したくない)等の場合に「フィルタ」を使いますが,複数の値(例えば1~5のうち2と4)をフィルタリングすることはできないのでしょうか.

直接的にはできません。でも、たとえばフィルタをかけたい変数について、2と4を1、1,3,5を0となるように値の再割り当てで変数を新たに作成して、その変数でフィルタをかければ可能です。

View more

ツイートで「潜在ランク理論はかなり多くのパラメータを推定しないといけないので、サンプルサイズは大きくないと再現性が担保されない」と書かれていましたが、実際にはこれくらい必要という目安はあるのでしょうか?

項目の性質や項目の数によって変わると思うので、僕もわかりません。ご自身で分析をやってみたり、サンプルを入れ替えた時にどれぐらいセンシティブにパラメータが変化するかを確認するのがいいと思います。

View more

いつもHADを利用させていただいております。因子分析で問い合わせします。以前は、「因子数」に何らかの数字が予め入力されていましたが、最新のバージョンではそこが空欄になりました。ここに何らかの数字を入れないとスクリープロットボタンを押して分析を進めていけません。何でもいいので数字を入れると分析が進むという理屈が理解しづらいようで、学生が混乱しました。何かそのようにした事情があるのでしょうか?

ご指摘ありがとうございます。前のように最初から1が入っているようにしておきました。特の事情はなく,バージョンアップのなんらかの関係で消えちゃっていたようです。

View more

お忙しい中のご回答ありがとうございます。 判別分析の欠損値を含むデータはリストワイズ削除されるとのことですが、120個の変数の一部に欠損値を含むデータで判別分析を行っても結果で120個全て分類されるのは何故でしょうか。この場合、欠損値はどのような扱いになっているのでしょうか。 続けての質問で申し訳ありませんが、お時間がある時にご回答よろしくお願い致します。

質問の内容がよくわからないのでお尋ねします。120個の変数というのは、説明変数の数のことを指していますか?それともサンプルサイズのことですか?HADでは120個を説明変数に入れることができないと思いうので、かりにサンプルサイズが120のデータであるとして、120個が分類されるというのは何を指していますか?グループ判別のことでしょうか?いま確認しましたが、グループ判別も欠損値があればその分データの数は減っているようです。

View more

お忙しいところ失礼致します。 現在HADを用いて判別分析を行っているのですが、欠損値のあるデータを用いて行う場合、HADではどのような方法で欠損値の補填を行っているのでしょうか。 また、どのような数が補填されているかを確認する方法があるのでしょうか。

HADは一部を除いて、ほとんどの多変量解析はリストワイズ削除されます。欠損値の補填はしていません。SEMでは完全情報最尤法が使えます。

View more

お忙しいところ不躾な質問失礼致します。KING OF PRISM by PrettyRhythmはもうご覧になられましたでしょうか?もしまだでしたら、是非ご覧いただきたいと思います。 なぜこのタイミングでお聞きしたかと言うと、続編のKING OF PRISM by PrettyRhythm -PRIDE THE HERO-が本日から公開されたからです。 ひと足お先に見てきたものですが、こちらも非常に面白かったです。 お忙しいとは存じますが、作業の合間にでも見ていただければと思います。どうぞ宜しくお願い致します。

すみません、すっかり忘れてました。そういや社会学勉強会でこの上映会が企画されていたような・・・ちょっと6月~7月は忙しすぎて(ブルーレイを見るための機器がないw)厳しいですが、上映会を誰かが企画してくれたら見ますよ!

View more

SEM(因子分析モデル)でのベイズ推定について、質問させて頂きます。観測変数が2項目しかなく、最尤法では、因子負荷をどちらも1にする制約を置くと思いますが、ベイズ推定を行うと、この制約を置かなくても収束してしまいます。この結果には何か問題があるのでしょうか。恐れ入りますが、ご教示いただけますと有難く存じます。

それは一見収束しているように見えますが、初期値に依存しています。初期値を変えたら収束先が変わると思います。

View more

Next
  • 427
    Posts
  • 43
    Likes

About Hiroshi Shimizu:

関西学院大学で教員をしています。社会心理学を研究しています。

Hyogo, Japan