top of page

2095. MOOCのフラクタル次元に関する興味深い発見事項


昨日の研究インターンを振り返ってみると、昨日も一日中プログラミング言語のRと向き合っていたように思う。午前中から午後にかけて、当初予定していた分析を全て順調に行うことができた。

結果についても大変興味深いものが得られたのだが、統計的な有意性がほとんどなく、その結果が偶然の産物である可能性も残されていることに注意が必要である。

結果として出てきたのは、MOOCの講義をセンテンスの長さで定量化してみたところ、その時系列データに潜むフラクタル次元は、受講者の講義の完遂率とテストスコアとの間に負の相関関係があるというものだった。

つまり、フラクタル次元が下がれば下がるほど、受講者の講義の完遂率とテストスコアが向上するという関係性を見出すことができた。結果の解釈についてはより慎重になる必要があり、もう一度フラクタル次元の定義について確認する必要があるが、今回の分析で言えば、センテンスの長さを尺度とした時系列データの変動性が激しい場合には、完遂率とテストスコアが下がる可能性があるという説明ができる。

対象としたMOOCは、七週間に及ぶものであり、各週の講義をセンテンスの長さで定量化した時、各週の時系列データは全てホワイトノイズという変動性が激しい特徴を持っていた。そうしたことからも、昨日得られた分析結果は、より調和の取れた変動性を持つ講義の方が完遂率とテストスコアを向上させるという当初の仮説を裏付けるものであった。

しかし繰り返しになるが、統計的な有意性がほとんどないので、仮説を裏付けたとは決して言えず、依然として今回の結果は偶然の産物に過ぎないという可能性が残っている。

昨日の午前から昼食までの時間は、上記のような分析を行っていた。昼食後、また別の定量化基準で時系列データを生成することを行っていた。

今度は、講義のトランスクリプトの中に潜む “stopwords”の数を元に時系列データを作っていくことにした。しかし、ここでもまたプログラミングコードを書くのに苦戦を強いられた。

様々な試行錯誤を経て完成したコードは、一見するとうまく機能しているように思えたのだが、よくよく元のデータと照らし合わせてみると、実際の文章の中に潜むstopwordsの数よりも一つ多く数えているものが紛れている。

これはコンマを一個として数えてしまったために起こったのではないかと思われる。そこからコンマを除去するためのコードを書いて試してみたところ、それでも問題が解決しなかった。

先週の月曜日ほどに落胆したり、憤りを覚えることはなく、研究を離れている間にもこの問題について頭の片隅のどこかで考え、最適なコードのイメージをふとした時に考えることにした。金曜日にもう一度この問題に取り掛かり、その日に解決をしたいと思う。

金曜日の早朝にまずは昨日得られた結果を簡易的なレポートとしてまとめ、それを昼食前か昼食後にスーパーバイザーたちに送りたいと思う。学術論文をジャーナルに送ることは腰が重いが、研究をすることそのもの、そして論文を書くことそのものには相変わらず大きな喜びと充実感がある。フローニンゲン:2018/2/27(火)07:11 

No.814: A Dream Train

Our life is often compared to a road and a process of awakening from a dream.

We may be always riding on a dream train on the road in our life. Groningen, 08:19, Wednesday, 2/28/2018

過去の曲の音源の保存先はこちらより(Youtube)

過去の曲の楽譜と音源の保存先はこちらより(MuseScore)

bottom of page