統計教育サンプルデータをAIで自動生成するのは無理だった
小説や漫画の登場人物のスペックを読者が勝手に想像して入力することで、統計教育に使えるオープンデータを作ろうという思いつきについて、AIでできるかも? と思いついたことから、試してみたが、失敗したという話である。詳細は以下。
Microsoft Edgeの右上のアイコンからCopilotを呼び出して、
小説や漫画の登場人物300人分の社会心理的特徴のデータをcsv形式で作ってください。
変数としては、名前、年齢、身長、体重、性別(それ以外と不明というカテゴリは必須)、同居世帯構成、親しい友人の数、自己効力感、Big5性格特性、PHQ-9、PHQ-15、GAD-7、ソーシャルサポート、ソーシャル・キャピタルの尺度を含めてください。
と質問を打ってみた。すると以下の回答が表示された。
もちろんです。小説や漫画の登場人物に関する社会心理的特徴のデータをCSV形式で作成します。以下にリストされた変数を含めて、300人分のデータを生成します。
- **名前**: 登場人物の名前
- **年齢**: 登場人物の年齢
- **身長**: 登場人物の身長(単位はメートル)
- **体重**: 登場人物の体重(単位はキログラム)
- **性別**: 登場人物の性別(男性、女性、それ以外、不明のいずれか)
- **同居世帯構成**: 登場人物がどのような世帯で暮らしているか(単身、家族、ルームメイトなど)
- **親しい友人の数**: 登場人物が親しい友人とどれだけ交流しているか
- **自己効力感**: 登場人物の自己効力感の尺度
- **Big5性格特性**: 登場人物の性格特性をBig Fiveモデルで評価
- **PHQ-9**: 登場人物のうつ症状の程度を評価するための尺度
- **PHQ-15**: 登場人物の身体的な不調の程度を評価するための尺度
- **GAD-7**: 登場人物の一般的な不安症状の程度を評価するための尺度
- **ソーシャルサポート**: 登場人物がどれだけソーシャルサポートを受けているか
- **ソーシャル・キャピタル**: 登場人物のソーシャル・キャピタルの尺度
これらの変数を含むCSVファイルを作成します。お待ちください。
- ソース: Bing との会話 2024/2/3
- (1) 物語はいかにして心を動かすのか: 物語説得研究の現状と態度 .... https://www.jstage.jst.go.jp/article/sjpr/59/2/59_191/_pdf.
- (2) 物語の場面における登場人物の役割と人数の特徴的パターンの抽出. https://www.jstage.jst.go.jp/article/pjsai/JSAI2022/0/JSAI2022_1H5OS17b04/_article/-char/ja.
- (3) 【無料】小説のキャラクター設定シートを配布しているサイト6 .... https://lifelikewriter.com/character-sheet-template/.
ここからどれくらい待てばCSVファイルができるのか、どうやってダウンロードすればいいのかはわからないが、思ったよりまともな応答で驚いた。
暫く待ってみたが何も起こらないので、次に「生成されたCSVファイルへのリンクを表示してください」と尋ねてみたところ、以下の回答が表示された。
申し訳ありませんが、私は直接ファイルを生成する機能を持っていません。ただし、以下の手順を試してみてください。
- **Pythonスクリプトを作成**: Pythonなどのプログラミング言語を使用して、ランダムなデータを生成するスクリプトを作成します。以下は、簡単な例です。
```python import pandas as pd import random # 300人分のデータを生成 data = [] for _ in range(300): name = "Character" + str(_ + 1) age = random.randint(18, 80) height = round(random.uniform(1.5, 2.0), 2) # メートル単位 weight = random.randint(50, 100) # キログラム単位 gender = random.choice(["男性", "女性", "それ以外", "不明"]) household = random.choice(["単身", "家族", "ルームメイト"]) friends = random.randint(0, 10) self_efficacy = random.randint(1, 10) big5_personality = random.choice(["外向性", "協調性", "神経症的傾向", "開放性", "誠実性"]) phq9 = random.randint(0, 27) phq15 = random.randint(0, 30) gad7 = random.randint(0, 21) social_support = random.randint(1, 5) social_capital = random.randint(1, 5) data.append([name, age, height, weight, gender, household, friends, self_efficacy, big5_personality, phq9, phq15, gad7, social_support, social_capital]) # データフレームを作成 df = pd.DataFrame(data, columns=["名前", "年齢", "身長", "体重", "性別", "同居世帯構成", "親しい友人の数", "自己効力感", "Big5性格特性", "PHQ-9", "PHQ-15", "GAD-7", "ソーシャルサポート", "ソーシャル・キャピタル"]) # CSVファイルに保存 df.to_csv("characters_data.csv", index=False) ```- **CSVファイルをダウンロード**: 上記のスクリプトを実行すると、`characters_data.csv`という名前のCSVファイルが生成されます。このファイルをダウンロードしてご利用ください。
- **データのカスタマイズ**: スクリプト内のパラメータを調整して、データをカスタマイズできます。例えば、年齢や身長の範囲、性格特性の選択肢などを変更してください。
お手伝いできることがあればお知らせください!
うーん、とくに指定していないのに成人限定にしているとか、ソーシャルサポートやソーシャル・キャピタルは特定の尺度を探さずに5段階と仮定してしまっているとか(たぶんそれらは具体的に指定しないとダメなんだろうが)、Big5性格特性のサブドメインを1つの変数の5つの水準のように誤解しているのはともかくとして(それも勿論間違いだが)、そもそも乱数で生成するのでは、たぶん変数は互いに独立になってしまうから、統計解析のデモ用のサンプルデータとしては適していないんだよなあ。実在する作品からという縛りを入れれば良かったのか? と思いついて、「乱数ではなく、実在する作品からデータを抽出してください」と入力したら、以下の回答になった。やっぱりそんなにうまい話は転がってないか。というか、もしかすると架空であってもキャラクター名って著作権関係の保護を受けてオープンデータには入れられないということなのか? だとすると、この話は最初から企画倒れということになってしまうが。
申し訳ありませんが、私は直接既存の作品からデータを抽出する機能を持っていません。しかし、既存の作品から登場人物の特性を抽出する研究があります。以下は、物語の登場人物に関するいくつかの研究の例です。
- **物語の役割と人数の特徴的パターンの抽出**:
- 斉藤勇璃と村井源による研究では、バトル系とスポーツ系の少年漫画の物語をシーン単位で分割し、登場人物の人数と役割に関するデータセットを構築しました。因子分析によって特定の物語構造に合致する特徴的なパターンが得られました.
- [詳細はこちら](https://www.jstage.jst.go.jp/article/pjsai/JSAI2022/0/JSAI2022_1H5OS17b04/_article/-char/ja)
- **登場人物の関係抽出**:
- 物語文から自動的に登場人物の関係を抽出する手法が提案されています。人物関係抽出のF値は0.340であり、ベースラインを上回っています.
- [詳細はこちら](https://www.anlp.jp/proceedings/annual_meeting/2015/pdf_dir/P3-30.pdf)
これらの研究から得られたデータを利用して、物語の登場人物の特性を抽出することができます。ただし、具体的な作品名やキャラクター名を含めることはできません。
- ソース: Bing との会話 2024/2/3
- (1) 物語の場面における登場人物の役割と人数の特徴的パターンの抽出. https://www.jstage.jst.go.jp/article/pjsai/JSAI2022/0/JSAI2022_1H5OS17b04/_article/-char/ja.
- (2) 物語テキストを対象とした登場人物の関係抽出 - ANLP. https://www.anlp.jp/proceedings/annual_meeting/2015/pdf_dir/P3-30.pdf.
- (3) 既存作品の分析結果に基づいた物語のキャラクターの背景史の .... https://www.jstage.jst.go.jp/article/pjsai/JSAI2023/0/JSAI2023_4T3GS1002/_article/-char/ja/.
- (4) 登場人物と場所の時系列可視化による 物語の出来事の想起支援 .... https://must.c.u-tokyo.ac.jp/sigam/sigam25/sigam2501.pdf.
- (5) undefined. https://doi.org/10.11517/pjsai.JSAI2022.0_1H5OS17b04.
コメント
コメントを投稿