Thomas Mannの「魔の山」のデータベース化と推定からの分析1

1 自作の入門について

 1989年から1990年代前半にかけて、ドイツのチュービンゲン大学に留学し、意味論を研究した。当時の私の研究テーマは、論理文法で有名なモンターギュ文法を使用したテキスト分析であった。モンターギュ文法は、認知科学の枠組みで言語理論の研究者が、生成文法と組み合わせて構文と意味を解析するために取り組んでいた。
 研究の題材は、トーマス・マンの「魔の山」であり、作品を読みながらドイツ語の構文と意味の解析について分析し、トーマス・マンのイロニーを説明した。しかし、ここで思うことがあった。トーマス・マンのイロニーが理解できるのは、ドイツ語の習得が進んだからであろうか。
 作家が作品を執筆しているときには、当然、何れかの脳の活動がある。トーマス・マンの場合もそれが何かであり、読んで思うイロニーもそこに近づいていくため、内容が理解できると思うようになった。読んで思うトーマス・マンのイロニーは、人工知能でいうファジィ推論に近いことを「魔の山」のいくつかの場面を例にして説明することができた。
 ドイツから帰国後、英日、独日の技術文の翻訳作業に10年余り従事した。文系から寄せて理系のアイデアを調節する機会を得るためである。こうして、2005年、「計算文学入門-Thomas Mannのイロニーはファジィ推論といえるのか?」という研究本を出版することができた。

花村嘉英(2017)「Thomas Mannの『魔の山』のデータベース化と推定からの分析」

シナジーのメタファー1

魯迅の「阿Q正伝」のバラツキについて7

3 まとめ
 
 リレーショナル・データベースの数字及びそこから求めた標準偏差により、「阿Q正伝」に関して部分的ではあるが、既存の分析例が説明できている。従って、この小論の分析方法、即ちデータベースを作成する文学研究は、データ間のリンクなど人の目には見えないものを提供してくれるため、これまでよりも客観性を上げることに成功している。

【参考文献】
花村嘉英 計算文学入門-Thomas Mannのイロニーはファジィ推論といえるのか? 新風舎 2005
花村嘉英 森鴎外の「山椒大夫」のDB化とその分析 中国日语教学研究会江苏分会 2015
花村嘉英 从认知语言学的角度浅析鲁迅作品-魯迅をシナジーで読む 華東理工大学出版社2015
花村嘉英 日语教育计划书-面向中国人的日语教学法与森鸥外小说的数据库应用 日本語教育のためのプログラム-中国語話者向けの教授法から森鴎外のデータベースまで 南京東南大学出版社 2017
花村嘉英 从认知语言学的角度浅析纳丁・戈迪默 ナディン・ゴーディマと意欲 華東理工大学出版社 2018

シナジーのメタファー2

魯迅の「阿Q正伝」のバラツキについて6

2.2 標準偏差による分析

 グループA、グループB、グループC、グループDそれぞれの標準偏差を計算する。その際、場面1、場面2、場面3の特性1と特性2のそれぞれの値は、質量ではなく指標であるため、特性の個数を数えて算術平均を出し、それぞれの値から算術平均を引き、その2乗の和集合の平均を求め、これを平方に開いていく。
 求められた各グループの標準偏差の数字は、何を表しているのだろうか。数字の意味が説明できれば、分析は、一応の成果が得られたことになる。 

◆グループA:五感(1視覚と2その他)
場面1(特性1、4個と特性2、1個)の標準偏差は、0.4となる。
場面2(特性1、4個と特性2、1個)の標準偏差は、0.4となる。
場面3(特性1、3個と特性2、2個)の標準偏差は、0.49となる。
【数字からわかること】
場面1、場面2、場面3を通して、視覚情報が多いため、「阿Q正伝」は、五感の中で視覚情報が鍵になる作品といえる。

◆グループB:ジェスチャー(1直示と2隠喩)
場面1(特性1、4個と特性2、1個)の標準偏差は、0.4となる。
場面2(特性1、4個と特性2、1個)の標準偏差は、0.4となる。
場面3(特性1、3個と特性2、2個)の標準偏差は、0.49となる。
【数字からわかること】
「阿Q正伝」は、当時の世相を反映させた作品のため、場面1、場面2、場面3を通して、隠喩が少ないことがわかる。

◆グループC:情報の認知プロセス(1旧情報と2新情報)
場面1(特性1、3個と特性2、2個)の標準偏差は、0.49となる。
場面2(特性1、2個と特性2、3個)の標準偏差は、0.49となる。
場面3(特性1、3個と特性2、2個)の標準偏差は、0.49となる。
【数字からわかること】
場面1、場面2、場面3を通して、新情報の2が多いため、ストーリーがテンポよく展開していることがわかる。

◆グループD:情報の認知プロセス(1問題解決と2未解決)
場面1(特性1、3個と特性2、2個)の標準偏差は、0.49となる。
場面2(特性1、0個と特性2、5個)の標準偏差は、0となる。
場面3(特性1、2個と特性2、3個)の標準偏差は、0.49となる。
【数字からわかること】
「阿Q正伝」は、当時の世相を反映させた作品のため、場面1、場面2、場面3を通して、問題未解決が多いことがわかる。

花村嘉英(2018)「魯迅の『阿Q正伝』から見えてくるバラツキについて」より

シナジーのメタファー2

魯迅の「阿Q正伝」のバラツキについて5

場面3 刑場へ向かう

 阿 Q 被抬上了一辆没有篷的车,几个短衣人物也和他同坐在一处.这车立刻走动了,前面是一班背着洋炮的兵们和团丁,两旁是许多张着嘴的看客,后面怎样,阿 Q 没有见.但他突然觉到了:这岂不是去杀头么? A1B1C1D2
 他意思之间,似乎觉得人生天地间,大约本来有时也未免要杀头的.他不知道这是在游街,在示众他省悟了,这是绕到法场去的路 A1B1C2D1
 却在路旁的人丛中发见了一个吴妈.很久违.阿 Q 忽然很羞愧自己没志气:竟没有唱几句戏.“好!!!”从人丛里,便发出豺狼的嗥叫一般的声音来. 阿 Q 于是再看那些喝采的人们. 四年之前,他曾在山脚下遇见一只饿狼. A1B1C1D2
 可是永远记得那狼眼睛.又凶又怯,闪闪的像两颗鬼火,似乎远远的来穿透了他的皮肉.而这回他又看见从来没有见过的更可怕的眼睛了,又钝又锋利不但已经咀嚼了他的话,并且还要咀嚼他皮肉以外的东西,永是不近不远的跟他走. A2B2C2D2
 这些眼睛们似乎连成一气,已经在那里咬他的灵魂他早就两眼发黑,耳杂里嗡的一声,觉得全身仿佛微尘似的迸散了. A2B2C1D1

花村嘉英(2018)「魯迅の『阿Q正伝』から見えてくるバラツキについて」より

シナジーのメタファー2

魯迅の「阿Q正伝」のバラツキについて4

場面2 革命許さず

 革命党虽然进了城只有一件可怕的事是动手剪辫子几天之后,将辫子盘在顶上的逐渐增加起来了,早经说过,最先自然是茂才公,其次便是赵司晨和赵白眼,后来是阿 Q 赵司晨脑后空荡荡的走来,看见的人大嚷说,“嚄,革命党来了!” 阿 Q 听到了很羡慕. A2B2C1D2
 他在街上走,人也看他,然而不说什么话,阿Q当初很不快,后来便很不平. 小D也将辫子盘在头顶上了,而且也居然用一支竹筷.阿Q万料不到他也敢这样做. A1B1C2D2
 进城去的只有一个假洋鬼子.赵秀才托假洋鬼子带上城,而且托他给自己绍介绍介,去进自由党.假洋鬼子回来时,向秀才讨还了四块洋钱,秀才便有一块银桃子挂在大襟上了;赵太爷因此也骤然大阔见了阿Q,也就很有些不放在眼里了. 阿Q正在不平,又时时刻刻感着冷落. A1B1C1D2
 要革命第一着仍然要和革命党去结识他除却赶紧去和假洋鬼子商量之外,再没有别的道路了.他一到里面,很吃了惊只见假洋鬼子正站在院子的中央,一身乌黑的大约是洋衣已经留到一尺多长的辫子都拆开了披在肩背上赵白眼和三个闲人,正在必恭必敬的听说活. A1B1C2D2
 洋先生不准他革命他所有的抱负,志向,希望,前程,全被一笔勾销了他似乎从来没有经验过这样的无聊. 他忽而听得一种异样的声音一个人从对面逃来了看那人便是小D.“赵赵家遭抢了!”阿Q 的心怦怦的跳了. A1B1C2D2

花村嘉英(2018)「魯迅の『阿Q正伝』から見えてくるバラツキについて」より

シナジーのメタファー2

魯迅の「阿Q正伝」のバラツキについて3

2 場面のイメージを分析する

2.1 データの抽出

 作成したデータベースから特性が2つあるカラムを抽出し、標準偏差によるバラツキを調べてみる。例えば、A:五感(1視覚と2それ以外)、B:ジェスチャー(1直示と2隠喩)、C:情報の認知プロセス(1旧情報と2新情報)、D:情報の認知プロセス(1問題解決と2未解決)というように文系と理系のカラムをそれぞれ2つずつ抽出する。

場面1 恋愛の悲劇-永遠に得意
 他是永远得意的􀆻􀆻“断子绝孙的阿 Q !” 他想:不错,应该一个女人 阿 Q 本来也是正人但他对于“男女之大防”却历来非常严谁知道他将到“而立”之年,竟被小尼姑害得飘飘然了. A2B2C1D2
 吴妈,是赵大爷家里唯一的女仆,洗完了碗碟,也就在长凳上坐下了,而且和阿 Q 谈闲天: 阿 Q 放下烟管,站了起来.
“我 和 你 困 觉,我 和 你 困觉!”阿 Q 忽然抢上去,对伊跪下了. A1B1C2D2
 那秀才便拿了一支大竹杠站在他面前.大竹杠又向他劈下来了.阿 Q 两手去抱头,拍的正打在指节上,这可很有一些痛.他那“女”的思想却也没有了. A1B1C2D1
 吴妈只是哭赵大爷向他奔来,而且手里捏着一支大竹杠.他看见这一支大竹杠,便猛然间悟到自己曾经被打,和这一场热闹似乎有点相关.他翻身便走. A1B1C2D1
 然而地保进来了并且订定了 五条件. 阿Q自然都答应了. A1B1C2D1 

花村嘉英(2018)「魯迅の『阿Q正伝』から見えてくるバラツキについて」より

シナジーのメタファー2

魯迅の「阿Q正伝」のバラツキについて2

1.2 標準偏差

 標準偏差は、グループの全ての値によってバラツキを決めていく。グループの個々の値から算術平均がどれだけ離れているのかによって、バラツキの大きさが決まる。
 グループd(1、1、4、7、7)の算術平均は4である。それぞれの値から算術平均を引くと、1-4=-3、1-4=-3、4-4=0、7-4=3、7-4=3となる。この算術平均から離れている大きさを平均してやると、バラツキの目安が求められる。しかし、-3、-3、0、3、3を全部足すと0になるため、さらに工夫が必要になる。
 例えば、絶対値をとる方法とか値を2乗してマイナスの記号を取る方法がある。2乗した場合、9、9、0、9、9となり、平均値を求めると、5で割って7.2となる。但し、元の単位がcmのときに、2乗すればcm2となるため、7.2を開いて元に戻すと、√7.2 cm2≒2.68 cmというバラツキの大きさになる。
 
(1) 標準偏差の公式
σ=√Σ (Xi-X)2/n

 次にグループe(1、4、4、4、7)について見てみよう。算術平均は4である。それぞれの値から算術平均を引くと、1-4=-3、4-4=0、4-4=0、4-4=0、7-4=3となる。この算術平均から離れている大きさを平均すると、バラツキの目安が求められる。しかし、-3、0、0、0、3を全部足すと0になるため、それぞれを2乗して、9、0、0、0、9として平均値を求め、5で割って3. 6を求める。
 但し、元の単位がcmのときに2乗すれば、cm2となるため、3. 6を開いて元に戻すと、√3. 6 cm2≒1.89 cmというバラツキの大きさになる。従って、グループdの方がグループeよりもバラつきが大きいことになる。
以下では、標準偏差(1)の公式を使用して、作成した魯迅の「阿Q正伝」のデータに関するバラツキから見えてくる特徴を考察していく。 

花村嘉英(2018)「魯迅の『阿Q正伝』から見えてくるバラツキについて」より

シナジーのメタファー2

魯迅の「阿Q正伝」のバラツキについて1

1 簡単な統計処理

1.1 データのバラツキ

 グループa(5、5、5、5、5)とグループb(3、4、5、6、7)とグループc(1、3、5、7、9)は、算術平均がいずれも5であり、また中央値(メジアン)も同様に5である。算術平均やメジアンを代表値としている限り、この3つのグループは差がないことになる。しかし、バラツキを考えると明らかに違いがある。グループaは、全てが5のため全くバラツキがない。グループbは、5が中心にあり3から7までばらついている。グループcは、1から9までの広範囲に渡ってバラツキが見られる。グループbのバラツキは、グループcのバラツキよりも小さい。  
 次に、グループd(1、1、4、7、7)とグループe(1、4、4、4、7)だと、どちらのバラツキが大きいことになるのだろうか。グループdは、中心の4から3も離れた所に4つの値がある。グループeは、中心に3つの値があって、そこから3離れたところに値が2つある。 
 バラツキの大きさを定義する方法で最も有名なのが、レンジと標準偏差である。レンジはグループの最大値から最小値を引くことにより求めることができる。グループdは、7-1=6で、グループeも7-1=6となる。レンジだけでバラツキを定義すれば、グループdとグループeは同じことになるが、グループ内の最大値と最小値だけを問題にするため、他の値が疎かになっている。そこでもう一つのバラツキに関する定義、標準偏差について見てみよう。

花村嘉英(2018)「魯迅の『阿Q正伝』から見えてくるバラツキについて」より

シナジーのメタファー2

魯迅の「阿Q正伝」の相関関係について5

3 相関係数を言葉で表す

-0. 7≦r≦-1.0 強い負の相関がある
-0.4≦r≦-0.7 やや負の相関がある
0≦r≦-0.4 ほとんど負の相関がない
0≦r≦0.2 ほとんど正の相関がない
0.2≦r≦0.4 やや正の相関がある
0.4≦r≦0.7 かなり正の相関がある
0.7≦r≦1 強い正の相関がある

【参考文献】
花村嘉英 計算文学入門-Thomas Mannのイロニーはファジィ推論といえるのか? 新風舎 2005
花村嘉英 森鴎外の「山椒大夫」のDB化とその分析 中国日语教学研究会江苏分会 2015
花村嘉英 从认知语言学的角度浅析鲁迅作品-魯迅をシナジーで読む 華東理工大学出版社 2015
花村嘉英 日语教育计划书-面向中国人的日语教学法与森鸥外小说的数据库应用 日本語教育のためのプログラム-中国語話者向けの教授法から森鴎外のデータベースまで 南京東南大学出版社 2017
花村嘉英 从认知语言学的角度浅析纳丁・戈迪默 ナディン・ゴーディマと意欲 華東理工大学出版社 2018
前野昌宏 回帰分析超入門 技術評論社 2012

シナジーのメタファー2

魯迅の「阿Q正伝」の相関関係について4

計算表
非線形性 3 3 6(合計)
偏差 2 2 4(合計)
偏差2 4 4 8(合計)
初期値敏感性 4 2 6(合計)
偏差 3 1 4(合計)
偏差2 9 1 10(合計)
AB偏差の積 6 2 8(合計)

◆相関係数は、次の公式で求めることができる。

相関係数=[(A-Aの平均値)x(B-Bの平均値)]の和/
√(A-Aの平均値)2の和x(B-Bの平均値)2の和

上記計算表を代入すると、

相関係数 = 8/√8 x 10 = 8/√80 = 8/4√5 = 2/√5 = 0.89

従って、強い正の相関があるといえる。

花村嘉英(2018)「魯迅の『阿Q正伝』から見えてくる相関関係について」より

シナジーのメタファー2