Livre para Viver

日本語とポルトガル語とその周辺

(必要に駆られて)Rの勉強を始めました

いままで統計といえば、学部の時に勉強した統計学の授業程度の知識しかありませんでした。標準偏差正規分布、t検定程度しか勉強しなかったように記憶しています。

院生の時には質的研究が中心だったため、統計を用いる研究は、他の院生の研究を聞いたり、論文で見たりする程度でした。

それがひょんなことから、医療系の大学に就職し、医師国家試験合格を目指す留学生の日本語教育に従事することになり、語彙教材などの作成に、医師国家試験の分析をすることが急務になりました。

専門用語を抽出するために用いられている統計的手法について述べられている論文を読みあさり、対数尤度比を用いて医師国家試験に特徴的な語を抽出する必要性が出てきました。

数回しか使ったことのないMeCab形態素解析し、大規模均衡コーパスであるBCCWJと対照させ、形態素解析情報をSPSSで読み込み頻度情報を出し、エクセルで対数尤度比を出すという煩雑な手順で行って、一応、語彙リストはできました。*1

しかし、SPSSを用いた場合、処理に大きな時間がかかり、また、品詞や読みが異なる同表記の語が同じ語としてカウントされるなど、頻度の集計をする場合には、大きな障害となります。(今回はたまたま問題が起きなかっただけだと考えるのが無難ですし、手作業の修正が多くなればなるほどミスも多くなると考えられます。)

また、SPSSは、記述統計が一発でできるのは便利ですが、SPSSは高価なソフトであり、所属が変われば使えなくなります。*2

その他、エクセルで対数尤度比を求める場合、煩雑な計算式を入力しなければならず、これもミスを生み出しやすくなります。

これらの問題を解決するためには、Rの使用が必然となってきたのです。

語彙調査をする際のRのメリットは以下に集約できるように思います。

  1. SPSSを用いずに頻度情報を出したり、データを整理したり、統計的な処理ができる。
  2. エクセルでは表示しきれない行数の表データの編集が容易である。
  3. パッケージ(RMeCab)を導入することで、形態素解析から統計処理を一貫して行うことができ、ミスが少なくてすむ。
  4. 無料である。

というところでしょうか。私自身もまだ勉強し始めたところで、こねくりまわして、使いこなせるようになりたいと思っています。

Rの使用を考える前に、言語統計やコーパス言語学に関する本も何冊か読んでみたのですが、私たちの目指していることはなかなか実現できそうになく、ついにRに手を出すことになりました。

Rの勉強には、以下の本を読んでいます。

Rによるテキストマイニング入門

便利なパッケージがいろいろと紹介されています。またRMeCabについても詳しく使い方が出ていて、実例とともにスクリプトが示されているので、分かりやすいです。

これらの本を参考にしながら少しずつ慣れていきたいなと思います。

Computers

*1:この成果は、2017年10月に日本語/日本語教育研究会で発表したほか、山元ほか (印刷中) 「医師国家試験の名詞語彙の対数尤度比に基づく分析と教材開発の可能性」『日本語/日本語教育研究』第9号, ココ出版. にまとめています。

*2:本学は医療系だけあって、学内LANに接続すればSPSSが使えます。

ポルトガル語専攻を卒業し日本語教育に携わるようになるまで

 私は、学部はポルトガル語を専攻していました。3年次にはブラジルに留学までしたのにも関わらず、今ではポルトガル語との関わりはほとんどなく、国内の大学で日本語教育に従事しています。

なぜ、日本語教育に従事するようになったのか、ポルトガル語と離れていったのはなぜか、いわゆるマイナー外国語*1を専攻している方の将来にも役立つエントリーになればと思います。

*1:国内にはポルトガル語話者が18万人以上いるので、マイナーな外国語であるかというとはなはだ疑問ですが、「ポルトガル語専攻」や「ポルトガル語学科」を設置している大学はそれほどありません。そのためマイナー外国語としました。

続きを読む

今でも手元に置いて参照することのある音声学の本

日本語教育という分野に関わるようになるとは思っていなかった学部生のころ。ポルトガル語を学んでおり、言語学には興味を持っていました。

音韻論や音声学にも興味を当然持っていて、ブラジル留学中には音声学を勉強していました。

ポルトガル語で書かれた音韻論と音声学のテキストを留学中に購入しましたが、母語でないこともあり、理解を助けるためにと読み始めたのが、以下の本。

日本語教育をめざす人のための基礎から学ぶ音声学

日本語教育をめざす人のための基礎から学ぶ音声学

 

 これを購入したのがいつだったかは覚えていないのですが、買った当時、日本語教育に興味はあっても、日本語教育という分野に進もうとは思っていませんでした。ただ、「日本語教育能力検定試験」は受けようと思っていたので、言語学とりわけ難しいとされる音声学の勉強をしなければならない中、役にたちそうということで、上記の本を買ったのだと思います。おそらく。

話は変わりますが、現任校は医療に従事する予定の学生がほとんどです。医療従事者にとって、「発音」というのは、おそらく重要です。医療専門職に従事する学生は、病院に勤める限り、様々なバックグラウンドをもつ、ほとんどすべての年代の患者さんと関わっていくことになります。同年代の学生や教員は、留学生の発音に慣れていたり、理解しようという心構えができていたりしますが、患者さんはそうではありません。

ということで、現任校では、できるだけ分かりやすい発音で話せるようにしたいと思っています。

言語聴覚士を目指すベトナムからの留学生が、保育園や老人ホームに実習に行ってきて、理解してもらえなかったと嘆いていました。言語聴覚士であれば、なおさらのこと、発音には気を付けてほしいと思っています。

というわけで、現任校では、以下のテキストを使いながら、発音の練習をしています。

初級文型でできる にほんご発音アクティビティ(CD付)

初級文型でできる にほんご発音アクティビティ(CD付)

 

 ただ、このテキストは、自然なイントネーションで話せるようになるとの趣旨で作られているため、それぞれの音については、個別に指導が必要です。

そんなとき、リファレンスとして役にたっているのが、先述の『日本語教育をめざす人のための基礎から学ぶ音声学』です。

この本の良いところは、音声学についてあまり知識のない日本語教師を目指す人向けに書かれているところです。

特に参考になるのは、「第1章 単音」で、注意すべき音について、分かりやすく説明されています。日本語では一つの音素としてみなされる音が複数ある場合も、一般にどのように調音されるのかが説明されており、学生に対しての説明を考える際にも役立ちます。

特に、上述の学生は、言語聴覚士を目指しており、学部の授業で音声学を学んでいることから、調音がどのように行われるのかの基礎知識があり、調音点を説明すると、各段に良くなりました。(たとえば「だ」の音が、そり舌音に聞こえるため、調音点を説明すると自然な「だ」になりました。)

授業後に、この本を参照し、説明が間違っていなかったことが確認できてほっと一安心です(笑)。

音声というのは、日本語教育では無視されがちですが、知識として、持っていて損はありません。上記の本を参照しながら、効果的に音声教育ができたらと思っています。