paint-brush
アフリカの言語と言語学における AI の展望@kingabimbola
1,175 測定値
1,175 測定値

アフリカの言語と言語学における AI の展望

M. Abimbola Mosobalaje7m2023/05/20
Read on Terminal Reader

長すぎる; 読むには

NLP はアフリカ全土で多くの事例で使用されており、その中にはロボット工学や会話型 AI が含まれています。 現在、アフリカは、ストリーム内で処理を実行するようにトレーニングできる、より高度なシステム向けに、複数のアフリカ言語を含む大規模な言語モデルを開発しています。その後、複雑なシステムが 1 つのアクション (モデリング) に絞り込まれます。
featured image - アフリカの言語と言語学における AI の展望
M. Abimbola Mosobalaje HackerNoon profile picture
0-item
1-item

数年前、私は Google アシスタントに簡単な質問をしましたが (内容は思い出せません)、関係のない答えが返されました。もう一度尋ねると、違う答えが返ってきました。質問を入力する必要がありました。



その時点で、私は音声認識ソフトウェアはアフリカ人向けに作られたものではないと結論付けました。

私の話す英語とアクセントは個人的な成長と露出のおかげで改善されましたが、多くの音声認識アプリやソフトウェアがアフリカ話者により適応しつつあることもわかります(アクセントの点で)。しかし、実際のところ、アフリカ人向けの音声認識の実現にはまだ長い時間がかかります。


ネイティブスピーカーが 1,000 万人以上いるアフリカの主要言語を使用できるアプリがなぜそれほど多くないのか、今でも不思議に思っています。そこで私は、アフリカの文脈と言語における人工知能自然言語処理の現状について、現場の言語学者および学術研究者と話すことにしました。


Q: こんにちは、あなた自身について教えてください。言語学者および NLP AI 愛好家として、何に興味がありますか?

こんにちは、私はオランレワジュ・サミュエルです。


私は計算音韻論、データセット構築、アノテーションとキュレーション、自然言語処理、および現場言語学に興味があります。


オランレワジュ・サミュエル、ナイジェリアの音韻学者、計算言語学者


私の主な指導者はアキンボ・サミュエル博士。最近、私はタンパク質言語学、タンパク質のフォールディング、および数学言語学に大きな喜びを感じています。私が尊敬する学者の名前は次のとおりですジェフリー・ハインツ。彼の作品は私の研究に影響を与え、私の専門知識をディープラーニング NLP とロボット工学に活用しました。私の現在の研究分野は、タンパク質のフォールディングと、量子物理学、量子化学、言語学の間の相互関係です。


私はまだ自分の研究目標を厳密に定めているわけではありませんが、今のところは専門知識を磨き、自分の可能性を探ることに集中しています。資格そのもののためではなく、自己啓発のためです。したがって、私はここでのプログラムを完了し、他のことに移りたいとしながら、自分自身を成長させようと努めています。


Q: この分野におけるあなたの著書にはどのようなものがありますか?

私はさまざまな偉大な人物と協力して、さまざまな出版物に参加してきました。私の最近の言語学の論文の 1 つは、「ヨルバ語の口承詩の 2 つのジャンルにおける音声表現の音響的研究」主に、NLP に関する私の特集出版物のほとんどは、Masakhane NLP グループによるものです。


これも:


出典: オモタヨ・タジュディーン (Pixabay)

Q: ルワンダのキガリでの現在の仕事は何ですか?

私は「言語学者のための自然言語処理」というコースを教えています。基本的に、私はルワンダのキガリでアフリカの文脈における言語的自然言語プロセスを教えています。


私は、大規模言語モデル (LLM) の構築など、さまざまな NLP タスク用の多言語データセットの構築、アノテーション、キュレーション、分析、公開のニュアンスを提供し、デモンストレーションする任務を負っています。大規模な言語モデルとは、複数の言語システムを単一のストリーム内で機能させることを意味します。私たちは、パターンまたはテンプレートを使用して AI システムをトレーニングするラテライゼーション (水平化) によってこれを達成しようとしています。このパターンは、他のアプリケーションの基礎となります。


会話型 AI を超えて、私たちは生成型 AI の分野で何か有意義なことを行うことを検討しています。これは依然として、データを並べ替えて確率などの数学的計算によって結果を生成するモデルの機能の側面化の一部です。


Q: アフリカにおける AI/NLP の現状と応用についてお話しいただけますか?

NLP はアフリカ全土で多くの事例で使用されており、その中にはロボット工学や会話型 AI が含まれています。会話型 AI の典型的な例は、ラゴスのAlaye です。これは、自然観光客 (他州からのナイジェリア人) が大都市であり州であるラゴス内で道を見つけ、レストラン、クラブ、ショップなどの場所を特定するのを支援します。人気のナイジェリアのピジン (ナイジャ ピジン) を使用した交通状況も含まれます。


私たちは、タスクを実行するためにトレーニングできる AI モデルを開発しています。複雑なシステムやプロセスを単純なコマンド文字列 (モデリング) に絞り込みます。これが、現時点でのアフリカにおけるロボット工学における NLP の実用化です。


現在、言語学における AI の応用は主に自動化ですが、ロボットやチャットボットなど、さまざまな AI アプリケーションに組み込まれた言語モデルもあります。


本当に素晴らしいことをやっている人たちがいます。マスクハーンムバザ-NLP NLPガーナ(もっと)、 とケニアNLP


アフリカ言語における AI アプリケーションの課題は何ですか

AI 産業で世界的な関連性を見つける上でアフリカの状況に対する大きな課題は、言語リソース (データ) の制限です。アフリカは多言語なので、限られたデータセット世界中で進行中のさまざまなAIプロジェクトに必要な膨大なデータを提供します。たとえば、アフリカにある最大の言語データセットは約 2000 時間ですが、認識されたデータセットこれは、何十億時間もの音声データがある英語と比較すると、非常にばかげています。


AI に何かが起こるとすれば、それは高リソース言語にも起こるでしょう。たとえそれがアフリカの言語で起こったとしても、私たちはそれらに電力を供給するシステムを持っていません。したがって、対応するものが十分ではないため遅れており、この問題は文書化の不足がほぼ生涯にわたる問題となっています。


たとえば、ナイジェリアには 200 を超える部族がありますが、最も人気のある言語は 3 つだけです。ヨルバ、イボ、ハウサとは異なり、小規模な部族や言語にはデータがほとんどありません (リソース データが少ない)。それが私たちがやろうとしていることですムバザ-NLP 、低リソース言語からデータを収集し、それらを音声合成 (STT) や音声合成 (TTS) などのプログラム可能な音声認識に使用します。


AI や NLP の技術者は、AI を信じていないか、ROI を探索するのに十分なデータがないと考えているため、投資を行っていません。したがって、私たちは現在の地下工事がブレークスルーとなることを期待しています。


さらに、最も人気のある検索エンジンはアジアと西洋(特にアメリカ)であるため、アフリカは言語 AI と NLP の世界市場で周縁化されています。また、ここでの私たちの作品の中には、スポンサーシップの関係で、アフリカ人としての功績を認めることができないものもあります。


Q: アフリカの NLP の適用が最も進んでいるアフリカの国はどこですか?

最も大きな影響を与えたアフリカ諸国には、南アフリカ、ケニア、ルワンダが含まれます。彼らはクレイジーです!ナイジェリアも努力しているが、この宇宙を探索すべき人々のほとんどは開発を求めているのではなく、学歴の満足を求めている。私たちは言語を大切にしていますが、その言語を使用してデータセットを構築しているわけではありません。言語を保存し保護するために文書化に投資すべきであるにもかかわらず、私たちはむしろ言語を遺産として話すか私有化したいと考えます。


Q: では、ビジネス面で、アフリカ言語の NLP の商業化において、アフリカはどのような立場にあるのでしょうか?

正直に言うと、データセットを販売するビジネス以外にはあまり多くはありません。それでも、プロジェクトに資金をつぎ込む人たちは多額の寄付をしますが、現場のエージェントに届く金額は、当初投入された金額と比較すると非常にわずかです。


Q:それでは倫理の問題に行き着きます。人々のデータを収集して販売することに倫理的価値はありますか?そして、これらのプロジェクトに多額の資金が提供され、これらの言語の一次ソースが非常に最小限の金額 (場合によってはゼロ) しか得られないのは公平でしょうか?これらのデータやソースに対する保護はありますか?

データ収集を禁止する法律はありません。最も重要なことは、データがネイティブ スピーカーから積極的に収集され、その時間に対して報酬が支払われることです。ただし、すべての活動はアフリカ連合の方針に沿ったものでなければなりません。 オーストラリアのデータプライバシー法。また、データ収集を伴う言語学の研究には、通常、母語話者または回答者の同意が必要です。



2 番目の質問ですが、これらの分野に携わる人々に最終的に届く金額については、誰にもどうすることもできません。最も重要なことは、全員が喜んでプロジェクトにコミットすることです。人々は記録されて報酬が与えられると言われており、金額さえよければ「不公平」はない。


Q: 現状で NLP と語学トレーニングに参加したい人がいる場合、何を勧めますか?

広い分野です。多くはすでに基礎があり、構築段階にありますが、まだ基礎の段階にある部分もたくさんあります。私が皆さんにお勧めしたいのは、言語データの収集と分析に参加することです。データと同じくらい、データセットのデータ分析も必要です。


したがって、私は熱心なデータ駆動型グループに参加するかボランティア活動をすることをお勧めします。データの収集と分析、用語の学習などにボランティアとして参加します。



最終的な考え

Pixabay: ケレピクス/1112


音声認識ソフトウェアでは、さまざまな AI や NLP のコマンドやプロンプトを使用して、アフリカが不適切に表現され続けています。アフリカ人がデータセットの構築に着手し、自分たちの言語を発信し、文書への投資を続けると、物語は変わってくるでしょう。それでも、AI および NLP アプリケーションに関してアフリカから生み出されたいくつかの作品には感銘を受けるでしょう。


私の調査と手がかりを追って、ロボットがアフリカの現地言語で促されているのを見てきました。アフリカのさまざまな状況(観光、探検)に合わせた現地のチャットボットが増えており、一部の言語は家電製品の IoT に使用されています。しかし、現在世界で起こっている大規模な AI と NLP 革命を考慮すると、私たちはもっと取り組むべきだと信じています。今のところ、他にもありますデータセットためにテキストの分類音声データの場合よりも優れています。それでも、音声データセットとテキスト データセットの両方がさらに必要です。データは新しい通貨です。私は正直に言って、外国人が間違った仕事をする前に、アフリカ人がこれを行うことを望みます(ああ、そうそう、以前出版された本で報告されている誤った歴史データを読んだことがあります。不適切な文書化が私たちに与える影響はそれです)。