ラベル 機械翻訳 の投稿を表示しています。 すべての投稿を表示
ラベル 機械翻訳 の投稿を表示しています。 すべての投稿を表示

2016/12/27

機械翻訳が向かう将来の方向

ちょっとお付き合いのある同業者さんが機械翻訳を組み合わせたサービスを開始された。

これまで機械翻訳は翻訳業界だけが利用してきた技術かもしれないが、2017年以降は、他業種が機械翻訳を組み合わせたサービスを続々と発表すると思われる(機械翻訳がバックグラウンドで動作しているかは分からないようなサービスも含めて)。

機械翻訳を組み合わせたサービスを中心にしたベンチャー企業なんかが起業されるのではないかな。

創業補助金の経費項目に「機械翻訳利用代金」が加えられる日も近いかもしれない(?)

これまで、同業者間では、機械翻訳を使っているか使っていないかが話題だった。これからは、機械翻訳をどのように使うかが話題になると思う。

勿論、手の内はお互い見せないと思うが・・・。

2016/12/23

なぜHybrid Translation の販売開始を決断したのか

なぜHybrid Translation(ハイブリッド型の翻訳*)の販売開始を決断したのかについて書きます。

理由は、3つあります。

1つ目は、機械翻訳の精度が高まったからです。以前から注目していましたが、精度が低すぎて商品にできなませんでした。しかし今年後半に機械翻訳の精度が飛躍的に高まりました。それで商品化しようと思ったのです。

2つ目は、特許翻訳市場における値崩れに伴ってこの市場から撤退せざるを得なくなったことです。特に、大阪の特許翻訳市場では、大手翻訳会社が低価格な翻訳を提供したため、値崩れが発生しています。もうこの市場は衰退期に入ったと判断しました(東京も同じかもしれません)。昨年から特許翻訳市場から撤退を真剣に考え出しました。そこでハイブリッド型翻訳市場という新しい市場を自分たちで作ってそこを土俵にしようと考えました。

3つ目は、資金調達です。翻訳は20年後消滅する仕事だと言われています。将来性のない事業に銀行もお金を貸しませんし、投資家も現れません。最近のニュースで確認する限り、人間翻訳の会社には投資家は興味を示していないことが分かります。

*ハイブリッド型翻訳とは、自動車で言えば、ガソリンエンジンと電気モータとを組み合わせたハイブリッドカーと似ています。機械翻訳+トランスレーション・メモリ+ポストエディットの3つを組み合わせた次世代の翻訳です。

*現在、2017年の正式発売前にトライアルのご依頼をお受けしています。正式依頼前に内容をお確かめしただけます。

2016/12/04

TEPからMPPへ

翻訳会社として提供するサービスは、「TEP」である。つまり、

T:Translation/翻訳
E:Edit/校正
P:Proofread/プルーフリード

少なくとも2名以上のオペレーターが1翻訳案件に関与する。翻訳会社の翻訳サービスの標準だと思う。

2017年以降は、「MPP」も標準になるだろう。つまり、

M:Machine Translation/機械翻訳
P:Post-edit/ポストエディット
P:Proofread/プルーフリード

時代は僕達が眠っている間も進んでいる(My Little Loverもそう歌っていた)。時代に遅れないようについて行きたい。

僕は機械翻訳には魅力を感じていた。ここ3年間、様々な機械翻訳のセミナーやコンファレンスに出席した。正直、仕事には使えないと感じていた。しかし最近の進歩を見る限り、サービスとして提供できるレベルに達しつつあるのではないだろうか。

我々も、翻訳者及び校正者に加えて、ポストエディターの所謂ジェネラリストの育成にも力を入れたい。

2016/12/01

2017年の機械翻訳の発展


僕の理解が正しければだが・・・。今年機械翻訳のセミナーに参加した。そのとき、その機械翻訳の団体のトップぐらいの方と交流会でお話をする機会があった。そのとき「コーパスの収集はネットで簡単にできるが、AIに活用できるデータの収集ができない(のでAIを機械翻訳に活用できるわけではない)」と言っていたと思う。僕は、人間翻訳+翻訳テクノロジー+人口知能のハイブリッド翻訳に興味があったので、正直言って、そのご指摘にはガッカリした。

日本の機械翻訳業界はグーグルさんの機械翻訳を予想していなかったのか?日本の機械翻訳の研究をなさっているトップクラスの研究者も予想していなかったのか?

グーグルさんの本業は、機械翻訳開発ではない。本業は、サーチエンジンのサービス提供だ(マイクロソフトさんは、OSのライセンス会社だ)。

もし同業者さんが我々よりも品質の良い翻訳を低コストで生産できるサービスを提供したとしても脅威には感じない。我々は反省して、更に低価格の翻訳が提供できるように努力するだろう。ただしもし他業者さん(例えば、携帯電話会社さんとか極端に言えば、コンビニ)が我々と同程度の翻訳を低価格で提供できるようになったら僕は廃業を考える。もう勝負にならないと負けを認める。

他業種であるグーグルさんのような会社が機械翻訳の精度を飛躍的に向上させた。機械翻訳開発会社はどのような戦略でグーグルさん等の企業と戦うのだろうか。

2017年も機械翻訳から目を離せない。

我々は、機械翻訳会社ではない。機械翻訳のユーザだ。より良い機械翻訳を求めている。より良いサービスを選択し購入する。

2017年は、付加価値として機械翻訳を導入したい。

2016/11/19

Google Translate の精度が飛躍的に高まる

すでに報道されているようにGoogle Translate の精度が飛躍的に高まりました。


時代は変わったのだという強烈なメッセージになったと思う。

2017年は、明治150年!

我々も大きく変化しようと考えています。

では!

2015/12/29

実は、機械翻訳は誤訳をしていない!?

実は、機械翻訳は誤訳はしていないのです、と言われるとどう思われるでしょうか?「いや、機械翻訳は誤訳だらけだ。実際に誤訳だらけのHPを知っている!」とおっしゃるでしょう。しかし機械翻訳は誤訳をしていないのです。

機械翻訳は、正しく翻訳しています。はい。間違いなく正しく翻訳しています。僕が保証します(それほど説得力ないですが)。正しく翻訳しています。

機械翻訳の中では、あるアルゴリズムに従って、変数(単語や語句)が入力されて、翻訳語が算出されます。

算出された訳語が人間にとれば意味を成さなかっただけです。

機械翻訳としては、誤訳をしているわけではないのです。機械翻訳にとれば、正しい答を返しています。禅問答のような流れになってきたかもしれませんが、これが事実です。

正しく誤訳したという方が正しいかもしれません。

機械翻訳は、常に正確ですので、人間のように「compliment とcomplement」の意味を取り違えたりは決してしません。誤訳するのは、人間の方です。このような意味の取り違いをする人間の脳は、演算装置として、機械翻訳にはとうてい勝てません。

2016年もいい年だったらいいな。
機械翻訳と仲良く付き合っていきたいです。

【2016年度の営業について】
1月4日(月)から通常営業をいたします。どうぞよろしくお願いします。

2015/11/28

翻訳が5年で消滅してもよいように

本当に翻訳は5年で消滅するだろうか?もうちょっと長生きするような気もしています。実は。しかし今から行動を起こす必要があるのは、僕が経営者だからです。スタッフもいるし、ある日突然仕事がなくなったら彼らも困るし。

僕は昭和生まれなので、半生記ほど生きています。これまで自分の人生で大きな社会的な変化を経験しています。そのとき、多くの会社が倒産しました。

1つ目は、1ドルが360円でなくなったときだ。今の若い人は、1ドル=360円の時代なんて想像できないだろうが。このとき、輸出関係の中小企業の多くが倒産した。確か1970年ぐらいではないかな。僕が小学生の頃の話だ。王選手がまだ現役でホームランをかっ飛ばしていた時代です。確かFAXなんてなくてテレックスの時代です。

2つ目は、1990年頃にバブル崩壊だ。この時、僕はやっと社会人になって、ホテルに就職した。就職したときは景気はよかったです。日本の会社が世界の名だたるホテルを買収していったのもこのときです。でもバブルが崩壊したとき、日本の会社は買収したホテルを手放さざるを得なくなりました。それまで湯水のようにお金をホテルに落としていた多くの中小企業のお客さんがぷつりとホテルを利用しなくなった(倒産した会社も多かっただろう)。

3つ目は、リーマンショックだ。この時、僕は、翻訳者として独立していた。知り合った翻訳者さんの中に、リーマン・ブラザーズに勤めていたが、会社が倒産したので、翻訳者になったという人がいた。この時は、翻訳業界というよりも、僕の知っている人が随分困ったという話をしていた。金融業界はそざ大変だったと思います。

共通しているのは、僕が経験した3つの社会的な変化は、ある日突然やってきていることだ。さぁピンチになりますよ。準備はいいですか、という警告は発してくれない。

次は、4つ目だ。きっと2020年頃だと思う。機械翻訳及び人工知能が翻訳業界を征服するときだ。

僕は、4つ目がある日突然やってきても乗り切るつもりでいます。

僕も経営者ですから行動はすでに起こしています。

こいつは機械だけど、大歓迎。だけど人間の仕事を奪っていることは間違いない。

2015/11/26

翻訳は10年以内に消滅する職業か?

様々なメディアで、翻訳は10年後に消滅する職業だと言われています(20年後だったかもしれません)。私は、10年ではなく、5年後だと思っています。消滅するというか、今の形を維持することはないと思います。

私は、10年後も20年後も翻訳は消滅しないと思っていた方です。最近、機械翻訳と人工知能の驚異的な発達を知って、考えを変えました。現在の形の翻訳は、5年後には消滅すると思います。今までは、技術の進歩に目を背けていました。現在、利用できる様々のテクノロジーは、ほんの一部です。研究室ではもっと進歩したテクノロジーがあふれています。

ただし、日本語やグルジア語などの特殊言語を介した翻訳は、5年以上続くと思います。文法的に似通った特定のヨーロッパ言語の翻訳から段階的に消滅が始まると思います。ですので、機械翻訳や人工知能がいくら発達しても一斉に翻訳という職業が消滅することはないとは思っています。

機械翻訳が進歩する速度も飛躍的に上がっていますが、最近では、機械翻訳と人工知能のハイブリッド型の翻訳ソフトが登場したそうです。機械翻訳が提示する下訳に対して人間がポストエディットを施す。この作業パターンを人工知能が学習し、次のセグメントには、人工知能が訳の候補を提示する、といった内容だそうです。

つまり何億、いや何兆という対訳コーパスをコンピュータが収集し、そのコーパスを人口知能が学習するわけです。この作業パターンがビッグデータ化されるとどうなるでしょうか。

例えば、自動車業界も同様なことが言えます。10年後は、「人間が運転している方が危険だ」という社会が実現するでしょう。10年後、運転手という職業が消滅しているかもしれません。5年後、人間が翻訳している方が不正確だという社会が訪れるかもしれません。

20年後の将来の人々は、「20年前は、翻訳する場合、ゼロからタイピングしてたらしいよ。その当時は大変だったろうね」と言ってると思います。

我々は翻訳会社ですので、翻訳が消滅すると困ります。

心配ありませんよ!

ちゃんと考えています。

後5年か~・・・。


2015/04/18

Taus Executive Forum Tokyo に参加しました

先日、東京で開催されたTaus Executive Forum Tokyo に参加しました。3年ぶり2回目の参加だっと思います。

このフォーラムは翻訳の自動化に関するのでどうしても機械翻訳の事例が多数紹介されていました。

内容は、Taus さんのホームページをご覧いただければ詳細が分かると思いますので、そちらをご覧下さい。

機械翻訳の是非を議論するより機械翻訳をいかにビジネスに組み込むかが重要であると感じました。

子供はなぜ学校で算数や理科を勉強しなくてはいけないのでしょうか。学ぶ理由を疑問に感じている子供も多いです。算数や理科が将来役に立たないと考えている限り役に立つことはありません。将来、学校で学んだことを応用する必要があります。大学で学んだことを即活用できないので退職してしまう新社会人がいると聞いています。大学で学んだことを社会で即活用することは難しいです。大学で学んだことを応用して初めて社会で役に立つ知識と言えます。

20年後、翻訳という職業がなくなってしまうかもしれないと言われています。今行っている翻訳業務しか考えなかったら本当になくなってしまうかもしれません。20年後、今行っている翻訳業務を応用できるようにしたいものです。

それに僕の性格を考えると20年も同じ仕事はしたくないな~。


受付でこのチョコもらいました。

2015/01/09

第3回関西セミナーのご案内「機械翻訳と向き合うときが来た―MTをもっと身近に、現実的に考える―」に申し込んだ!

1月30日に大阪の中之島で機械翻訳のセミナーが開催されるようです。

申し込みました。

90分ぐらいのセミナーだと思っていたらがっつり1日開催みたいですね。

セミナー及び交流会でお会いしましょう!

では。

2012/10/22

特許翻訳専門のMTを構築したらどうだろうか

最近、マイクロソフトさんがMicrosoft with feedbackという無料の機械翻訳(MT)の提供を開始した(私が存知上げなかっただけで、かなり前から開始していたかも?)。

MTが行った翻訳がうまくいかなかった例は何度が耳にした。

MTの欠点はグローバルMTであるので、様々な分野のコーパスが混ざってしまうことだ。ただし分野を絞れば翻訳の精度が高まるのではないかと思う。

マイクロソフトさんと提携して、全世界で1万人ぐらい採用して、特許だけに特化したMTの構築ってできないのだろうか。

特許の文は決まりきった言い方も多いので、MTには向いていると思う。上のMTを使って実験してみましたが、翻訳としては使えなかったが、固有名詞とか化合物名は正しかった。さすがに何十(百?ひょっとしたら千?)冊も辞書を搭載してるだけはある。

我々の業界では交流会などで特許に特化したMTの構築の実現可能性についての話題が出る場合がある。特許庁が構築してくれないかとか、民間が構築すればいいとかの意見が出る。

早い者勝ちだと思うので、弊社がやってもいいけど。

投資家さん募るか、エンジェル探そうかな・・・。

2012/08/27

DMの送り主が変わってきた

以前は、中国やアジアの翻訳会社からのDMが多かった。今はイギリスとかの先進国からのDMが増えている。ずばり機械翻訳(MT)の営業メールである。

以前は、物価や人件費が安いアジアで翻訳すると料金が下がりますよというのがアジアの翻訳会社さんの売り文句だった。今は頭脳の粋を結集して作りだしたMTを導入してコストを下げましょうというのが先進国の翻訳会社さんの売り文句だ。

ただし今のところMTにしたところでそれほど料金的にお得感を感じない・・・。得だと感じるのはスピードだろうか。確かに早い。

MTはどのように進化するだろうか。非常に興味がある。

9月には東京で「特許文書の機械翻訳結果評価方法検討会」というものすごく難しそうな検討会がある。多分理解できるのは半分以下だろうが、参加してみようと思う。参加費無料だし・・・。

2012/06/11

社内英語公用語化

たまたまYouTubeを見てたら、通訳者さんが社内英語公用語化に関してお話をされていた。そのときはあまり時間がなかったのでちょっとだけ見てその場を離れた。

そのとき思ったのは、将来英語はリンガフランカとしての独占的地位を失う。将来のリンガフランカは機械翻訳だ、と。

だから将来への投資と考えるなら、社内英語公用語化の導入より、機械翻訳を導入した方が投資になるのではないだろうか。

2012/05/26

ある観光団体のHPが誤訳だらけに・・・

東大寺のHPの翻訳がMTを使ったばかりに誤訳だらけになってしまった、という新聞記事を読んだ(著作権の関係上、記事は掲載いたしません)。

以前は、委託業者に1言語に付き150万円支払っていたが、自動翻訳システム(MT?)にしたところ全言語(何言語あるか不明)で35万円になったそうだ―余談だが、1言語に付き150万円が落札価格だったようだ。

この記事だけを読むと、MTにご理解がない方は「やはりMTはまだまだ使い物にならない」とおっしゃるだろうが、私なりに原因を掘り下げてみたい。

記事には、「固有名詞の読み方もあらかじめ登録していなかったことからミスが続出、確認作業も怠っていた」という風に書かれている。恐らく担当者のMTに関する理解は「どんな言語でもスイッチ1つで翻訳されるのだろう」程度だったのではないだろうか。この程度の理解はなにもMTだけではなく通訳や翻訳に関しても同じことが言える。通訳や翻訳をご存じない方は、「どんな言語でも通訳者や翻訳者にかかれば他の言語に入れ替わるのだろう」とおっしゃる。

MTをうまくビジネスに活用するためには、下準備が必要だ。MTが理解しやすり文法に従って原文を作成するとか、コーパスを大量に獲得するとか、適切なMTエンジンを利用するとかだ。

この記事を読む限り、HPの翻訳は失敗したようだが、HPをMTで作成して大成功している例も数多くあるので、「MTは使い物にならない」という誤解だけは止めていただきたい。

TAUS Tokyo Executive Forum ではMTで最高した事例が数多く紹介されていた。

追記:記事には、「機械翻訳」とは書かれていません。「自動翻訳システム」と書かれていました。

2012/04/23

Global Translation Memory

MTに関連して、本日は書きたい。

ウェブサービスで提供している機械翻訳のトランスレーションメモリは、全世界の翻訳者が利用可能である。翻訳ペアを提供することが翻訳業界のみならずビジネス全体の発展につながると信じている。

弊社は小さな会社なので大金を寄付したりできないけど、翻訳業界に貢献できるのなら翻訳ペアの提供もやぶさかではない、と考えています。

問題は、弊社はIP関係の翻訳をしており、クライアントとの守秘義務があり、文書自体に知的財産権があるので、翻訳ペアを共有目的では提供できないでいることだ(著作権の問題ではなく、知的財産権の問題です)。ですので、趣旨にご賛同いただけるクライアント様がいらっしゃれば大変助かります。出願明細書の翻訳の共有は無理だろうが、先行技術文献等の翻訳ペアの提供は可能かもしれない。

提供することに対してどのような法的問題が生じるのか法律の専門家にご意見をいただきたい。それに翻訳ペアがどのように共有されるのかも知りたい。法的な問題を解決できないと翻訳ペアの提供は無理だろう。

以前、Google Translator Toolkit を使って、提供した翻訳ペアがどのように保存されるかの実験をしたことがある。1パラグラフだけを完了させた後、エンターキーを押した。その直後に、同じフレーズを翻訳しようとしてみたが、自分が提供した訳文は現れなかった。恐らく数日しないと現れないようである。これは翻訳ペアの精査をやってるからだろうか?誤訳を削除するといった作業をMT側が行っているのかもしれない。

2012/04/21

機械翻訳(Machine Translation)-TAUS Tokyo Executive Forum-003

許可を得てないので、講演の内容は書きませんが、2日間のTAUSのフォーラムに関して、自分がまとめたことを書きたい。各プレゼンテーションでは色々なことが話された。各社の様々な取組が紹介された。研究結果の発表も行われた。自分はまだMTの知識がないに等しいので、理解できなかったプレゼンもあった。プレゼンターの意図とは異なる理解をしてしまったこともあると思う。

とにかくビジネスにMTをどのように活用するかが経営課題となる、と感じた。

自分は以下のように理解した。

MTの広がる速度:

  • すさまじい速度で世界中で導入されている。理由は、翻訳業界という一部のビジネスだけが導入したからではなく、ビジネス全般で導入されたからだ。翻訳ソフト(メモリー)は、ほぼ翻訳業界でのみ導入されたが、MTはビジネスツールとして業界に関わらず導入されている。その広がる速度はすさまじい。世の中には翻訳するべき文章があふれている。そのためにもMTの活用が検討されている。
翻訳の精度に関して:

  • MTは、センテンスレベルでの翻訳では、精度が悪い場合もあるが、単語レベル(専門用語)では、かなり精度が高い(辞書を使っているので当然だ)。所詮人間が翻訳やっても不完全な翻訳があるでしょ(笑)。
MTが世界共通語に:

  • 近い将来、英語の支配力が弱まる!世界の共通語(リンガフランカ)がMTになる。
特許翻訳業界:

  • JPO等各特許庁は大量の文章を保有している。MT用に供給すれば、知財翻訳業界に革命が起きるのではないかと思った。ただし知的財産権等克服しなければならない問題も多いが。
  • メーカーさん(出願人)はMTの利用を念頭に置いて出願するという発想はないのだろうか、と疑問に感じた?少なくともMTの利用を念頭に置けば、現在の明細書のあの日本語はないな(笑)。
セミナーの長さに関して:

  • プログラムをみたとき、セミナー時間が30分と知って驚いた。今まで参加したセミナーは1コマが1時間はあったので、最初は違和感があった。しかし、30分のセミナーをたくさん聞けるとういのは意外によかった。展開も早く躍動感という大げさだが、テンポがよかった。
TMの共有化に関して:

  • たしかにIP翻訳の場合、TMを他人と共有するというのは法的にも問題はあるだろう。しかし、MTを使わなくても(ローカルの翻訳メモリを使用しても)、A社で使用したTMをB社に使用する(クライアント別のTMを作成しない:global translation memory)のは、問題である。ちなみに弊社では、クライアント様ごとにTMを作っているので、A社のTMをB社のTMとして使用することはない。 用語集も使いまわさない。
  • NDAに、ある特定のクライアントのTMやグロッサリーを別のクライアントに使用することを禁じると明記すればよいかもしれない。ただ翻訳会社の場合は、出願人(依頼主)が分かっているので、TMの共有を防げるが、フリーランサさんは出願人名を伏せられる場合が多い。この場合、TMを区別するのは、現実的には、難しいかもしれない。
以上、色々書いてみました。MTに関しては、もっともっと勉強をしていこうと思っています。


フォーラムが終わってエレベータで名刺交換をした方は個人の翻訳者さんでした。個人で参加費500ユーロ払って参加されたそうです。気合い入ってるな~。

2012/04/18

機械翻訳(Machine Translation)-TAUS Tokyo Executive Forum-002

参加予定者のリストが送られてきた。

その中には、ベンダーさんとかクライアントさんとかも含まれていた。どっちにも挨拶しないと。

しっかり勉強してくるつもりだ。

今回の投稿は、出発の準備で忙しく、これぐらいで・・・。まだ新幹線のチケット買ってない・・・。

2012/04/16

機械翻訳(Machine Translation)-TAUS Tokyo Executive Forum

最近、翻訳業界の関係者が3人集まれば、必ず機械翻訳(Machine Translation: MT)の話題が出る(2人集まっても話題にするかもしれない)。今週、東京で機械翻訳のフォーラムが開催されるので、参加しようと思う。

導入できるかどうかは分からないというがそもそもMTに関して言うと、Google Translator Toolkit をちょっと試しにいじったことがあるだけで全然分かってないので、大いに勉強してこようと思う。Google のその翻訳ソフトをいじった感想は「へ~ここまでできるの」というものだった(もっとダメだと思っていた)。

IP翻訳業界では、WIPOもEPOもMTを導入している。JPOだってMTを活用している。この業界は積極的にMTを活用してきた業界ではないだろうか。特許明細書の翻訳にMTを導入するということは以前からの試されてきたと記憶している。

でもこのフォーラムの参加料がな・・・。2日間のフォーラムが1000ユーロだってさ・・・。内容濃いだろうが。と思っていたらJTFの法人会員は50%オフだってさ。それでも500ユーロか・・・。500ユーロ分ちゃんと学ばないと。

MTは、翻訳支援ソフトの次に注目すべき新技術だと思うので、このブログでも何度か取り上げて行きたいと思う。