2016/12/14

Hybrid Translation の考察-その1

機械翻訳(以下、MT)+TM+TB+ポストエディット(以下、PE)を組み合わせた翻訳サービスの販売を予定している。

様々なな検証及び実験を行っている。

ある検証の条件は、以下の通りだった。

  • 言語ペア:日英
  • MT:あり
  • TM:あり(弊社にて作成)
  • TB:あり(弊社にて作成)
  • 翻訳システム:あり
  • PE:私
  • 対象テキスト:明細書(弊社にて任意で指定)


結果の詳細はこちらをクリックして下さい。

この結果では、6102ワードを翻訳した。そのうち、1359ワードは、TMからであり、4707ワードは、MTであり、繰り返しが36ワードあったことが分かる。

ただし以下のことが判明している。


MT
50%–74%2543
0%–49%1838
4381

つまり全体で6102ワード中、4381ワードのMT使用率は、74%以下である。簡単に言えば、6102ワード中、4381ワード分は、ポストエディタ(私)がかなり書き換えているということだ。

いわばこれが弊社のHybrid Translation サービスである。MTという原材料をPEを通して翻訳というサービスにまとめて販売するわけである。石油会社が原油という原材料を精製してガソリンとか灯油を販売していることに似ている。

このサービスを販売するに当たりお問い合わせ頂いた中には「単なる機械翻訳でしょ」という誤解があった。

そうではない。

MTの部分が単なる原材料です。我々は自社で加工し、それを商品として販売します。

この検証を通して感じたこと:

  • TMのデータ量は、多いほど良い。
  • ポストエディタは、基本、ゼロから翻訳できる能力が必要。
  • 翻訳とPEとは、作業内容が全く異なる。
  • 料金次第ですが、PE次第でMT臭さを完全に払拭することが可能。
  • 意外にもMTは正確な翻訳をしてくれる。
  • 従来の翻訳方法と比べて、20%程度は作業が軽減された。

上の感想の中で、注目したいのが最後の「20%程度作業が軽減された」である。つまりMTというコストが極めて低い技術を利用して作業が20%低減されたのである。年間を通して考えると、作業効率が大幅に軽減されることになる。

さらに複数回、検証を行う予定です。またアップデートいたします。

0 件のコメント:

コメントを投稿