機械翻訳の導入テスト(PEMT)

  • Naver ブログを共有する
  • Naver バンドに共有する
  • Facebook 共有する
  • Twitter 共有する
  • 카카오스토리공유하기

グーグル翻訳をはじめとする機械翻訳の品質は過去に比べて大きく向上に応じて機械翻訳を翻訳プロセスに追加する動きが大型翻訳会社を中心に示されているようです。 機械翻訳の導入により、生産性を向上させることができれば、それだけ顧客に請求する翻訳料を下げることができ、これは、競争力の向上につながる。

一方では、いくつかの翻訳が機械翻訳を無分別に使用して問題を引き起こす場合もあり、翻訳の機械翻訳使用を禁止する条項をNDAに追加する会社も多い(「グーグル翻訳利用時の注意事項」を参照)。

機械翻訳の導入テスト

グーグル翻訳が特定の分野では、比較的満足のいく品質を提供していますが、(そのような場合にも、必ずEditingが必要)、全体的な品質はまだ期待以下です。 だから、Google翻訳などの機械翻訳導入については、まだ時期尚早ではないかと思います。

機械翻訳の導入

機械翻訳を翻訳プロセスに導入しようとする動きは逆らえない大勢です。 今は過渡期に機械翻訳を導入する企業や機械翻訳を排除する企業が混在が終局的に機械が翻訳する方向に進むと思われます。 ただ、時間上の問題であり、今では、機械翻訳を信頼することができないので、プロの翻訳が介入する ポスト編集(Post-Editing) 過程を経ることになります。

私取引英国の大型翻訳会社は、数年前に機械翻訳を導入しようとしたが、期待したほどの成果を出せなかったようです。 しかし、数日前にした多国籍企業翻訳プロジェクトの機械翻訳を活用するためにPEMT(Post-Editing Machine Translation)を導入すると、メールを送ってきましたね。

PEMTは機械が翻訳した文書を、人間が編集(検収)する作業です。 ニューラルネットワーク翻訳エンジンが既存の翻訳した文書に基づいて新しい文書を翻訳すると、人間の翻訳者が検収し翻訳の品質を(機械翻訳の助けなしにプロの翻訳が提供する品質レベルに)高めることになります。 機械翻訳エンジンは、TM(翻訳メモリ)との用語を利用することにより、一般人が使用する、Google翻訳の割には翻訳の品質が優れていると推定することができますが、実際の品質は直接確認して見なければ知ることができるでしょう。

The trial will stretch over any period of time during which we can post-edit a minimum of容易に3,000〜words。 At the end of the trial period、we are going to gather a set of metrics to objectively measure productivity improvements。 We will assess your hourly output(number of words delivered without MT vs. number of words delivered with MT)as well as compare automated metric scores(BLEU、METEOR、TER)against past benchmarks。

PEMTを導入するために、まずプロの翻訳が機械翻訳で翻訳された文書(3,000〜5,000単語分)を検査して、機械翻訳の助けなしに、人間が翻訳したときと比較して時間当たりどのくらいの生産性が高いかを測定します。 つまり、時間平均いくつかの単語程度を検査することができるかをチェックする翻訳者に支給することができる翻訳料が決定されます。

PEMTが翻訳者にどのような影響を与えるか

PEMTを数年前から利用している企業がありますが、完全に位置を取るまでには相当の時間がかかりかと思われます。 個人的には、ポスト編集作業を無条件拒否しています。 翻訳者は分かるが、不思議翻訳を検収する作業は、最初から新たに作業するよりもストレスを受けて時間がかかります。

しかし、機械翻訳の品質が一定レベル以上に高くなる泣く泣くにポスト編集作業を受けるしかないでしょう。 PEMTがますます活性化されると、翻訳料が下落するということは、容易に予想することができます。

特に、英日翻訳は朝鮮人翻訳者と一部の低価格ダンピング翻訳者のために、他の言語よりも急低下することがあります。 実際にした世界的な翻訳会社が2年前に送ってきた言語別翻訳単価をみると韓国語が東南アジアの言語よりも低く策定されていました。ㅠ

機械翻訳の発展のために一度能力も減少することがあります。 一方では、翻訳単価が下落すると翻訳料負担のための翻訳を考慮していない文書を翻訳する可能性があるため、翻訳量が多くなるという期待もあるが、翻訳者に任せず機械翻訳した文書をそのまま使用しているグローバル企業が増えてています。 例えば、いくつかのマイクロソフトのサイトは、機械翻訳を使用して翻訳された。

上記のマソ文書で機械翻訳について説明しています。 この記事を見てみると、厄介な部分が多いです。

機械翻訳技術と、それを使用するインタフェースの背後にある概念は比較的簡単であるが、それの後ろの科学そして技術は、非常に複雑でありいくつかの先進的な技術は、特に、深い調査を招集する(人工知能)、ビッグデータ、言語学、クラウドコンピューティングとWeb api。

それでも元となるのは3年前に比べて、今のマソ翻訳エンジンの品質があまり改善されていないようという点です。笑機械翻訳の品質を満足いくレベルに引き上げることがそれほど容易ではないようです。

おわりに

機械翻訳が人間翻訳を取り替えることは時間上の問題で、近い将来に行われることです。 しばらくは機械翻訳と人間翻訳が共存しながら徐々にPEMTが増加することになると思われます。

AIの発展により、多くの職業が脅威を受けています。 翻訳者は、おそらく、その最初の犠牲者はないかと思います。 実際に娘が将来的に消える職業1位は翻訳とね。ㅠ翻訳で生き残るためには、優れた翻訳能力を備えたり、翻訳単価を下げて物量を確保する戦略でいかなければならそうです。

私は実際にここ数年の間に翻訳単価の問題で、いくつかの業者との取引大幅に減りました。 それでもこのようなメーカーから他の翻訳者が処理していないジョブを送信来たりします。 そんな作業はほとんど級、または難易度が高いです。 そして医学翻訳など、いくつかの翻訳分野は、当分の間、影響を受けないようです。

注:



3のコメント

  1. 얼마 전 사이트에 올릴 글을 빠르게 번역하는 방법이 없을까 싶은 마음에 검색을 하다가 AI 속기 프로그램에 대해 알게 되었습니다.
    한국어를 비롯하여 몇 가지 언어를 지원한다고 안내되어 있습니다.
    기술 발전 가능성을 생각하면 두근대다가도 한편으로는 무엇을 잃어가고 있는 것은 아닌지 염려가 되기도 합니다.
    이곳에 흥미로운 주제의 글이 많네요.
    포스팅해 주셔서 감사합니다.

    그리고 어디에 이것을 전달해드려야 할지 몰라서 생각난 김에 댓글에 문의드립니다.
    WordPress 비즈니스 플랜을 사용 중인데, 기본으로 깔려있는 플러그인에 대한 정보가 없어 오늘은 그걸 찾아보려 들어왔습니다.
    블로그 우측 상단에 돋보기를 눌러 검색하면 구글 검색이 표시는데, 혹시 이 블로그 안에서만 검색이 가능한 기능이 있는지 안내해 주실 수 있을까요?

    応答
    • 안녕하세요, 지수님.

      加入型 WordPressの ビジネスプラン에서는 플러그인을 설치하여 사용할 수 있습니다. 하지만 일부 플러그인은 사용이 제한됩니다.

      例えば、 WordPress닷컴에 이미 자체 캐싱 솔루션이 적용되어 있으므로 캐시 플러그인 (Cache Enabler, Comet Cache, Hyper Cache, Powered Cache, JCH Optimize, Quick Cache, W3 Total Cache, WP Cache, WP Fastest Cache, WP Speed Of Light, WP Super Cache, SG Optimizer, Fast Velocity Minify, Breeze — WordPress Cache Plugin 등)은 설치할 수 없습니다. 그리고 백업 플러그인과 SQL 작업이 많은 플러그인 등도 제한됩니다. 시간이 날 때 여기에 대해 한 번 정리해보겠습니다.

      このブログでは、 WordPress 자체 검색 기능을 사용하지 않고 구글 맞춤 검색 (CSE) 기능을 사용하여 제가 운영하는 몇 개 블로그의 글을 동시에 검색하도록 되어 있습니다.

      https://www.thewordcracker.com/forum/resources 페이지에서 검색하시면 됩니다.

      応答
      • 이제야 캐시 플러그인을 설치했을 때 왜 오류가 생겼는지 이해가 됩니다.
        親切な回答ありがとうございます!