Smartcat AI プロンプトエンジニアリングワークショップ

プラットフォームに組み込まれたさまざまな生成 AI ツールを使用して、Smartcat を最適化し、品質とスループットを向上させることがこれまで以上に簡単になりました。

タイトル

このインタラクティブな実践セッションでは、Smartcat 製品チームが次のことを行います。

➡️ Smartcat AI プラットフォームで現在利用可能な Gen AI のコア機能について説明します
➡️ さまざまなシナリオに合わせて Smartcat を最適化するための基本を深く掘り下げます
➡️ 質問に答え、独自のコンテンツでこれらの AI ツールを活用するための詳細なガイダンスを提供します

➡️ Smartcat の OpenAI プロンプトの例を共有する

組織でSmartcat AIをどのように活用できるかを学ぶ

ウェビナーQ&A

Q: これは Unite サブスクリプション プランでのみ利用できますか?

A: カスタマー サクセスの担当者に連絡して、サブスクリプションについて問い合わせることをお勧めします。


Q: XLIFF ファイルを翻訳する場合、AI プロンプトを使用すると付加価値が得られますか?それとも現在のモデルに固執すべきでしょうか?

A: Andy が示したように、非常に特殊な用語やスタイルを生成したい場合には、付加価値になる可能性があります。他に何ができるかについては、後ほど説明します。


Q: 利用可能なドメインのリストはありますか?

A: LLM はほとんどの分野をカバーします。数十億の文書を使用してトレーニングされます。


Q: 将来的には、特定のプロジェクトで利用可能なすべての用語集ではなく、特定の用語集に用語集プロンプトをリンクできるようになりますか?私の目標は、モデルに特定の用語集を使用するように要求することで誤検知を減らしつつ、多義語、一般用語、同義語など、モデルが翻訳に常に使用することを望まない他の用語をポストエディターがチェックできるように、エディター内に参照用語集を保持することです。

A: いい質問ですね。現時点では、プロジェクトに関連付けられた用語集を使用します。あなたの場合の選択肢の 1 つは、データを使用してエンジンを微調整することです。しかし、あなたの提案を検討することはできます。


Q: スタイル、用語、標準的なフレーズなどを非常に具体的にしたい場合、プロンプトの長さに制限はありますか?

A: 技術的には必要ありません。ただし、翻訳プロセスが遅くなる可能性があります。全体的な出力に影響を与えたい場合は、エンジンを微調整する方が適している可能性があります。


Q: 並列テキストを参照として追加して、AI がそこからスタイルを選択できるようにすることはできますか?

A: エンジンを微調整して、文のペアを参照として提供し、エンジンがあなたのスタイルに一致するようにすることができます。


Q: プロンプト/LLM を使用して翻訳を実行する場合、サブスクリプションの単語数が使用されますか?あるいはそれはどのように機能するのでしょうか?

A: はい、LLM のプロンプトを使用して生成された単語は Smartwords を消費します。


Q: 中括弧を使用する意味を説明していただけますか?これらは、表示されているとおりに単語を入力した場合にのみ機能するシステム用語ですか?

A: Jean-Luc が共有したように、事前設定されたプロンプトの小さなライブラリがあり、プロンプト生成 UI の右側にあります。


Q:現時点では、私たちのプロジェクトでは、プロンプト付きの GPT プリセットは、タグ (ソースに書式設定がある場合は常にマークアップの黄色のタグ) が付いた文字列では機能しません。このような場合、プリセットは自動的に別の翻訳マシンにフォールバックします。回避策と、タグ付きの文字列でも GPT プリセットがどのように機能するかをご存知ですか?

A: Jean-Lucが共有したように、タグの具体的な例をいくつか見て、文字列内のタグを無視するようにプロンプトを改良できるかどうかを見てみましょう。


Q: 大文字と小文字を区別する言語で作業する場合にも同様に機能しますか?

A: はい。つまり、いわゆる低リソース言語が存在します。つまり、モデルは、通常、データを取得しようとしているときのモデルであり、明らかに最も重要です。データの大部分は英語のデータです。そのため、言語モデルは英語で最も優れた結果を示します。しかし、他のさまざまな言語を試してみると、翻訳しようとしている言語が希少になるほど、品質が低下していくことがわかります。おそらく最悪の結果になるでしょうが、大文字と小文字を区別する言語は必ずしもリソースの少ない言語ではありません。はい、うまく機能します。しかし、リソースの少ない言語の 1 つとして挙げられるのは、アルメニア語であり、複雑な言語の 1 つです。そうなるでしょうね。おそらく、予想外の結果がいくつか見られるかもしれません。しかし、通常はそうするでしょう。これらのケースでは良い結果が得られるでしょう。