用語集は、翻訳をカスタマイズしたり、プロダクト名などの特定の用語の翻訳を定義するのに最適な方法です。用語集の新規作成には3つの方法があります:
この記事では、用語集ジェネレータと手動での用語集作成に関する DeepL の推奨ベスト・プラクティスについて詳しく説明します。用語集をアップロードする方法については、こちらの記事をご覧ください。
用語集ジェネレータを利用する場合
新しい用語集をゼロから作成する最も簡単な方法は、既に翻訳済みの言語データをDeepL の用語集ジェネレータにアップロードすることです。用語集ジェネレータを最大限に活用するには、以下のベストプラクティスに従ってください:
ファイルの種類
現在、.tmx または .tsv 形式のファイルが最良の結果を示しています。これらの形式では、どの原文がどの訳文に対応しているかが最も明確に分かるからです。
ファイル構成
.tmx、.tsv、または.csv形式のファイルには、選択した言語ペアのフレーズと文のみが含まれている必要があります。
.csvと.tsvファイルをアップロードする際は、ファイルの最初の行に必ず「Source」と「Target」(カンマまたはタブで区切り文字)を追加してください。セミコロンは現在、区切り文字としてサポートされていません。
ファイルの例
- .csv
- .tsv
- .tmx
ファイルサイズ
.tmxまたは.tsvファイルの場合、最低1000文のペア(原文と訳文)が必要です。例えば、英語とドイツ語の用語集を作成する場合、英語で1000文、ドイツ語で1000文が必要です。
.docxと.pdfファイルの場合、1ファイルに1000文ずつ必要です。
さらなるベストプラクティス
- 用語集ペアは、ファイル内で一貫して利用する必要があります。
- 辞書的な翻訳ではないため、明白な翻訳や一般的な翻訳は破棄されます。
- 用語集ジェネレータが用語を生成する時間は、ファイルのサイズなど、さまざまな要因に依存します。
- 用語集ジェネレータは1,000センテンスペアあたり平均20エントリを生成しますが、正確な数はファイルのドメイン固有性と独創性に依存します。
- 用語集ジェネレータを両方の言語方向(英語からドイツ語、ドイツ語から英語など)で試すと、追加の用語ペアが表示されることがあります。
用語集を手動で作成
用語集ジェネレータを使う代わりに、用語ペアを手動で追加することもできます。用語集に登録する単語などを揃える際には、以下の点に注意してください。
- 企業独自の用語(社内用語、製品・サービス名)
- 業界用語
- 特定の読み手を想定した用語
- 翻訳すべきでない用語
可能であれば、社内の協力を得ましょう。技術チーム、セールスチーム、マーケティングチームに声をかけて、用語集を充実させ、自分だけの用語集を作成できるようにしましょう。