用語集は、翻訳をカスタマイズし、製品名などの特定の用語の翻訳を定義するのに最適な方法です。新規用語集を作成するには、以下の4つの方法があります。
この記事では、DeepLが推奨する用語集ジェネレータと手動による用語集作成のベストプラクティスについて詳しく説明します。用語集をアップロードする方法の詳細については、こちらの記事をご覧ください。
用語集ジェネレータを利用する
ゼロから新規用語集を作成する最も簡単な方法は、すでに翻訳済みの言語データをDeepLの用語集生成ツールにアップロードすることです。用語集ジェネレータを最大限に活用するには、以下のベストプラクティスに従うことをお勧めします。
ファイルの種類
現在、.tmx または .tsv 形式のファイルが最良の結果を示しています。これらの形式では、どの原文がどの訳文に対応しているかが最も明確に分かるからです。
ファイル構造
.tmx、.tsv、または .csv 形式のファイルには、選択した言語ペアのフレーズや文章のみを含める必要があります。
.csv および .tsv ファイルをアップロードする際には、必ずファイルの最初の行に「Source」および「Target」(カンマまたはタブで区切ります)を追加してください。現在、セミコロンは区切り文字として対応していません。
サンプルファイル:
- .csv
- .tsv
- .tmx
ファイルサイズ
.tmxまたは.tsvファイルの場合、最低1000文のペア(原文と訳文)が必要です。例えば、英語とドイツ語の用語集を作成する場合、英語の文章は1000文、ドイツ語の文章も1000文用意する必要があります。
.docxおよび.pdfファイルについては、各ファイルに1000文ずつ含まれている必要があります。
さらなるベストプラクティス
- 用語集のペアは、ファイル内で一貫して利用されるべきです。
- 辞書的な翻訳ではないため、明らかな翻訳や一般的な翻訳は破棄されます。
- 用語集ジェネレータがエントリを生成する時間は、ファイルのサイズなど、さまざまな要因によって異なります。
- 用語集ジェネレータは、1000文のペアにつき平均20の用語ペアを生成しますが、正確な数はファイルのドメインの独自性とオリジナリティによって異なります。
- 用語集ジェネレータを両方の言語方向(英語からドイツ語、ドイツ語から英語など)で試すと、追加の用語ペアが表示されることがあります。
手動で用語集を作成
用語集ジェネレータを使う代わりに、用語ペアを手動で追加することもできます。用語集に登録する単語などを揃える際には、以下の点に注意してください。
- 企業独自の用語(社内用語、製品・サービス名)
- 業界用語
- 特定の読み手を想定した用語
- 翻訳すべきでない用語
可能であれば、社内の協力を得ましょう。技術チーム、セールスチーム、マーケティングチームに連絡し、用語集に含める用語を充実させてください。そうすれば、自分用にカスタマイズした用語集を作成するための基盤となる用語を十分に確保できます。
用語集のサンプルから用語集を作成します。
用語集機能を利用したいが、用語集のリストがまだ準備できていない場合は、用語集のサンプルを利用して開始することができます。
次のトピックから用語集のサンプルを選択できます。
- ブランドマーケティング/広告
- 法務
- 財務/会計
- IT / 技術用語
- インターフェース用語(UX/UI)
これらの用語集のサンプルには、複数の言語ペア、頭字語、および複数語の用語が含まれています。これらは当社の社内チームによって作成およびレビューされており、業界固有の基準に準拠しています。
これらの用語集のサンプルは、プロダクト名など、会社固有の用語を追加することでカスタマイズできます。