自然言語処理 | PyTorch エコシステム 各種ドキュメント翻訳

PyTorch : AllenNLP チュートリアル : Getting Started – 実験の構成

AllenNLP は PyTorch のエコシステムの一つで、PyTorch 上に構築された NLP (自然言語処理) 研究用ライブラリです。広範囲な言語タスクについて最先端の深層学習モデルを開発することができます。

幾つかチュートリアルが用意されていますので、順次翻訳しています。

AllenNLP による品詞タギングの実装コードの解説の後、訓練・評価方法について説明されましたが、今回は実験の構成方法がテーマです。AllenNLP の構成は Jsonnet ファイルで記述されます。

[詳細] (09/28/2018)

 

PyTorch : AllenNLP チュートリアル : Getting Started – モデルの訓練と評価

AllenNLP は PyTorch のエコシステムの一つで、PyTorch 上に構築された NLP (自然言語処理) 研究用ライブラリです。広範囲な言語タスクについて最先端の深層学習モデルを開発することができます。

幾つかチュートリアルが用意されていますので、順次翻訳しています。

先に PyTorch の品詞タギング・チュートリアルを AllenNLP で実装したコードについて解説されましたが、本チュートリアルでは訓練・評価更には予測するステップについて具体的に説明されます。

[詳細] (09/27/2018)

 

PyTorch : AllenNLP チュートリアル : Getting Started – Welcome

AllenNLP は PyTorch のエコシステムの一つで、PyTorch 上に構築された NLP (自然言語処理) 研究用ライブラリです。広範囲な言語タスクについて最先端の深層学習モデルを開発することができます。

幾つかチュートリアルが用意されていますので、順次翻訳していきます。

最初は Getting Started として AllenNLP が簡単に紹介されます。PyTorch の品詞タギング・チュートリアルを AllenNLP を使用して実装します。総てのコードが丁寧に解説されます。

[詳細] (09/26/2018)

 

Fairseq (for PyTorch) : README.md

Fairseq は (fastText と同様に) FAIR (Facebook Research) がオープンソース化した Sequence-to-Sequence ツールキットです。ドキュメントを翻訳しておきました。

Fairseq は自然言語処理に関する様々なタスク – 機械翻訳/要約/言語モデリングやテキスト生成 – のためのカスタムモデルの開発と訓練を可能にする、シークエンス・モデリング・ツールキットで、PyTorch 上に実装されています。

最先端技術の様々な sequence-to-sequence モデルのリファレンス実装と事前訓練モデルが提供され、次のような訓練の高速化がサポートされています :

  • マルチ GPU (分散) 訓練
  • 高速ビームサーチ
  • 遅延更新を通した巨大なミニバッチ訓練
  • 高速な半精度浮動小数点数 (FP16) 訓練

[詳細] (07/10/2018)

 

fastText : Tutorials : 単語表現

fastText は FAIR (Facebook Research) がオープンソース化した単語表現やセンテンス分類の効率的な学習のためのライブラリです。fastText は 0.1.0 でドキュメントが整備されましたので、再翻訳しています。

fastText の基本機能には「テキスト分類」と「単語 (ベクトル) 表現」があります。それぞれ Tutorial が用意されていて、先にテキスト分類を扱いましたので今回は単語表現を扱います。

自然言語処理の機械学習によるアプローチで、現在ポピュラーなアイデアは単語をベクトルで表現することです。これらのベクトルは単語の類推や意味のような、言語の隠れた情報を捕捉します。テキスト分類器のパフォーマンスを改善するためにも利用できます。

[詳細] (07/09/2018)

 

fastText : Tutorials : テキスト分類

fastText は FAIR (Facebook Research) がオープンソース化した単語表現やセンテンス分類の効率的な学習のためのライブラリです。fastText は 0.1.0 でドキュメントが整備されましたので、再翻訳しています。

今回は Tutorials から、基本機能である「テキスト分類」を扱います。テキスト分類は、スパム検出、センチメント解析やスマート返信のような多くのアプリケーションの中心的な課題で、その目標は (電子メール、投稿、テキスト・メッセージ、製品レビュー等の) ドキュメントを一つまたは複数のカテゴリーに割り当てることです。現在ではそのような分類器を構築するためのアプローチの中心は機械学習です。

本記事では fastText ツールでどのようにテキスト分類器を構築するかが説明されます。具体的には、Stack Exchange の料理についての質問をポット、ボウルやパン焼きのような幾つかの可能なタグの一つに自動的に分類する分類器を構築し、パフォーマンスを追求します。

[詳細] (07/07/2018)

 

fastText : FAQ

fastText は FAIR (Facebook Research) がオープンソース化した単語表現やセンテンス分類の効率的な学習のためのライブラリです。fastText は 0.1.0 でドキュメントが整備されましたので、再翻訳しています。チュートリアルも用意されています。

先に github の README を翻訳しましたが、今回は FAQ です。fastText の実装やアルゴリズムのポイント、モデルの shrink up や階層的 softmax 等について解説されています。

[詳細] (07/06/2018)

 

fastText : README.md

fastText は 0.1.0 でドキュメントが整備されましたので、再翻訳しています。チュートリアルも用意されていますが、最初に github の README を翻訳しました。主としてビルド方法やユースケースについて説明されています。

fastText は FAIR (Facebook Research) がオープンソース化した単語表現やセンテンス分類の効率的な学習のためのライブラリです。典型的な利用方法としては、センチメント解析のための教師ありテキスト分類等があげられます。

既に様々なモデルが公開されていて、最先端技術による英語単語ベクトル・モデルに加えて、157 言語のための単語ベクトル・モデルも提供されています。

[詳細] (07/05/2018)

 


 

お問合せ
本件に関するお問い合わせ先は下記までお願いいたします。

株式会社クラスキャット
セールス・マーケティング本部 セールス・インフォメーション
E-Mail:sales-info@classcat.com
WebSite: http://www.classcat.com/

 


※ ClassCat は株式会社クラスキャットの登録商標です。
※ その他、記載されている会社名・製品名は各社の登録商標または商標です。