/

mediajam メディアジャム -βバージョン

▼ニュースを検索する

ビズリーチ、276万件の求人情報に基づくHR領域の「単語ベクトル」公開(コードジン)

 今回公開したのは、2018年1月に求人検索エンジン「スタンバイ」に掲載されていた約276万件の求人情報(のべ約10億単語)から獲得した、「単語ベクトル」と呼ばれる言語研究用データ。  求人情報に含まれる単語について、周辺の単語群との傾向を機械学習を用いて学習し、その特徴をword2vecによって数値化(ベクトル化)したもので、単語の特徴が数値化されることで自然言語処理の精度が向上し、さまざまな目的に利用可能となる。  なお、単語ベクトルのデータセットは、100次元、200次元の2種類を用意している。 【関連リンク】 ・ビズリーチ ・単語ベクトルデータセット(GitHub) ...

2018/03/13 | CodeZine

タグ


関連記事

関連記事はありません。


このニュース・メディアについてもっと詳しく!!

CodeZine
CodeZine
翔泳社が運営する開発者のための実務系Webマガジン。Windows、Java、Web、DB、言語などの情報が充実。コミュニティ、フォーラム、ブックマークなどもある。
より詳しくは http://codezine.jp/