|
1.集成, コーパス(文例を集めたデータベース), 2.死体, 集成, 死体 =========================== 「 Corpus 」を含む部分一致用語の検索リンク〔 32 件 〕 ・amygdaloid corpus : 扁桃体 ・atretic corpus luteum : 閉鎖黄体 ・corpus : 1.集成, コーパス(文例を集めたデータベース), 2.死体, 集成, 死体 ・corpus adiposum buccae : 頬脂肪体 ・corpus albicans : 白体 ・corpus allatum : アラタ体 ・corpus allatum hormone : アラタ体ホルモン ・corpus amygdaloideum : 扁桃体 ・corpus callosum : 【解剖】脳梁(ノウリョウ), ★複数形はcorpora collosa ・corpus cardiacum : 側心体 ・corpus cavernosum : 海綿体 ・corpus cavernosum penis : 陰茎海綿体 ・corpus ciliare : 毛様体 ・corpus delicti : 罪の体素, 罪体(犯罪の実質的事実), 他殺死体, 罪体:犯罪がなされたという基本的事実 (the body of the crime) ・corpus geniculatum : 膝状体 ・corpus linguae : 舌体 ・corpus luteum : 黄体 ・corpus luteum cyst : 黄体嚢胞 ・corpus luteum hormone : 黄体ホルモン ・corpus luteum of pregnancy : 妊娠黄体 ・corpus nigricans : 黒体 ・corpus pedunculatum : キノコ様体 ・corpus spongiosum penis : 尿道海綿体 ・corpus striatum : 線条体 ・false corpus luteum : 月経黄体 ・habeas corpus : 《ラテン語》<法>人身保護令状, 身柄提出令状 ・mamillary corpus : 乳頭体 ・mammillary corpus : 乳頭体 ・persistent corpus luteum : 遺残黄体 ・pineal corpus : 松果体 ・striate corpus : 線条体 ・trunk of corpus callosum : 脳梁幹
コーパス(corpus)とは、言語学において、自然言語処理の研究に用いるため、自然言語の文章を構造化し大規模に集積したもの。構造化では言語的な情報(品詞、統語構造など)が付与される。コンピュータ利用が進み、電子化データとなった。 == 概要 == 「身体」を意味するラテン語corpusに由来する。複数形はcorpora(コーポラ)。英語式複数形としたcorpusesの使用も散見される。 大規模なコーパスの作成には相当の費用と時間がかかる。使用する文章に関わる著作権などの法的問題が発生するためである。データ作成の手間はあるが、コンピュータ利用によりそれ以前に比べかなりの労力軽減と多様な構造化が実現した。日本では国立国語研究所が一億語の収録を目指す「KOTONOHA計画」をすすめている。 構造化した言語データを一般利用するという観点からは、三省堂がウィズダム英和・和英辞典の用例を「用例コーパス」として期間限定で無料公開している。 日本でコーパスを一般に広く知らしめたのは、英語学者の投野由紀夫である。2003年、NHK教育テレビジョン『100語でスタート!英会話』で、英語コーパスを教材に活用した放送授業を展開し、それまで専門家しか知らなかったコーパスを一般的な存在へ変えた。2009年には新シリーズとしてずばりコーパスをタイトルに入れた『コーパス100!で英会話』が放送されている。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「コーパス」の詳細全文を読む 英語版ウィキペディアに対照対訳語「 Text corpus 」があります。 スポンサード リンク
|