自然言語処理

일본어, 영어 등 인간이 일상적으로 사용하는 언어로 사고, 커뮤니테이션, 기록에 사용됨
문자의 연속, 문자열, 문자 데이터로 세분화 정도에 의해 종류가 나뉘어짐
⽂字,単語,⽂,⽂章구조를 가지며 큰 구조의 텍스트(テキスト)는 작은 구조의 텍스트(テキスト)로 구성되며 통상 어떠한 내용(의미)를 나타냄
어휘와 문법
언어 표기를 위해 사용되는 기호로 최소 단위의 텍스트(テキスト)
발음이나 의미를 나타냄 (발음 : 표음문자, 발음 + 의미 : 표의문자)
⽂字コード : 문자에 대응하는 수치
최소 언어 단위 텍스트(テキスト)로 단어, 토큰으로 불림
구성을 가지고 최소단위의 단어, 형태소, 단일어(単純語), 短単位語
하나 이상의 단어로부터 구성된 텍스트(テキスト)
한 구획의 내용을 나타낸다
하나 이상의 문(⽂)에서 구성된 텍스트(テキスト)로 정리된 사고나 화제를 표현하는 것
단어의 모임, 또는 단계적으로 모여진 그것들의 총체
모임의 판단재료로 위치관계, 의존관계가 있음

텍스트가 나타내는 내용
개념과 관계의 그래프
어떤 범위의 텍스트 (주로 단어)와 짝을 이루는 의미의 총체
텍스트의 이해나 생성에 사용됨
語彙
텍스트를 구성하는 규칙으로 텍스트의 이해나 생성에 사용됨
⽂法