단어와 문서란

    WORD AND DOCUMENT EMBEDDINGS 단어와 문서 임베딩이란?

    WORD AND DOCUMENT EMBEDDINGS 단어와 문서 임베딩이란?

    단어들의 Semantic (의미) Lexical Semantics (어휘의 의미): 단어들의 의미에 대한 연구 (단어 감각) Synonymy (동의어) 는 단어들 사이에서 정의된다. (단어 감각 아님) 두 단어들은 문장의 진실을 보존하면서 어떤 문장에서든 대체될 수 있다면 Synonymy 이다. Contrast 의 원리 언어적 형태의 차이는 항상 의미의 차이와 관련이 있다. 즉, 정확히 같은 단어는 없다. 예시 H2O 와 물은 다른 장르에서 사용된다. 단어 Similarity (유사성) VS Relatedness (연관성) 두 단어가 얼마나 유사한지 정량화하는 것은 질문 답변 (Question-answering), 페러 프레이징 및 요약을 포함한 많은 NLP 작업에서 사용된다. 인간의 Annotation..