課程簡介

NLP 相關軟體包的 Python 概述

NLP 簡介(當然是 Python 中的例子)

  1. 簡單的文字操作
    1. 搜索文字
    2. 計數 Words
    3. 將文本拆分為 Words
    4. 詞彙離散
  2. 處理複雜結構
    1. 在 Lists 中表示文本
    2. 索引清單
    3. 搭配
    4. 二元語法
    5. 頻率分佈
    6. 帶有 Word 個的條件語句
    7. 比較 Word(startswith、endswith、isslow、isalpha 等)
  3. 自然語言理解
    1. Word 意義消歧義
    2. 代詞解析
  4. 機器翻譯(統計、基於規則、文字等)
  5. 習題

示例中 Python 中的 NLP

  1. Accessing 文本語料庫和詞彙資源
    1. 語料庫的常見來源
    2. 條件頻率分佈
    3. 按流派計數 Word
    4. 創建自己的語料庫
    5. 發音詞典
    6. Shoebox 和 Toolbox 詞典
    7. 意義和同義詞
    8. 層次結構
    9. 詞彙關係:Meronyms、Holonyms
    10. 語義相似性
  2. 處理原始文字
    1. 撬動
    2. 正在截斷
    3. 提取字串的各部分
    4. Accessing individual charaters
    5. 搜尋、替換、拆分、聯接、索引等...
    6. 使用正則表達式
    7. 檢測單詞模式
    8. 堵塞
    9. 分詞化
    10. 文本規範化
    11. Word 分割(尤其是中文)
  3. 分類和標記 Words
    1. 標籤為 Corpora
    2. 標記令牌
    3. 詞性標籤集
    4. Python 詞典
    5. Words 到 Propertieis 的映射
    6. 自動標記
    7. 確定 Word 的類別(形態、句法、語義)
  4. 文字分類 (Machine Learning)
    1. 監督分類
    2. 句子分割
    3. 交叉驗證
    4. 決策樹
  5. 從文字中提取資訊
    1. 分塊
    2. 叮叮噹噹
    3. 標籤 vs 樹木
  6. 分析句子結構
    1. 上下文自由語法
    2. 解析器
  7. 構建基於特徵的語法
    1. 語法特徵
    2. 處理特徵結構
  8. 分析句子的含義
    1. 語義和邏輯
    2. 命題邏輯
    3. 一階邏輯
    4. 話語語義
  9. 管理語言數據
    1. 資料格式(詞典與文字)
    2. 元數據

最低要求

Python 的基礎知識

 28 時間:

客戶評論 (1)

課程分類