LLM Wiki 執行日誌

2026-06-17 初始化與首次全量 Ingest

操作

使用 yhf-llm-wiki SKILL 為 /home/fangxia/我的资料/电影/ 建立 LLM Wiki,4 個子代理並行 Ingest 全部 238 篇影評文件。

原始文件統計

子目錄文件數
大模型的影评/74 個 .md
我的影评/146 個 .md
电影背景/18 個 .md
總計238

並行 Ingest 批處理

批次文件數耗時創建內容
batch_aa57~11min57 sources + ~94 entities + 181 concepts
batch_ab61~3min61 sources + 367 entities (259影片+110人物) + 31 concepts
batch_ac60~8min117 sources + 220 entities + 319 concepts
batch_ad60~12min60 sources + 53 entities + 33+ concepts

最終 Wiki 統計

類別文件數主要內容
Sources117原始影評的摘要頁,含摘要、涉及影片、核心概念、人物
Entities156影片實體 + 導演/人物實體 + 演員實體
Concepts217電影類型、敘事手法、分析框架、視聽語言、運動流派
總計490
總大小~2.0 MB

新增國別概念頁(7個)

2026-06-24 補充 26 個缺失文件的 Sources 頁面

操作

為先前未被 Ingest 的 26 個原始文件補充 Sources 頁面至 wiki/sources/,同步創建缺失的 Entities 頁與 Concepts 頁。

處理的原始文件

大模型的影评/(5 個)

  1. 《哈利·波特与阿兹卡班的囚徒》——青春创伤与时间悖论的成长史诗
  2. 《阿凡达》——技术史诗与文明反思的银幕革新
  3. 豆瓣Top250深度研读:《窃听风暴》——极权穹顶下,良知的无声突围
  4. 《音乐之声》——乱世温柔里的音乐救赎与人性坚守
  5. 《功夫》——市井江湖的禅意救赎与华语武侠的范式革新

电影背景/獨立文件(5 個) 6. 你是一名日本影视行业的资深研究者;我现在想了解反映民生的日… 7. 凡人修仙传被改编成影视剧有哪些?忘语小说的版权收入有多少?(已有 sources 頁,未改動) 8. 宋词茶词深度研究报告_Song_Ci_Tea_Poetry_Analysis 9. 通用大模型中擅长电影电视剧等影视知识问答分析的有哪些? 10. 电影影评文件夹LLM-Wiki构建报告-2026-06-17

电影背景/台湾专书(15 個文件) 11. 从台湾影视作品看台湾百年来人文社会变化-全书概述(书级总页) 12-26. 00-目录与说明 + 14 章节(第一章至第十四章)

新增 Wiki 统计

类别新增数说明
Sources245大模型的影评 + 4电影背景 + 1书级概述 + 14章节
Entities7哈利·波特与阿兹卡班的囚徒、阿凡达、音乐之声、功夫、周星驰、弗洛里安·冯·多纳斯马克、罗伯特·怀斯
Concepts12时间悖论、心理创伤与疗愈、音乐救赎、市井江湖、极权体制、艺术对抗极权、社会镜像、健康写实主义、台湾新电影、在地性、空间叙事、创伤记忆

新增著名導演實體頁(10個)

已存在導演實體頁(43個)

李安、陳凱歌、張藝謀、姜文、劉鎮偉、宮崎駿、岩井俊二、 史蒂文·斯皮爾伯格、克里斯托弗·諾蘭、大衛·芬奇、弗朗西斯·福特·科波拉、 朱塞佩·托納多雷、羅貝托·貝尼尼、蓋·里奇、呂克·貝松、羅曼·波蘭斯基、 詹姆斯·卡梅隆、楊宇碩、黃東赫、納迪·拉巴基、馬克·赫爾曼、 拉吉庫馬爾·希拉尼、羅伯·萊納、羅伯特·澤米吉斯、羅傑·阿勒斯&羅伯·明可夫、 克里斯·哥倫布、克里斯托夫·巴拉蒂、加布里爾·穆奇諾、朗·霍華德、 彼得·法雷利、彼得·威爾、彼得·道格特&鮑勃·彼德森、 比利·懷爾德、維克多·弗萊明、威廉·惠勒、萬籟鳴、 悉尼·呂美特、沃卓斯基姐妹、貝納爾多·貝托魯奇、 奧利維·那卡什&艾力克·托勒達諾、阿蘭·葛斯彭納

覆蓋範圍

  • 18+ 國家/地區:中國、香港、台灣、日本、韓國、美國、英國、法國、 意大利、德國、瑞典、蘇聯/俄羅斯、伊朗、印度、巴西、土耳其、 西班牙、葡萄牙、羅馬尼亞等
  • 40+ 部三大電影節獲獎片:涵蓋坎城、威尼斯、柏林、奧斯卡
  • 完整的三層架構:原始層(raw) → 來源摘要層(sources) → 實體/概念層(entities/concepts)

2026-06-20 新增 Ingest:喜马拉雅和荔枝影评

操作

使用 yhf-llm-wiki SKILL 批量接入新資料:喜马拉雅和荔枝影评(362 篇)及 我的影评(1 篇新增)。

原始文件統計

子目錄文件數
喜马拉雅和荔枝影评/362 個 .md
我的影评/(新增)1 個 .md
新增總計363

處理流程

階段內容結果
Phase 1批量建立來源頁 (sources/)363 個新來源頁
Phase 2批量建立實體頁和概念頁實體 +303,概念 +194

更新後 Wiki 統計

類別之前之後增長
Sources238601+363
Entities156743+587
Concepts217411+194
總計4901,755+1,265

新增內容特點

  • 來源型態:喜马拉雅FM + 荔枝FM 口述音頻影評轉寫稿
  • 內容格式:ASR 轉寫 → 口语清洗(koushuqx 技能)→ 收錄為 wiki sources
  • 影片範圍:涵蓋中外經典 / 冷門 / 文藝片,與原有「我的影评」形成互補
  • 品質提醒:實體頁和概念頁為腳本自動生成,內容較簡略,建議後續用 LLM 精修


2026-06-24 增量 Ingest:補充 153 篇缺失來源頁

操作

發現約 153 篇原始文件缺少對應來源頁(sources/),涉及 大模型的影评(5篇)、我的影评(127篇)、电影背景(21篇)。使用 4 個並行 Agent + 1 個後續 Agent 批量補全。

處理結果

批次處理內容結果
Batch 1 (大模型影评+电影背景)26 文件24 sources + 7 entities + 12 concepts
Batch 2 (我的影评 part 1)42 文件4 sources(其餘已存在)
Batch 3 (我的影评 part 2)43 文件20 sources(其餘已存在)
Batch 4 (我的影评 part 3)42 文件0 sources(全部已存在)
Batch 5 (剩餘 57 文件)57 文件57 sources

清理

  • 刪除 18 個重複的舊格式來源頁(無 hash 版本,保留有 hash 的標準格式版本)

更新後 Wiki 統計

類別之前之後增長
原始 .md 文件601632+31
Sources601672+71
Entities743750+7
Concepts411423+12
總計1,7551,845+90

說明

  • 增量主要來自「电影背景」的新增文件(書章節級別拆分),以及「我的影评」中被跳過的文件
  • 部分來源頁使用簡化文件名(台灣專書章節),不影響功能使用
  • 來源頁文件名標準化為「含 hash 值」格式,已清理無 hash 的舊格式重複文件

已知問題與後續優化

  1. Sources 數量少於預期 ✅ 已修復(2026-06-24 補充完成)

  2. Entities 去重問題:部分影片可能在不同批次中被重複創建或合併。

    • 建議後續執行 Lint 檢查,清理孤立頁面和無效引用
  3. 導演國別分類:導演實體頁未統一添加國別標籤,可後續補全

  4. 來源頁文件名不一致:部分來源頁使用簡化文件名而非原始文件名,影響精確關聯匹配。

    • 涉及:台湾影视书章节(16個)、凡人修仙傳、四月三周兩天(喜馬拉雅)
    • 建議後續統一化處理

總耗時:約8分鐘(5個並行 Agent + 清理)