# LLMS.txt:AI時代的robots.txt來了,但主要玩家都還在觀望 上個月我在研究一個API文檔網站時,發現了一個有趣的現象。每次我問ChatGPT關於這個服務的具體功能時,它總是給出很模糊的回答,明明官網寫得清清楚楚,AI卻好像怎麼也找不到重點。後來我才知道,這個問題不只我遇到,許多開發者都在困擾同一件事:AI工具在理解網站內容時,經常抓不到最重要的資訊。 直到我看到Jeremy Howard在2024年9月提出的LLMS.txt標準,我才意識到,我們可能正站在一個新時代的起點。 ![robots.txt vs llms.txt概念對比圖](https://hackmd.io/_uploads/SkdZqPfhle.jpg) ## 從門衛到導遊:為什麼robots.txt已經不夠用了 你知道嗎,robots.txt這個小小的文件已經陪伴我們20多年了。它就像網站的門衛,告訴Google、Bing這些搜尋引擎:「這裡你們不能進,那裡可以看看。」這套機制在搜尋引擎時代運作得很好。 但AI時代不一樣了。 想像一下,假如你是一個聰明但有點急躁的朋友,需要快速了解一個網站在講什麼。robots.txt只能告訴你「禁止進入廚房」,但你真正需要的是「今日推薦菜單在這裡,招牌菜是這道」。這就是LLMS.txt想要解決的問題。 robots.txt是排除法:「不准去這裡」 LLMS.txt是推薦法:「最精華的在這裡」 這個差異看起來很小,但影響很大。當ChatGPT想要回答使用者關於你網站的問題時,它不是像搜尋引擎那樣先索引你的整個網站,而是在推理的當下去找相關資訊。這時候,它更需要的是一張「精華內容地圖」。 ## Jeremy Howard的野心:讓AI更懂你的網站 提到Jeremy Howard,你可能知道他是fast.ai的創辦人,也是讓深度學習變得平民化的重要推手。這個人有個特色:喜歡把複雜的技術變得簡單易用。LLMS.txt也不例外。 他在Answer.AI的提案很簡單:在你的網站根目錄放一個LLMS.txt文件,用Markdown格式列出你網站最重要的內容。就像這樣: ```markdown # 我的API文件 這個網站提供完整的開發者文檔和API參考。 ## 核心功能 - [快速開始指南](/docs/quickstart.md) - 五分鐘上手我們的服務 - [API參考](/docs/api-reference.md) - 完整的API文檔 - [常見問題](/docs/faq.md) - 開發者最常遇到的問題 ## 重要概念 - [認證機制](/docs/auth.md) - 如何安全地使用我們的API - [速率限制](/docs/rate-limits.md) - 理解API使用限制 ``` 注意到了嗎?每個連結後面都建議提供.md版本,比如`/docs/quickstart.md`。這樣AI就可以直接讀取乾淨的Markdown內容,而不用費力解析HTML。 ![LLMS.txt技術架構圖](https://hackmd.io/_uploads/SyCecPG2eg.jpg) 但這裡有個關鍵問題:AI工具需要主動支援這個標準,才能發揮作用。 ## 理想很美好,現實很骨感 說到這裡,我得告訴你一個有點尷尬的事實:目前幾乎沒有主要AI公司正式採用LLMS.txt標準。 OpenAI?沒有。Google?也沒有。就連Anthropic,雖然他們自己的文檔網站有放LLMS.txt文件,但Claude也沒有官方支援這個標準。Meta就更不用說了。 ![LLMS.txt採用現況圖](https://hackmd.io/_uploads/Sy1gqDz2le.jpg) 這讓LLMS.txt陷入了一個尷尬的處境:概念很棒,實作很少。 我花了不少時間研究這個現象,發現了幾個可能的原因: **AI公司的自主性考量** 大型AI公司通常偏好自己開發解決方案。他們可能正在研究類似的機制,但不一定想採用別人的標準。 **標準競爭問題** 除了LLMS.txt,市面上還有ai.txt、llms-full.txt等其他提案。當存在多個競爭標準時,大公司往往選擇觀望。 **商業模式考量** 坦白說,讓AI更精準地理解網站內容,對AI公司來說不一定是優先項目。他們可能更專注於提升模型本身的能力。 但這不代表LLMS.txt沒有價值。 ## 誰在使用?早期採用者的經驗 雖然大型AI公司還沒跟進,但一些開發者工具和文檔網站已經開始實驗LLMS.txt了。 比如Cursor這個AI程式編輯器,他們的網站就有完整的LLMS.txt和llms-full.txt文件。Instructor這個Python庫的文檔網站也採用了這個標準。 我自己也在幾個項目上試過。老實說,直接的效果很難量化,因為主流AI工具都還沒正式支援。但從內容組織的角度來看,創建LLMS.txt的過程確實讓我重新思考了什麼是網站的「精華內容」。 有點像是強迫自己做一次內容盤點:如果AI只能讀10個頁面來了解我的網站,我會選哪10個? ## 該不該現在就實作?我的建議 面對這種「叫好不叫座」的新標準,到底該怎麼辦?我的建議是按網站類型來決定: ### API文檔和開發者工具:值得一試 如果你維護的是API文檔、開發工具或技術產品網站,我認為值得實作LLMS.txt。原因有幾個: 1. 開發者是最有可能使用AI工具來理解你文檔的群體 2. 技術內容通常有明確的層次結構,很適合LLMS.txt的格式 3. 即使現在AI工具不支援,未來支援的機率也比較高 ### 一般商業網站:可以觀望 對於一般的商業網站、電商或企業官網,我建議先觀望。投入時間創建LLMS.txt的投資報酬率目前還不明確。 ### 個人部落格:看興趣 如果你像我一樣喜歡嘗試新技術,可以把LLMS.txt當作實驗來玩。搞不好哪天就派上用場了。 ## 競爭對手們:不只LLMS.txt一家 在討論LLMS.txt的同時,我們也不能忽略其他類似的提案。 **ai.txt** 專注於版權和使用權控制,告訴AI工具哪些內容可以用於訓練或生成回答。 **llms-full.txt** 是LLMS.txt的加強版,直接把所有重要內容串接成一個大文件。 這些標準都在試圖解決AI時代的網站內容管理問題,但方向略有不同。問題是,標準太多反而可能延遲採用速度。 ## 未來會怎樣?我的觀察 我覺得LLMS.txt這個概念是對的,但實現的路徑可能會很曲折。 短期來看(2025-2026年),我預期會看到更多競爭標準,可能會有一、兩個脫穎而出。一些小型AI工具或許會率先支援,作為差異化功能。 中期(2027-2029年),如果使用者開始大量創建這些文件,主要AI公司可能會被迫表態。或者,他們可能會推出自己版本的解決方案。 長期來看,我認為某種形式的「AI內容指引」機制會成為網路基礎設施的一部分。但不一定是LLMS.txt這個名字。 ## 寫在最後:新時代需要新協議 回到一開始我遇到的問題:AI工具理解網站內容的能力確實需要改善。LLMS.txt提供了一個思路,雖然目前還沒有得到主流支援,但它代表的方向是正確的。 就像20年前robots.txt解決了搜尋引擎時代的問題一樣,AI時代也需要新的協議來管理人類與機器的互動。LLMS.txt可能不是最終答案,但它至少開啟了這個討論。 對於我們這些內容創作者和網站維護者來說,提早了解這些趨勢總是好事。即使LLMS.txt最終沒有被廣泛採用,思考「如何讓AI更好地理解我的內容」這個問題本身就很有價值。 畢竟,AI不會自己消失,而我們的內容遲早需要和AI友好相處。 --- ## 參考資料 ### 核心文檔與官方資料 1. **Answer.AI Official Proposal** - "/llms.txt—a proposal to provide information to help LLMs use your website at inference time" [https://www.answer.ai/posts/2024-09-03-llmstxt.html](https://www.answer.ai/posts/2024-09-03-llmstxt.html) 2. **LLMS.txt Official Website** - "The /llms.txt file – llms-txt" [https://llmstxt.org/](https://llmstxt.org/) 3. **GitHub Repository** - "AnswerDotAI/llms-txt: The /llms.txt file, helping language models use your website" [https://github.com/AnswerDotAI/llms-txt](https://github.com/AnswerDotAI/llms-txt) ### 行業分析與報導 4. **Search Engine Land** - "Meet llms.txt, a proposed standard for AI website content crawling" [https://searchengineland.com/llms-txt-proposed-standard-453676](https://searchengineland.com/llms-txt-proposed-standard-453676) 5. **ScaleMath** - "LLMs.txt: The Emerging Standard Reshaping AI-First Content Strategy" [https://scalemath.com/blog/llms-txt/](https://scalemath.com/blog/llms-txt/) 6. **PPC.Land** - "llms.txt adoption stalls as major AI platforms ignore proposed standard" [https://ppc.land/llms-txt-adoption-stalls-as-major-ai-platforms-ignore-proposed-standard/](https://ppc.land/llms-txt-adoption-stalls-as-major-ai-platforms-ignore-proposed-standard/) 7. **Overdrive Interactive** - "LLMs.txt: The New Standard for AI Crawling" [https://www.ovrdrv.com/insights/llms-txt-the-new-standard-for-ai-crawling](https://www.ovrdrv.com/insights/llms-txt-the-new-standard-for-ai-crawling) ### 技術實作與教學 8. **Semrush Blog** - "What Is LLMs.txt & Should You Use It?" [https://www.semrush.com/blog/llms-txt/](https://www.semrush.com/blog/llms-txt/) 9. **Atlantic BT** - "llms.txt for AI Content Optimization" [https://www.atlanticbt.com/software-development/llms-txt-for-ai-content-optimization/](https://www.atlanticbt.com/software-development/llms-txt-for-ai-content-optimization/) 10. **Bluehost** - "What Is llms.txt? How the New AI Standard Works (2025 Guide)" [https://www.bluehost.com/blog/what-is-llms-txt/](https://www.bluehost.com/blog/what-is-llms-txt/) ### 早期採用案例 11. **Instructor Documentation** - "Instructor Adopts llms.txt: Making Documentation AI-Friendly" [https://python.useinstructor.com/blog/2025/03/19/instructor-adopts-llms-txt/](https://python.useinstructor.com/blog/2025/03/19/instructor-adopts-llms-txt/) 12. **Anthropic Claude Docs** - 實際llms.txt實作範例 [https://docs.anthropic.com/llms.txt](https://docs.anthropic.com/llms.txt) ### 技術比較與分析 13. **Medium - Francisco Kemeny** - "Best Practices for AI-Oriented robots.txt and llms.txt Configuration" [https://medium.com/@franciscokemeny/best-practices-for-ai-oriented-robots-txt-and-llms-txt-configuration-be564ba5a6bd](https://medium.com/@franciscokemeny/best-practices-for-ai-oriented-robots-txt-and-llms-txt-configuration-be564ba5a6bd) 14. **Medium - Harisudhan** - "llms.txt vs robots.txt" [https://medium.com/@speaktoharisudhan/llm-txt-vs-robots-txt-bb22c9739434](https://medium.com/@speaktoharisudhan/llm-txt-vs-robots-txt-bb22c9739434) 15. **Originality.ai** - "LLMs.txt Tracking Study and Live Dashboard" [https://originality.ai/blog/llms-txt-tracking-study](https://originality.ai/blog/llms-txt-tracking-study) ### Jeremy Howard 背景資料 16. **Wikipedia** - "Jeremy Howard (entrepreneur)" [https://en.wikipedia.org/wiki/Jeremy_Howard_(entrepreneur)](https://en.wikipedia.org/wiki/Jeremy_Howard_(entrepreneur)) 17. **Fast.ai Personal Website** - Jeremy Howard的個人網站 [https://jeremy.fast.ai/](https://jeremy.fast.ai/) --- *本文基於2024年底至2025年初的最新資訊撰寫,所有引用資料均為公開可取得的資源。由於AI領域發展快速,建議讀者關注相關標準的最新發展。* *文章配圖由Sora AI生成,專為本文技術內容說明而設計。*