LLMS.txt：AI時代的robots.txt來了，但主要玩家都還在觀望

# LLMS.txt：AI時代的robots.txt來了，但主要玩家都還在觀望上個月我在研究一個API文檔網站時，發現了一個有趣的現象。每次我問ChatGPT關於這個服務的具體功能時，它總是給出很模糊的回答，明明官網寫得清清楚楚，AI卻好像怎麼也找不到重點。後來我才知道，這個問題不只我遇到，許多開發者都在困擾同一件事：AI工具在理解網站內容時，經常抓不到最重要的資訊。直到我看到Jeremy Howard在2024年9月提出的LLMS.txt標準，我才意識到，我們可能正站在一個新時代的起點。 ![robots.txt vs llms.txt概念對比圖](https://hackmd.io/_uploads/SkdZqPfhle.jpg) ## 從門衛到導遊：為什麼robots.txt已經不夠用了你知道嗎，robots.txt這個小小的文件已經陪伴我們20多年了。它就像網站的門衛，告訴Google、Bing這些搜尋引擎：「這裡你們不能進，那裡可以看看。」這套機制在搜尋引擎時代運作得很好。但AI時代不一樣了。想像一下，假如你是一個聰明但有點急躁的朋友，需要快速了解一個網站在講什麼。robots.txt只能告訴你「禁止進入廚房」，但你真正需要的是「今日推薦菜單在這裡，招牌菜是這道」。這就是LLMS.txt想要解決的問題。 robots.txt是排除法：「不准去這裡」 LLMS.txt是推薦法：「最精華的在這裡」這個差異看起來很小，但影響很大。當ChatGPT想要回答使用者關於你網站的問題時，它不是像搜尋引擎那樣先索引你的整個網站，而是在推理的當下去找相關資訊。這時候，它更需要的是一張「精華內容地圖」。 ## Jeremy Howard的野心：讓AI更懂你的網站提到Jeremy Howard，你可能知道他是fast.ai的創辦人，也是讓深度學習變得平民化的重要推手。這個人有個特色：喜歡把複雜的技術變得簡單易用。LLMS.txt也不例外。他在Answer.AI的提案很簡單：在你的網站根目錄放一個LLMS.txt文件，用Markdown格式列出你網站最重要的內容。就像這樣： ```markdown # 我的API文件這個網站提供完整的開發者文檔和API參考。 ## 核心功能 - [快速開始指南](/docs/quickstart.md) - 五分鐘上手我們的服務 - [API參考](/docs/api-reference.md) - 完整的API文檔 - [常見問題](/docs/faq.md) - 開發者最常遇到的問題 ## 重要概念 - [認證機制](/docs/auth.md) - 如何安全地使用我們的API - [速率限制](/docs/rate-limits.md) - 理解API使用限制 ``` 注意到了嗎？每個連結後面都建議提供.md版本，比如`/docs/quickstart.md`。這樣AI就可以直接讀取乾淨的Markdown內容，而不用費力解析HTML。 ![LLMS.txt技術架構圖](https://hackmd.io/_uploads/SyCecPG2eg.jpg) 但這裡有個關鍵問題：AI工具需要主動支援這個標準，才能發揮作用。 ## 理想很美好，現實很骨感說到這裡，我得告訴你一個有點尷尬的事實：目前幾乎沒有主要AI公司正式採用LLMS.txt標準。 OpenAI？沒有。Google？也沒有。就連Anthropic，雖然他們自己的文檔網站有放LLMS.txt文件，但Claude也沒有官方支援這個標準。Meta就更不用說了。 ![LLMS.txt採用現況圖](https://hackmd.io/_uploads/Sy1gqDz2le.jpg) 這讓LLMS.txt陷入了一個尷尬的處境：概念很棒，實作很少。我花了不少時間研究這個現象，發現了幾個可能的原因： **AI公司的自主性考量** 大型AI公司通常偏好自己開發解決方案。他們可能正在研究類似的機制，但不一定想採用別人的標準。 **標準競爭問題** 除了LLMS.txt，市面上還有ai.txt、llms-full.txt等其他提案。當存在多個競爭標準時，大公司往往選擇觀望。 **商業模式考量** 坦白說，讓AI更精準地理解網站內容，對AI公司來說不一定是優先項目。他們可能更專注於提升模型本身的能力。但這不代表LLMS.txt沒有價值。 ## 誰在使用？早期採用者的經驗雖然大型AI公司還沒跟進，但一些開發者工具和文檔網站已經開始實驗LLMS.txt了。比如Cursor這個AI程式編輯器，他們的網站就有完整的LLMS.txt和llms-full.txt文件。Instructor這個Python庫的文檔網站也採用了這個標準。我自己也在幾個項目上試過。老實說，直接的效果很難量化，因為主流AI工具都還沒正式支援。但從內容組織的角度來看，創建LLMS.txt的過程確實讓我重新思考了什麼是網站的「精華內容」。有點像是強迫自己做一次內容盤點：如果AI只能讀10個頁面來了解我的網站，我會選哪10個？ ## 該不該現在就實作？我的建議面對這種「叫好不叫座」的新標準，到底該怎麼辦？我的建議是按網站類型來決定： ### API文檔和開發者工具：值得一試如果你維護的是API文檔、開發工具或技術產品網站，我認為值得實作LLMS.txt。原因有幾個： 1. 開發者是最有可能使用AI工具來理解你文檔的群體 2. 技術內容通常有明確的層次結構，很適合LLMS.txt的格式 3. 即使現在AI工具不支援，未來支援的機率也比較高 ### 一般商業網站：可以觀望對於一般的商業網站、電商或企業官網，我建議先觀望。投入時間創建LLMS.txt的投資報酬率目前還不明確。 ### 個人部落格：看興趣如果你像我一樣喜歡嘗試新技術，可以把LLMS.txt當作實驗來玩。搞不好哪天就派上用場了。 ## 競爭對手們：不只LLMS.txt一家在討論LLMS.txt的同時，我們也不能忽略其他類似的提案。 **ai.txt** 專注於版權和使用權控制，告訴AI工具哪些內容可以用於訓練或生成回答。 **llms-full.txt** 是LLMS.txt的加強版，直接把所有重要內容串接成一個大文件。這些標準都在試圖解決AI時代的網站內容管理問題，但方向略有不同。問題是，標準太多反而可能延遲採用速度。 ## 未來會怎樣？我的觀察我覺得LLMS.txt這個概念是對的，但實現的路徑可能會很曲折。短期來看（2025-2026年），我預期會看到更多競爭標準，可能會有一、兩個脫穎而出。一些小型AI工具或許會率先支援，作為差異化功能。中期（2027-2029年），如果使用者開始大量創建這些文件，主要AI公司可能會被迫表態。或者，他們可能會推出自己版本的解決方案。長期來看，我認為某種形式的「AI內容指引」機制會成為網路基礎設施的一部分。但不一定是LLMS.txt這個名字。 ## 寫在最後：新時代需要新協議回到一開始我遇到的問題：AI工具理解網站內容的能力確實需要改善。LLMS.txt提供了一個思路，雖然目前還沒有得到主流支援，但它代表的方向是正確的。就像20年前robots.txt解決了搜尋引擎時代的問題一樣，AI時代也需要新的協議來管理人類與機器的互動。LLMS.txt可能不是最終答案，但它至少開啟了這個討論。對於我們這些內容創作者和網站維護者來說，提早了解這些趨勢總是好事。即使LLMS.txt最終沒有被廣泛採用，思考「如何讓AI更好地理解我的內容」這個問題本身就很有價值。畢竟，AI不會自己消失，而我們的內容遲早需要和AI友好相處。 --- ## 參考資料 ### 核心文檔與官方資料 1. **Answer.AI Official Proposal** - "/llms.txt—a proposal to provide information to help LLMs use your website at inference time" [https://www.answer.ai/posts/2024-09-03-llmstxt.html](https://www.answer.ai/posts/2024-09-03-llmstxt.html) 2. **LLMS.txt Official Website** - "The /llms.txt file – llms-txt" [https://llmstxt.org/](https://llmstxt.org/) 3. **GitHub Repository** - "AnswerDotAI/llms-txt: The /llms.txt file, helping language models use your website" [https://github.com/AnswerDotAI/llms-txt](https://github.com/AnswerDotAI/llms-txt) ### 行業分析與報導 4. **Search Engine Land** - "Meet llms.txt, a proposed standard for AI website content crawling" [https://searchengineland.com/llms-txt-proposed-standard-453676](https://searchengineland.com/llms-txt-proposed-standard-453676) 5. **ScaleMath** - "LLMs.txt: The Emerging Standard Reshaping AI-First Content Strategy" [https://scalemath.com/blog/llms-txt/](https://scalemath.com/blog/llms-txt/) 6. **PPC.Land** - "llms.txt adoption stalls as major AI platforms ignore proposed standard" [https://ppc.land/llms-txt-adoption-stalls-as-major-ai-platforms-ignore-proposed-standard/](https://ppc.land/llms-txt-adoption-stalls-as-major-ai-platforms-ignore-proposed-standard/) 7. **Overdrive Interactive** - "LLMs.txt: The New Standard for AI Crawling" [https://www.ovrdrv.com/insights/llms-txt-the-new-standard-for-ai-crawling](https://www.ovrdrv.com/insights/llms-txt-the-new-standard-for-ai-crawling) ### 技術實作與教學 8. **Semrush Blog** - "What Is LLMs.txt & Should You Use It?" [https://www.semrush.com/blog/llms-txt/](https://www.semrush.com/blog/llms-txt/) 9. **Atlantic BT** - "llms.txt for AI Content Optimization" [https://www.atlanticbt.com/software-development/llms-txt-for-ai-content-optimization/](https://www.atlanticbt.com/software-development/llms-txt-for-ai-content-optimization/) 10. **Bluehost** - "What Is llms.txt? How the New AI Standard Works (2025 Guide)" [https://www.bluehost.com/blog/what-is-llms-txt/](https://www.bluehost.com/blog/what-is-llms-txt/) ### 早期採用案例 11. **Instructor Documentation** - "Instructor Adopts llms.txt: Making Documentation AI-Friendly" [https://python.useinstructor.com/blog/2025/03/19/instructor-adopts-llms-txt/](https://python.useinstructor.com/blog/2025/03/19/instructor-adopts-llms-txt/) 12. **Anthropic Claude Docs** - 實際llms.txt實作範例 [https://docs.anthropic.com/llms.txt](https://docs.anthropic.com/llms.txt) ### 技術比較與分析 13. **Medium - Francisco Kemeny** - "Best Practices for AI-Oriented robots.txt and llms.txt Configuration" [https://medium.com/@franciscokemeny/best-practices-for-ai-oriented-robots-txt-and-llms-txt-configuration-be564ba5a6bd](https://medium.com/@franciscokemeny/best-practices-for-ai-oriented-robots-txt-and-llms-txt-configuration-be564ba5a6bd) 14. **Medium - Harisudhan** - "llms.txt vs robots.txt" [https://medium.com/@speaktoharisudhan/llm-txt-vs-robots-txt-bb22c9739434](https://medium.com/@speaktoharisudhan/llm-txt-vs-robots-txt-bb22c9739434) 15. **Originality.ai** - "LLMs.txt Tracking Study and Live Dashboard" [https://originality.ai/blog/llms-txt-tracking-study](https://originality.ai/blog/llms-txt-tracking-study) ### Jeremy Howard 背景資料 16. **Wikipedia** - "Jeremy Howard (entrepreneur)" [https://en.wikipedia.org/wiki/Jeremy_Howard_(entrepreneur)](https://en.wikipedia.org/wiki/Jeremy_Howard_(entrepreneur)) 17. **Fast.ai Personal Website** - Jeremy Howard的個人網站 [https://jeremy.fast.ai/](https://jeremy.fast.ai/) --- *本文基於2024年底至2025年初的最新資訊撰寫，所有引用資料均為公開可取得的資源。由於AI領域發展快速，建議讀者關注相關標準的最新發展。* *文章配圖由Sora AI生成，專為本文技術內容說明而設計。*