關於 Kimi K2 的一些筆記 - 我剛花了幾個小時,這樣你就不用了。這其中有些是推測,但在提示領域有什麼不是呢?所以: - 令人難以置信的模型。 - 但在代理提示時可能非常困難。 - 我的假設是,在複雜場景中,MoE 架構有時會將請求路由到那些在工具使用方面表現糟糕的專家,這在 "它確實剛剛有效" 的情況下是極其令人沮喪的。 - 如果你的提示恰好激活了創意寫作專家,這一點尤其如此! - 單個詞在這個模型中產生的影響要*大得多*,因為它們可以決定路由到哪些專家。 --> 在我的案例中,將特定的 MUST-RUN-TOOLs 包裹在 <TOOLS_TO_RUN> 標籤中似乎強制路由到能夠使用工具的專家。僅限於我的案例,但必須是這個確切的標籤。