algunas notas sobre Kimi K2 - Acabo de pasar horas para que tú no tengas que hacerlo. Algo de esto es especulación, pero ¿qué no está en Prompt-land? así que:
- Modelo increíble.
- pero puede ser extremadamente difícil de solicitar a nivel operativo
- mi hipótesis es que la arquitectura del MoE en escenarios complejos a veces se dirigirá a expertos que son terribles en el uso de herramientas, lo cual es sumamente frustrante cuando "literalmente simplemente funcionó"
- ¡Esto es especialmente cierto si activa a los expertos en escritura creativa con su mensaje!
- Las palabras sueltas marcan una *diferencia mucho mayor* con este modelo, ya que pueden determinar a qué se dirigen las cosas expertas.
--> en mi caso, envolver una cadencia específica de MUST-RUN-TOOLs simplemente en <TOOLS_TO_RUN> etiquetas parece forzar el enrutamiento a expertos capaces de herramientas. Solo mi caso, pero tenía que ser esta etiqueta exacta.