Perutean Lookahead untuk LLM Mengusulkan Lookahead, kerangka kerja perutean untuk memungkinkan perutean yang lebih terinformasi tanpa inferensi penuh. Mencapai peningkatan kinerja rata-rata 7,7% dibandingkan yang canggih. Inilah mengapa ini berhasil: Lookahead adalah kerangka kerja baru untuk perutean dalam sistem multi-LLM, memutuskan model mana yang harus menangani setiap kueri. Ide kunci: Alih-alih perutean hanya berdasarkan kueri input, Lookahead memprediksi representasi laten dari respons potensial, memberikannya "mengintip" apa yang akan dikatakan setiap model tanpa menghasilkan teks sepenuhnya. Keputusan yang lebih cerdas: Prediksi sadar respons ini membuat perutean lebih sensitif terhadap konteks dan akurat, terutama untuk tugas terbuka atau berbasis preferensi. Pembelajaran yang efisien: Ini sangat efisien data, mencapai kinerja penuh dengan hanya 16% data pelatihan dibandingkan dengan garis dasar, dan mempelajari representasi semantik yang lebih baik untuk perutean. Desain ganda: Bekerja dengan varian LM kausal dan bertopeng, menggeneralisasi di beberapa arsitektur. Kinerja: Mengungguli metode perutean canggih di tujuh tolok ukur, dengan keuntungan terbesar dalam tugas kreatif yang bernuansa. Lookahead menunjukkan bahwa menambahkan pandangan ke depan generatif yang ringan dapat membuat sistem multi-model lebih adaptif dan hemat biaya tanpa memerlukan inferensi model penuh.