Dobrze, wygląda na to, że to już zostało opublikowane w notatkach wydania (sprawdziłem), więc... (uwaga: testowanie modeli jest częścią mojej pracy, a ten post nie jest w żaden sposób sponsorowany przez OpenAI): Zostałem zaproszony do testowania alfa GPT-5.1 Pro razem z ekspertami w dziedzinie robotyki, matematyki, immunologii, medycyny, muzyki i nie tylko. Moim głównym obszarem zainteresowania były badania komercyjne w naukach przyrodniczych oraz strategia i kilka osobistych przypadków użycia. Po kilku dniach korzystania z GPT-5.1 Pro, uważam, że jest bardziej jak ludzki ekspert w danej dziedzinie niż GPT-5 Pro, z jaśniejszym stylem pisania, lepszym osądem, mniejszą ilością dygresji, silniejszą syntezą i bardziej emocjonalnie świadomymi odpowiedziami. Porównałem GPT-5.1 Pro z GPT-5 Pro w zadaniach roboczych, takich jak synteza literatury naukowej, planowanie wprowadzenia leku na rynek i analiza mediów społecznościowych. Próbowałem go również do osobistego planowania finansowego, a nawet do prowadzenia dziennika. Był: - Bardziej rygorystyczny i kompleksowy w badaniach i planowaniu. - Silniejszy w rozumowaniu. - Lepszy w trzymaniu się tematu i unikaniu dygresji (i przynajmniej w jednym przypadku, związanych z tym błędów). - O wiele jaśniejszy, bardziej pewny siebie, bardziej empatyczny w swoim stylu komunikacji. Znając skupienie OpenAI na wydajności w rzeczywistym świecie (np. GDPval) i doniesienia o zatrudnianiu ekspertów w dziedzinach takich jak finanse, myślę, że ludzka ekspertyza w danej dziedzinie jest dokładnie tym, do czego dążą, a z GPT-5.1 Pro zbliżają się do celu. To powiedziawszy, nie jest lepszy we wszystkim. Wciąż ma problemy z tworzeniem profesjonalnej jakości prezentacji i arkuszy kalkulacyjnych Excel, co jest zauważalną słabością modeli OpenAI, nad którą jestem pewien, że pracują, aby to naprawić. I zauważyłem, że przynajmniej jeden tester stwierdził, że model ostrożnie unikał zajmowania się znanymi otwartymi problemami w dziedzinach STEM, wybierając zamiast tego wyjaśnienie, dlaczego są to otwarte problemy. Ogólnie rzecz biorąc, gdybym miał to ilościowo ocenić, powiedziałbym, że to skok o 10-15% w porównaniu do GPT-5 Pro w zakresie rzeczy, do których go używam. Wydaje się, że to krok w kierunku modeli, które myślą i komunikują się bardziej jak prawdziwi koledzy, z lepszą ekspertyzą w danej dziedzinie, intuicją i osądem, a także zwiększoną empatią i umiejętnościami komunikacyjnymi. To dobrze wróży dla AI, które będzie mogło wykonywać jeszcze bardziej wpływową pracę w 2026 roku.