Czym jest Absolute Zero Reasoner – AZR?
Absolute Zero Reasoner (AZR), opracowany przez naukowców z Uniwersytetu Tsinghua, Pekińskiego Instytutu Ogólnej Sztucznej Inteligencji oraz Uniwersytetu Stanu Pensylwania, to model sztucznej inteligencji zaprojektowany z myślą o samodzielnym rozwijaniu zdolności rozumowania. Jego fundamentalną cechą jest zdolność do autonomicznego tworzenia dla siebie zadań, a następnie ich rozwiązywania. Co istotne, proces nauki AZR opiera się na weryfikacji poprawności tych rozwiązań za pomocą obiektywnego, zewnętrznego mechanizmu – w tym przypadku egzekutora kodu – i nie wymaga do tego żadnych danych treningowych przygotowanych wcześniej przez człowieka. Model ten działa w ramach paradygmatu RLVR (Reinforcement Learning from Verifiable Reward), który nazwano “Absolute Zero”, co oznacza, że jego rozwój napędzany jest przez system nagród bazujący na sprawdzalnych wynikach własnej pracy. Brzmi skomplikowanie? Już tłumaczę!
AZR potrafi autonomicznie generować zadania, a następnie je rozwiązywać, maksymalizując przy tym własny postęp w nauce. Co najważniejsze – robi to bez potrzeby korzystania z jakichkolwiek zewnętrznych danych, przygotowanych przez ludzi. To trochę tak, jakby dać AI piaskownicę i łopatkę, a ono samo zaczęłoby budować coraz bardziej skomplikowane zamki, ucząc się na każdym ziarenku piasku.
d-tags




