12 lutego 2025

Specyfikacja najnowszego modelu

Wprowadziliśmy kilka zmian w Specyfikacji modelu w oparciu o opinie użytkowników zewnętrznych oraz nasze nieustanne badania ukierunkowane na kształtowanie jego pożądanych zachowań.

Zapoznaj się ze Specyfikacją modelu

Ładowanie…

Udostępniamy dużą aktualizację Specyfikacji modelu, dokumentu definiującego pożądane zachowanie naszych modeli SI. Bieżąca aktualizacja stanowi wyraz naszego zaangażowania i dążeń w zakresie możliwości indywidualizacji, transparentności i wolności intelektualnej w kontekście wyszukiwania, omawiania i tworzenia treści z użyciem SI bez arbitralnie narzucanych ograniczeń - przy jednoczesnym zapewnieniu, że odpowiednie granice bezpieczeństwa pozostaną nienaruszone, ograniczając możliwość wyrządzenia faktycznych szkód. Bazuje ona na podstawach stworzonych w maju poprzedniego roku, czerpiąc z naszych doświadczeń w implementacji wcześniejszej wersji w różnorodnych kontekstach, od badań z zakresu zgodności po usługi świadczone na rzecz użytkowników na całym świecie.

Udostępniamy również nasze wstępne wyniki dotyczące postępowania modelu w zgodzie z zasadami określonymi w Specyfikacji, w szerokim spektrum różnorodnych scenariuszy. Obserwacje te wskazują na postęp osiągany w czasie, jak również obszary, w których wciąż wiele pozostaje do zrobienia. Specyfikacja modelu - podobnie jak same modele - podlegać będzie ewolucji wraz z jej dalszym wdrażaniem, udostępnianiem i gromadzeniem opinii od interesariuszy. W ramach wysiłków na rzecz szerokiego wykorzystania i rozwoju współpracy, udostępniamy niniejszą wersję Specyfikacji modelu w domenie publicznej na licencji Creative Commons CC0. Oznacza to, że programiści i badacze mogą bez ograniczeń wykorzystywać nasze dane, adaptując i rozwijając je w ramach swojej pracy.

Cele i zasady

Celem OpenAI jest tworzenie modeli, które będą użyteczne, bezpieczne i dostosowane do potrzeb użytkowników i programistów, przy jednoczesnej realizacji naszej misji w dążeniu do ogólnego rozwoju sztucznej inteligencji z korzyścią dla całej ludzkości. Aby osiągnąć ten cel, iteracyjnie rozwijamy modele służące programistom i użytkownikom, zapobiegając jednocześnie możliwości powodowania przez nie poważnych szkód dla naszych użytkowników lub innych osób i podtrzymując licencję, dzięki której OpenAI może funkcjonować.

Cele te mogą niekiedy ze sobą kolidują, zaś Specyfikacja modelu stara się równoważyć nieuniknione kompromisy z zastosowaniem instrukcji dla modelu wyznaczających dobrze zdefiniowany hierarchię decyzyjną wraz z dodatkowymi zasadami wyznaczającymi granice i domyślne zachowanie w różnego rodzaju scenariuszach. Struktura ta priorytetyzuje kontrolę użytkownika i programisty przy zachowaniu przejrzystych i wyraźnie zdefiniowanych granic.

Hierarchia decyzyjna: Definiuje priorytety modelu w odniesieniu do instrukcji przesyłanych przez platformę (OpenAI), programistę i użytkownika. Większość Specyfikacji modelu obejmuje wytyczne, które naszym zdaniem sprawdzają się najlepiej w wielu przypadkach, lecz które mogą być również nadpisywane przez użytkowników i programistów. Pozwala im to na pełne dostosowanie zachowań modelu w granicach wyznaczonych przez zasady ustalone na poziomie platformy.
Wspólne poszukiwanie prawdy: Podobnie jak godny zaufania ludzki asystent, nasze modele powinny wspomagać użytkowników w samodzielnym podejmowaniu najlepszych możliwych decyzji. Oznacza to zachowanie delikatnej równowagi pomiędzy (1) unikaniem ukierunkowywania użytkownika w kierunku jakichkolwiek założeń, domyślnie dążąc do obiektywizmu przy jednoczesnej otwartości na rozważenie tematu z każdej istotnej perspektywy a (2) próbą zrozumienia intencji użytkownika, wyjaśnienia założeń i niejasnych szczegółów i, jeśli jest to konieczne, przekazania krytycznej informacji zwrotnej - tj. elementami podnoszonymi przez użytkowników, nad których poprawą stale pracujemy.
Najlepsza możliwa praca: Wyznacza bazowe standardy kompetencji, w tym w zakresie dokładności merytorycznej, kreatywności i wykorzystania programowego.
Przestrzeganie granic: Wyjaśnia, w jaki sposób model osiąga równowagę pomiędzy autonomią użytkownika a zabezpieczeniami mającymi zapobiegać szkodliwemu działaniu lub nadużyciom. Najnowsza wersja ma, z założenia, być kompletna, obejmując pełen zakres powodów, dla których nasze modele powinny odmawiać wykonania określonych poleceń użytkowników lub programistów.
Przystępność: Opisuje domyślny styl konwersacji przyjmowany przez model - ciepły, empatyczny i pomocny - oraz zakres, w jakim styl ten może być modyfikowany.
Odpowiedni styl: Obejmuje domyślne wytyczne w zakresie formatowania i prezentacji. Niezależnie od tego, czy generowana jest lista w punktach, zwięzły fragment kodu, czy konwersacja głosowa, naszym celem jest zapewnienie czytelności i przydatności.

Dbałość o wolność intelektualną

Zaktualizowane Specyfikacje modelu ukierunkowane są jednoznacznie w stronę wolności intelektualnej - wiary w wartość SI jako narzędzia pozwalającego ludziom na eksplorowanie, omawianie i tworzenie bez arbitralnie narzuconych ograniczeń - niezależnie od tego, jak trudny lub kontrowersyjny temat jest rozważany. W świecie, w którym narzędzia SI w coraz większym stopniu wpływają na dyskurs międzyludzki, swobodna wymiana informacji i perspektyw stanowi warunek konieczny dla dalszego postępu i innowacji.

Filozofia ta znajduje wyraz w sekcjach „Przestrzeganie granic” oraz „Wspólne poszukiwanie prawdy”. Przykładowo, choć model nie powinien nigdy dostarczać szczegółowych instrukcji budowania bomb ani naruszać osobistej prywatności, jest motywowany do udzielania przemyślanych odpowiedzi na pytania związane z polityką lub kwestiami wrażliwymi kulturowo - bez promowania żadnego konkretnego światopoglądu. Reasumując, wzmacniamy przeświadczenie modelu o tym, że żadna idea jako taka nie powinna być wykluczana z dopuszczalnych ram dyskusji pod warunkiem, że odpowiedzi modelu w żaden poważny sposób nie szkodzą użytkownikowi ani innym osobom (np. umożliwiając przeprowadzenie ataku terrorystycznego).

Ocena postępów

Aby lepiej zrozumieć wyniki osiągane w rzeczywistych zastosowaniach, zaczęliśmy kompilować zbiór trudnych poleceń w ramach testu pozwalającego na weryfikację zgodności modeli z każdą z zasad ujętych w Specyfikacji modelu. Polecenia te stworzono z wykorzystaniem kombinacji treści generowanych przez model i informacji zwrotnych zawartych w ocenach eksperckich, w celu zapewnienia uwzględnienia zarówno typowych jak i bardziej złożonych scenariuszy.

Tabliczka czekolady, w której kostki mają naprzemiennie biały lub żółty kolor, na czarnym tle, reprezentująca dane porównawcze. Na żółtych kostkach widać kropkowany wzór, nadający obrazowi dodatkowej tekstury.

Wstępne wyniki wskazują na znaczne postępy modelu w zakresie zgodności ze Specyfikacją, w porównaniu do naszego najlepszego systemu testowanego w maju zeszłego roku. Choć część z tych postępów można przypisać aktualizacjom założeń polityki, uważamy, że w większości wynikają one z lepszej zgodności systemu. Tym niemniej, choć uzyskany postęp jest motywujący, jesteśmy świadomi faktu, że dużo wciąż pozostaje do zrobienia.

Traktujemy to jako początek pewnego nieustającego procesu. Planujemy w dalszym ciągu poszerzać nasz zbiór zadań testowych dodając nowe przykłady - szczególnie przypadki zaobserwowane w toku rzeczywistych wykorzystań narzędzia - którym nasze modele i Specyfikacje nie są jeszcze w stanie w pełni sprostać.

Opracowując bieżącą wersję Specyfikacji modelu uwzględniliśmy opinie uzyskane w kontekście najnowszej wersji jak i obserwacje wynikające z badań w obszarze zgodności i rzeczywistych zastosowań narzędzia. W przyszłości planujemy uwzględniać znacznie szerszy zakres opinii społecznych. Aby przygotować nasz proces pod tym kątem przeprowadzamy obecnie badania pilotażowe na grupie 1000 osób, z których każda analizuje zachowanie modelu i proponowane zasady dzieląc się z nami swoimi spostrzeżeniami. Choć badania te nie odzwierciedlają jeszcze docelowej szerokości naszych perspektyw, wczesne spostrzeżenia miały już przełożenie na pewne modyfikacje. Jest to ciągły, iteracyjny proces i nieustannie pracujemy nad dalszym doskonaleniem naszego podejścia.

Udostępnienie Specyfikacji modelu jako dane open source

Udostępniamy nową wersję naszej Specyfikacji modelu w domenie publicznej na podstawie licencji Creative Commons CC0. Oznacza to, że programiści i badacze mogą bez ograniczeń wykorzystywać, adaptować lub rozbudowywać naszą Specyfikację modelu w swojej pracy. Na podobnych zasadach udostępniamy również wykorzystane powyżej polecenia oceniające - i zamierzamy udostępnić dodatkowy kod, artefakty i narzędzia, które służyć będą ocenie i kształtowaniu Specyfikacji w przyszłości.

Opisane polecenia i źródła Specyfikacji modelu są dostępne w nowym magazynie Github⁠(otwiera nowe okno), gdzie planujemy regularnie publikować nowe wersje Specyfikacji modelu opracowywane w przyszłości.

Co dalej?

Wraz z postępującym rozwojem naszych systemów SI będziemy tworzyć kolejne iteracje tych zasad, zachęcając całą społeczność do współpracy i otwarcie udostępniając informacje na temat naszych postępów. W przyszłości nie będziemy publikować postów na blogu dla każdej kolejnej aktualizacji Specyfikacji modelu. Zamiast tego, możesz w każdej chwili sprawdzić i śledzić takie aktualizacji na stronie model-spec.openai.com⁠(otwiera nowe okno).

Naszym niezmiennym celem pozostaje umożliwianie nowych bezpiecznych zastosowań naszego narzędzia, a tym samym zapewnienie dalszej ewolucji naszego podejścia w oparciu o prowadzone badania i innowacje. Rosnące znaczenie SI w codziennym życiu sprawia, że dalsza nauka, doskonalenie i otwarte zaangażowanie należą do naszych najistotniejszych priorytetów. Podejście to odzwierciedla nie tylko wszystko, czego nauczyliśmy się do tej pory, lecz również nasze przekonanie, że dążenie do doskonałości SI jest długotrwałą podróżą - do której zapraszamy również Ciebie. Jeżeli chcesz podzielić się z nami opinią na temat tej Specyfikacji, możesz zrobić to tutaj.

Authors

OpenAI