AI મોડલ્સમાં ગોબ્લિન્સ આઉટપુટ્સ કેવી રીતે ફેલાય છે: GPT-5 વર્તનમાં વ્યક્તિત્વ-પ્રેરિત વિચિત્રતા પાછળની સમયરેખા, મૂળ કારણો અને સુધારા.
જાણો કે OpenAI નું Model Spec મોડલ વર્તન માટે જાહેર ફ્રેમવર્ક તરીકે કેવી રીતે કાર્ય કરે છે, અને AI સિસ્ટમો આગળ વધે તેમ સુરક્ષા, વપરાશકર્તા સ્વતંત્રતા અને જવાબદારી વચ્ચે સંતુલન કેવી રીતે જાળવે છે.
OpenAI આંતરિક કોડિંગ એજન્ટમાં મિસઅલાઇનમેન્ટનો અભ્યાસ કરવા ચેન-ઓફ-થોટ મોનિટરિંગ કેવી રીતે ઉપયોગ કરે છે. જોખમ શોધવા અને AI સુરક્ષા રક્ષણોને મજબૂત બનાવવા માટે વાસ્તવિક ઉપયોગનું વિશ્લેષણ કરે છે.
IH-Challenge મોડલોને વિશ્વસનીય સૂચનાઓને પ્રાથમિકતા આપવાનું શીખવે છે, જેથી instruction hierarchy, safety steerability અને prompt injection હુમલાઓ સામે પ્રતિરોધમાં સુધારો થાય છે.
OpenAI CoT-Control રજૂ કરે છે અને શોધે છે કે રિઝનિંગ મોડેલો તેમની ચેન-ઓફ-થોટને નિયંત્રિત કરવામાં સંઘર્ષ કરે છે, જે AI સલામતીના સુરક્ષા ઉપાય તરીકે મોનિટરેબિલિટીને વધુ મજબૂત બનાવે છે.
નવો પ્રીપ્રિન્ટ સિંગલ-માઈનસ એમ્પ્લિટ્યુડ્સને GPT-5.2 સાથે ગ્રેવિટોન્સ સુધી વિસ્તારે Pro ક્વોન્ટમ ગ્રેવિટીમાં અશૂન્ય ગ્રેવિટોન ટ્રી એમ્પ્લિટ્યુડ્સ મેળવવા અને ચકાસવામાં મદદ કરે છે.