ਮੁੱਖ ਸਮੱਗਰੀ 'ਤੇ ਜਾਓ
OpenAI

28 ਅਕਤੂਬਰ 2025

Doppel ਦਾ AI ਰੱਖਿਆ ਸਿਸਟਮ ਹਮਲੇ ਫੈਲਣ ਤੋਂ ਪਹਿਲਾਂ ਰੋਕਦਾ ਹੈ

GPT‑5 ਅਤੇ ਰੀਇਨਫੋਰਸਮੈਂਟ ਫਾਈਨ-ਟਿਊਨਿੰਗ (RFT) ਨਾਲ, Doppel ਨੇ ਵਿਸ਼ਲੇਸ਼ਕਾਂ ਦਾ ਕੰਮ 80% ਘਟਾਇਆ ਅਤੇ ਹੁਣ ਘੰਟਿਆਂ ਦੀ ਥਾਂ ਮਿੰਟਾਂ ਵਿੱਚ ਖ਼ਤਰਿਆਂ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ.

ਵਕਰੀਆਂ ਲਾਈਨਾਂ ਅਤੇ ਰਿਵਟਾਂ ਵਾਲੀ ਬਣਾਵਟੀ ਗੂੜ੍ਹੀ ਧਾਤੀ ਪਿਛੋਕੜ ਦੇ ਕੇਂਦਰ ਵਿੱਚ ਚਿੱਟੇ ਰੰਗ ਦਾ Doppel ਲੋਗੋ.
ਕੰਪਨੀ ਦਾ ਆਕਾਰ: ਸਟਾਰਟਅੱਪ
ਖੇਤਰ: ਉੱਤਰੀ ਅਮਰੀਕਾ
ਉਦਯੋਗ: ਤਕਨਾਲੋਜੀ
ਉਤਪਾਦ: API

ਨਤੀਜੇ

80%

ਵਿਸ਼ਲੇਸ਼ਕ ਵਰਕਫ਼ਲੋ ਘਟੇ

ਨਤੀਜੇ

3x

ਖ਼ਤਰਾ ਸੰਭਾਲਣ ਦੀ ਸਮਰੱਥਾ

ਲੋਡ ਹੋ ਰਿਹਾ ਹੈ…

ਇੱਕੋ ਨਕਲੀ ਸਾਈਟ ਲਾਂਚ ਹੋ ਸਕਦੀ ਹੈ, ਹਜ਼ਾਰਾਂ ਯੂਜ਼ਰਾਂ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾ ਸਕਦੀ ਹੈ, ਅਤੇ ਇੱਕ ਘੰਟੇ ਤੋਂ ਘੱਟ ਸਮੇਂ ਵਿੱਚ ਗਾਇਬ ਹੋ ਸਕਦੀ ਹੈ। ਕਿਸੇ ਹਮਲਾਵਰ ਲਈ ਅਸਲ ਨੁਕਸਾਨ ਕਰਨ ਲਈ ਇਹ ਕਾਫ਼ੀ ਤੋਂ ਵੀ ਵੱਧ ਸਮਾਂ ਹੈ। ਅਤੇ ਜਨਰੇਟਿਵ ਟੂਲਾਂ ਨਾਲ, ਉਹ ਇਸ ਵਰਗੀਆਂ ਹੋਰ ਸੈਂਕੜਿਆਂ ਸਾਈਟਾਂ ਤੁਰੰਤ ਤਿਆਰ ਕਰ ਸਕਦੇ ਹਨ।

Doppel ਸੰਗਠਨਾਂ ਨੂੰ ਡੀਪਫੇਕ ਅਤੇ ਆਨਲਾਈਨ ਨਕਲਬਾਜ਼ੀ ਤੋਂ ਬਚਾਉਣ ਲਈ ਬਣਾਇਆ ਗਿਆ ਸੀ, ਪਰ ਜਲਦੀ ਹੀ ਇਹ ਸਪੱਸ਼ਟ ਹੋ ਗਿਆ ਕਿ AI ਨਾਲ ਖ਼ਤਰੇ ਬੇਅੰਤ ਪੱਧਰ ਤੱਕ ਵੱਧ ਸਕਦੇ ਹਨ। ਹਮਲਾਵਰਾਂ ਨੂੰ ਹੁਣ ਠੱਗੀਆਂ ਹੱਥੋਂ ਤਿਆਰ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਰਹੀ; ਉਹ ਸੈਕਿੰਡਾਂ ਵਿੱਚ ਫ਼ਿਸ਼ਿੰਗ ਕਿੱਟਾਂ, ਸਪੂਫ਼ ਕੀਤੇ ਡੋਮੇਨ ਅਤੇ ਨਕਲੀ ਖਾਤਿਆਂ ਦੇ ਅਣਗਿਣਤ ਰੂਪ ਤਿਆਰ ਕਰ ਸਕਦੇ ਸਨ।

“ਫ਼ਿਸ਼ਿੰਗ ਹਮਲਿਆਂ ਤੋਂ ਨੁਕਸਾਨ ਕੁਝ ਮਿੰਟਾਂ ਵਿੱਚ ਹੀ ਹੋ ਸਕਦਾ ਹੈ, ਕਿਉਂਕਿ ਇਹ ਸੋਸ਼ਲ ਮੀਡੀਆ ਅਤੇ ਮੈਸੇਜਿੰਗ ਚੈਨਲਾਂ ਰਾਹੀਂ ਫੈਲ ਜਾਂਦੇ ਹਨ। ਲਗਭਗ ਬਿਨਾਂ ਕਿਸੇ ਲਾਗਤ ਦੇ ਬੇਅੰਤ ਮਨਵਾਉਣ ਵਾਲੀ ਸਮੱਗਰੀ ਬਣਾਉਣ ਦੀ ਸਮਰੱਥਾ ਨੇ ਸਭ ਕੁਝ ਬਦਲ ਦਿੱਤਾ।”
—ਰਾਹੁਲ ਮੱਡੁਲੂਰੀ, ਸਹਿ-ਸੰਸਥਾਪਕ ਅਤੇ CTO, Doppel

ਰੋਲਆਉਟ ਦੇ ਅੰਦਰ

ਅੱਗੇ ਰਹਿਣ ਲਈ, Doppel ਨੇ OpenAI GPT‑5 ਅਤੇ o4-mini ਮਾਡਲਾਂ 'ਤੇ ਆਧਾਰਿਤ ਸੋਸ਼ਲ ਇੰਜੀਨੀਅਰਿੰਗ ਰੱਖਿਆ ਸਿਸਟਮ ਦੀ ਇੱਕ ਨਵੀਂ ਕਿਸਮ ਵਿਕਸਿਤ ਕੀਤੀ। Doppel ਦਾ ਪਲੇਟਫਾਰਮ ਖ਼ਤਰਿਆਂ ਨੂੰ ਖੁਦਮੁਖਤਿਆਰ ਤਰੀਕੇ ਨਾਲ ਪਤਾ ਲਗਾਉਂਦਾ, ਵਰਗੀਕ੍ਰਿਤ ਕਰਦਾ ਅਤੇ ਹਟਾਉਂਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਵਿਸ਼ਲੇਸ਼ਕਾਂ ਦਾ ਕੰਮ 80% ਘਟਦਾ ਹੈ, ਖ਼ਤਰਾ ਸੰਭਾਲਣ ਦੀ ਸਮਰੱਥਾ ਤਿੰਨ ਗੁਣਾ ਹੋ ਜਾਂਦੀ ਹੈ, ਅਤੇ ਜਵਾਬੀ ਸਮਾਂ ਘੰਟਿਆਂ ਤੋਂ ਮਿੰਟਾਂ ਤੱਕ ਘਟ ਜਾਂਦਾ ਹੈ।

ਅਨੰਤ ਗਤੀ ਨਾਲ ਵੱਧ ਰਹੇ ਖ਼ਤਰਿਆਂ ਤੋਂ ਅੱਗੇ ਰਹਿਣਾ

ਰਵਾਇਤੀ ਡਿਜ਼ਿਟਲ ਖ਼ਤਰਾ ਸੁਰੱਖਿਆ ਵਿੱਚ ਮਨੁੱਖਾਂ ਵੱਲੋਂ ਨਕਲੀ ਸਾਈਟਾਂ, ਫ਼ਿਸ਼ਿੰਗ ਡੋਮੇਨਾਂ, ਅਤੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਪ੍ਰੋਫ਼ਾਈਲਾਂ ਤੇ ਪੋਸਟਾਂ ਦੀ ਹੱਥੋਂ ਸਮੀਖਿਆ ਕੀਤੀ ਜਾਂਦੀ ਸੀ। Doppel ਨੇ ਵੇਖਿਆ ਕਿ ਇਹ ਮਾਡਲ ਟੁੱਟ ਰਿਹਾ ਸੀ ਕਿਉਂਕਿ ਹਮਲਾਵਰ ਆਟੋਮੈਟ ਹੋ ਰਹੇ ਸਨ, ਅਤੇ ਮਨੁੱਖਾਂ ਦੇ ਮੁਲਾਂਕਣ ਕਰਨ ਨਾਲੋਂ ਵੱਧ ਤੇਜ਼ੀ ਨਾਲ ਅਤੇ ਹੋਰ ਵੱਧ ਸਤਹਾਂ 'ਤੇ ਖ਼ਤਰੇ ਲਾਂਚ ਕਰ ਰਹੇ ਸਨ।

“ਸਾਡਾ ਸਿਸਟਮ ਲਗਾਤਾਰ ਆਉਣ ਵਾਲੇ ਸੰਕੇਤਾਂ ਦੇ ਸੈਲਾਬ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਦਾ ਹੈ ਤਾਂ ਜੋ ਸ਼ੋਰ ਵਿੱਚੋਂ ਅਸਲੀ ਖ਼ਤਰਿਆਂ ਦੀ ਪਛਾਣ ਕੀਤੀ ਜਾ ਸਕੇ। ਇੱਕ ਵਾਰ ਖ਼ਤਰਾ ਪਤਾ ਲੱਗ ਜਾਵੇ, ਨੁਕਸਾਨ ਹੋਣ ਤੋਂ ਪਹਿਲਾਂ ਕਾਰਵਾਈ ਲਈ ਬਹੁਤ ਹੀ ਘੱਟ ਸਮਾਂ ਹੁੰਦਾ ਹੈ। ਫ਼ੈਸਲਾ-ਲੈਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਆਟੋਮੈਟ ਕਰਨ ਲਈ AI ਦੀ ਵਰਤੋਂ ਕੰਪਨੀ ਲਈ ਸਭ ਤੋਂ ਵੱਡੀਆਂ ਤਰੱਕੀਆਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ, ਜਿਸ ਨਾਲ ਅਸੀਂ ਇੰਟਰਨੈੱਟ ਦੇ ਪੱਧਰ ਅਤੇ ਗਤੀ 'ਤੇ ਹਮਲਿਆਂ ਦਾ ਮੁਕਾਬਲਾ ਕਰ ਸਕਦੇ ਹਾਂ।”
—ਰਾਹੁਲ ਮੱਡੁਲੂਰੀ, ਸਹਿ-ਸੰਸਥਾਪਕ ਅਤੇ CTO, Doppel

ਇਹ ਗਤੀ Doppel ਦੇ ਗਾਹਕਾਂ ਲਈ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਅਜੇਹੇ ਸੰਗਠਨ ਜੋ ਕਿਸੇ ਖ਼ਤਰੇ ਦੀ ਪੁਸ਼ਟੀ ਲਈ ਘੰਟਿਆਂ ਉਡੀਕ ਨਹੀਂ ਕਰ ਸਕਦੇ। Doppel ਦਾ ਸਿਸਟਮ ਬਹੁਤ ਸਾਰੇ ਖ਼ਤਰਿਆਂ ਨੂੰ ਆਪਣੇ ਆਪ ਵਰਗੀਕ੍ਰਿਤ ਕਰਦਾ ਹੈ, OpenAI ਮਾਡਲਾਂ ਨੂੰ ਰੀਜ਼ਨਿੰਗ ਲਈ ਵਰਤਦਾ ਹੈ ਅਤੇ ਸਮੇਂ ਦੇ ਨਾਲ ਮਾਡਲ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਲਈ ਰੀਇਨਫੋਰਸਮੈਂਟ ਫਾਈਨ-ਟਿਊਨਿੰਗ (RFT) ਨਾਂ ਦੇ ਇੱਕ ਸੰਰਚਿਤ ਫੀਡਬੈਕ ਲੂਪ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। RFT ਵਿੱਚ, ਮਨੁੱਖੀ ਫੀਡਬੈਕ ਨੂੰ ਗ੍ਰੇਡ ਕੀਤੇ ਉਦਾਹਰਣਾਂ ਵਜੋਂ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਮਾਡਲਾਂ ਨੂੰ ਆਪਣੇ ਆਪ ਲਗਾਤਾਰ ਅਤੇ ਸਮਝਾਏ ਜਾ ਸਕਣ ਵਾਲੇ ਫ਼ੈਸਲੇ ਲੈਣਾ ਸਿੱਖਣ ਵਿੱਚ ਮਦਦ ਮਿਲਦੀ ਹੈ।

LLM-ਚਲਿਤ ਖ਼ਤਰਾ ਡਿਟੈਕਸ਼ਨ ਦਾ ਆਰਕੇਸਟ੍ਰੇਸ਼ਨ

Doppel ਦੀ LLM-ਚਲਿਤ ਡਿਟੈਕਸ਼ਨ ਪਾਈਪਲਾਈਨ ਇਸਦੀ ਡਿਟੈਕਸ਼ਨ ਸਟੈਕ ਦੇ ਕੇਂਦਰ ਵਿੱਚ ਹੈ। ਸੰਕੇਤਾਂ ਦੇ ਸਰੋਤ ਅਤੇ ਫ਼ਿਲਟਰ ਹੋਣ ਤੋਂ ਬਾਅਦ, ਸਿਸਟਮ ਨਿਸ਼ਾਨੇਵੰਦ ਰੀਜ਼ਨਿੰਗ ਕੰਮਾਂ ਦੀ ਇੱਕ ਲੜੀ ਕਰਦਾ ਹੈ: ਸੰਭਾਵਿਤ ਖ਼ਤਰਿਆਂ 'ਤੇ ਰੀਜ਼ਨਿੰਗ, ਇਰਾਦੇ ਦੀ ਪੁਸ਼ਟੀ, ਅਤੇ ਵਰਗੀਕਰਨ ਫ਼ੈਸਲਿਆਂ ਨੂੰ ਚਲਾਉਣਾ। ਹਰ ਪੜਾਅ ਨੂੰ ਗਤੀ, ਸ਼ੁੱਧਤਾ ਅਤੇ ਇਕਸਾਰਤਾ ਵਿਚ ਸੰਤੁਲਨ ਬਣਾਈ ਰੱਖਣ ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੈ, ਨਾਲ ਹੀ ਵਿਸ਼ਲੇਸ਼ਕਾਂ ਨੂੰ ਉਹਨਾਂ ਐਜ ਕੇਸਾਂ 'ਤੇ ਕੇਂਦਰਿਤ ਰੱਖਿਆ ਜਾਂਦਾ ਹੈ ਜਿੱਥੇ ਮਨੁੱਖੀ ਫ਼ੈਸਲੇ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

ਇੱਕ ਫ਼ਲੋਚਾਰਟ LLMs ਦੀ ਵਰਤੋਂ ਨਾਲ ਖ਼ਤਰਾ ਡਿਟੈਕਸ਼ਨ ਲਈ ਇੱਕ ਪਾਈਪਲਾਈਨ ਦਿਖਾਉਂਦਾ ਹੈ, ਜੋ sourcing ਅਤੇ filtering ਤੋਂ ਫੀਚਰ ਐਕਸਟ੍ਰੈਕਸ਼ਨ ਅਤੇ classification ਰਾਹੀਂ ਅੰਤਿਮ verification ਅਤੇ takedown ਸਿਸਟਮਾਂ ਤੱਕ ਜਾਂਦਾ ਹੈ। GPT-5 ਅਤੇ o4-mini ਵਰਗੇ ਮਾਡਲ ਮੁੱਖ ਪੜਾਵਾਂ 'ਤੇ ਵਰਤੇ ਜਾਂਦੇ ਹਨ.

ਇਹ ਇਸ ਤਰ੍ਹਾਂ ਕੰਮ ਕਰਦਾ ਹੈ:

  • ਸੰਕੇਤ ਫ਼ਿਲਟਰੇਸ਼ਨ ਅਤੇ ਫੀਚਰ ਐਕਸਟ੍ਰੈਕਸ਼ਨ: Doppel ਦੇ ਸਿਸਟਮ ਹਰ ਰੋਜ਼ ਲੱਖਾਂ ਡੋਮੇਨ, URL ਅਤੇ ਖਾਤੇ ਇਨਜੈਸਟ ਕਰਦੇ ਹਨ। heuristic ਤਰੀਕਿਆਂ ਅਤੇ OpenAI o4-mini ਦਾ ਮਿਲਾਪ ਸ਼ੋਰ ਨੂੰ ਹਟਾਉਂਦਾ ਹੈ ਅਤੇ ਡਾਊਨਸਟ੍ਰੀਮ ਮਾਡਲ ਮੁਲਾਂਕਣਾਂ ਨੂੰ ਦਿਸ਼ਾ ਦੇਣ ਲਈ ਸੰਰਚਿਤ ਫੀਚਰ ਕੱਢਦਾ ਹੈ।
  • ਸਮਾਂਤਰ ਖ਼ਤਰਾ ਪੁਸ਼ਟੀ: ਹਰ ਸੰਕੇਤ ਨੂੰ ਖ਼ਤਰਾ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀਆਂ ਵੱਖ-ਵੱਖ ਕਿਸਮਾਂ ਲਈ ਖ਼ਾਸ ਤੌਰ 'ਤੇ ਬਣਾਏ ਕਈ GPT‑5 ਪ੍ਰੌੰਪਟਾਂ ਰਾਹੀਂ ਲੰਘਾਇਆ ਜਾਂਦਾ ਹੈ। ਇਹ ਪ੍ਰੌੰਪਟ ਨਕਲ ਦੇ ਖ਼ਤਰੇ, ਬ੍ਰਾਂਡ ਦੇ ਦੁਰਪਯੋਗ ਜਾਂ ਸੋਸ਼ਲ ਇੰਜੀਨੀਅਰਿੰਗ ਪੈਟਰਨਾਂ ਵਰਗੇ ਕਾਰਕਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦੇ ਹਨ।
  • ਖ਼ਤਰਾ ਵਰਗੀਕਰਨ: o4-mini ਦਾ RFT ਸੰਸਕਰਣ ਪਹਿਲਾਂ ਦੀਆਂ ਪੁਸ਼ਟੀਆਂ ਨੂੰ ਇਕੱਠਾ ਕਰਕੇ ਇੱਕ ਸੰਰਚਿਤ ਲੇਬਲ—malicious, benign, ਜਾਂ ambiguous—ਨਿਰਧਾਰਤ ਕਰਦਾ ਹੈ, ਉਹ ਵੀ production-grade ਇਕਸਾਰਤਾ ਨਾਲ।
  • ਅੰਤਿਮ ਪੁਸ਼ਟੀ: GPT‑5 ਦਾ ਦੂਜਾ ਪਾਸ ਮਾਡਲ ਦੇ ਫ਼ੈਸਲੇ ਦੀ ਪੁਸ਼ਟੀ ਕਰਦਾ ਹੈ ਅਤੇ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਵਿੱਚ ਕਾਰਣ ਵੀ ਤਿਆਰ ਕਰਦਾ ਹੈ। ਜੇ ਭਰੋਸਾ ਨਿਰਧਾਰਤ ਸੀਮਾ ਤੋਂ ਵੱਧ ਹੋਵੇ, ਤਾਂ ਸਿਸਟਮ ਆਪਣੇ ਆਪ ਐਨਫੋਰਸਮੈਂਟ ਸ਼ੁਰੂ ਕਰ ਦਿੰਦਾ ਹੈ।
  • ਮਨੁੱਖੀ ਸਮੀਖਿਆ: ਘੱਟ ਭਰੋਸੇ ਵਾਲੇ ਜਾਂ ਟਕਰਾਓ ਵਾਲੇ ਨਤੀਜੇ ਮਨੁੱਖੀ ਵਿਸ਼ਲੇਸ਼ਕਾਂ ਕੋਲ ਭੇਜੇ ਜਾਂਦੇ ਹਨ। ਉਨ੍ਹਾਂ ਦੇ ਫ਼ੈਸਲੇ ਲੌਗ ਕੀਤੇ ਜਾਂਦੇ ਹਨ ਅਤੇ ਮਾਡਲ ਦੀ ਇਕਸਾਰਤਾ ਲਗਾਤਾਰ ਸੁਧਾਰਣ ਲਈ ਵਾਪਸ RFT ਲੂਪ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤੇ ਜਾਂਦੇ ਹਨ।

ਰੀਇਨਫੋਰਸਮੈਂਟ ਫਾਈਨ-ਟਿਊਨਿੰਗ (RFT) ਰਾਹੀਂ ਮਾਡਲਾਂ ਦੀ ਟ੍ਰੇਨਿੰਗ

Doppel ਨੇ ਆਪਣੀ ਮੂਲ LLM-ਸੰਵਰਧਿਤ ਡਿਟੈਕਸ਼ਨ ਪਾਈਪਲਾਈਨ ਤੋਂ ਪਹਿਲਾਂ ਹੀ ਅਰਥਪੂਰਨ ਲਾਭ ਵੇਖ ਲਏ ਸਨ, ਪਰ ਜਦੋਂ ਉਹਨਾਂ ਕੇਸਾਂ ਦੀ ਗੱਲ ਆਈ ਜਿੱਥੇ ਇੱਕੋ ਖ਼ਤਰੇ ਦਾ ਮੁਲਾਂਕਣ ਵਿਸ਼ਲੇਸ਼ਕ ਦੇ ਅਨੁਸਾਰ ਵੱਖਰਾ ਹੋ ਸਕਦਾ ਸੀ, ਤਾਂ ਇਕਸਾਰਤਾ ਹੀ ਸੀਮਿਤ ਕਰਨ ਵਾਲਾ ਕਾਰਕ ਬਣ ਗਈ।

“RFT ਤੋਂ ਨਿਕਲਿਆ ਇੱਕ ਅਸਲ ਫ਼ਾਇਦਾ ਇਹ ਹੈ ਕਿ ਤੁਸੀਂ ਉਸ ਮਾਡਲ ਦੇ ਫ਼ੈਸਲਿਆਂ ਨੂੰ ਹੋਰ ਇਕਸਾਰ ਬਣਾ ਰਹੇ ਹੋ।”
—ਕਿਰਣ ਅਰਿਮਿਲੀ, ਸੌਫਟਵੇਅਰ ਇੰਜੀਨੀਅਰ, Doppel

ਉਸ ਇਕਸਾਰਤਾ ਨੂੰ ਬਣਾਉਣ ਲਈ, Doppel ਨੇ ਆਪਣੇ ਹੀ ਵਿਸ਼ਲੇਸ਼ਕ ਡਾਟਾ ਨੂੰ ਫੀਡਬੈਕ ਸਰੋਤ ਵਜੋਂ ਵਰਤ ਕੇ RFT ਲਾਗੂ ਕੀਤਾ। ਕਿਸੇ ਡੋਮੇਨ ਨੂੰ malicious, benign, ਜਾਂ unclear ਵਜੋਂ ਵਰਗੀਕ੍ਰਿਤ ਕਰਨ ਦਾ ਹਰ ਫ਼ੈਸਲਾ ਇੱਕ ਗ੍ਰੇਡ ਕੀਤਾ ਉਦਾਹਰਣ ਬਣ ਗਿਆ। ਉਹ ਲੇਬਲ ਕੀਤੇ ਉਦਾਹਰਣਾਂ ਨੇ ਮਾਡਲ ਨੂੰ ਮਾਹਰ ਫ਼ੈਸਲੇ ਦੀ ਨਕਲ ਕਰਨਾ ਸਿਖਾਇਆ, ਭਾਵੇਂ ਅਸਪਸ਼ਟ ਐਜ ਕੇਸ ਹੀ ਕਿਉਂ ਨਾ ਹੋਣ।

ਇੱਕ ਗੋਲ ਆਰੇਖ Doppel ਦੇ ਖ਼ਤਰਾ ਵਰਗੀਕਰਨ ਵਰਕਫ਼ਲੋ ਨੂੰ ਦਿਖਾਉਂਦਾ ਹੈ: production LLMs ਫ਼ੈਸਲੇ ਲੈਂਦੇ ਹਨ → ਮਨੁੱਖੀ ਸਮੀਖਿਆਕਾਰ ਸੋਧਾਂ ਦਿੰਦੇ ਹਨ → ਮਾਡਲ ਟ੍ਰੇਨਿੰਗ ਮਾਡਲਾਂ ਨੂੰ ਅਪਡੇਟ ਕਰਦੀ ਹੈ → ਡਿਪਲੌਇਮੈਂਟ ਅਪਡੇਟ ਕੀਤੇ ਮਾਡਲਾਂ ਨੂੰ ਪ੍ਰੋਡਕਸ਼ਨ ਵਿੱਚ ਭੇਜਦੀ ਹੈ.

OpenAI ਦੀ applied engineering ਟੀਮ ਨਾਲ ਨੇੜੇ ਤੋਂ ਕੰਮ ਕਰਦੇ ਹੋਏ, Doppel ਨੇ grader functions ਤਿਆਰ ਕੀਤੇ ਜੋ ਸਿਰਫ਼ ਸ਼ੁੱਧਤਾ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਵਿਆਖਿਆ ਦੀ ਗੁਣਵੱਤਾ ਦਾ ਵੀ ਮੁਲਾਂਕਣ ਕਰਦੇ ਸਨ, ਅਤੇ ਉਹਨਾਂ ਮਾਡਲਾਂ ਨੂੰ ਇਨਾਮ ਦਿੰਦੇ ਸਨ ਜੋ ਸਿਰਫ਼ ਸਹੀ ਨਹੀਂ, ਸਪੱਸ਼ਟ ਤਰੀਕੇ ਨਾਲ ਰੀਜ਼ਨਿੰਗ ਵੀ ਕਰਦੇ ਸਨ। ਵਿਸ਼ਲੇਸ਼ਕ ਫੀਡਬੈਕ ਨੂੰ ਸੰਰਚਿਤ ਟ੍ਰੇਨਿੰਗ ਡਾਟਾ ਵਿੱਚ ਬਦਲ ਕੇ, Doppel ਨੇ ਦਿਖਾਇਆ ਕਿ RFT ਕਿਵੇਂ ਆਟੋਮੈਟ ਡਿਟੈਕਸ਼ਨ ਨੂੰ ਹੋਰ ਇਕਸਾਰ ਅਤੇ ਭਰੋਸੇਯੋਗ ਬਣਾ ਸਕਦਾ ਹੈ।

ਪਾਰਦਰਸ਼ਤਾ ਰਾਹੀਂ ਭਰੋਸੇ ਨੂੰ ਕਾਰਗਰ ਬਣਾਉਣਾ

ਹਾਈਪਰਪੈਰਾਮੀਟਰ ਟਿਊਨਿੰਗ ਅਤੇ ਦੁਹਰਾਏ ਜਾਣ ਵਾਲੇ evals ਨੇ ਮਾਡਲ ਨੂੰ ਮਨੁੱਖੀ ਪੱਧਰ ਦੀ ਇਕਸਾਰਤਾ ਦੇ ਹੋਰ ਨੇੜੇ ਲਿਆ ਦਿੱਤਾ। ਪਰ Doppel ਲਈ, ਆਟੋਮੇਸ਼ਨ ਦੇ ਆਖ਼ਰੀ ਪੜਾਅ ਨੂੰ ਪੂਰਾ ਕਰਨ ਦਾ ਮਤਲਬ ਇਹ ਵੀ ਸੀ ਕਿ ਫ਼ੈਸਲੇ ਤੁਰੰਤ ਸਮਝ ਆਉਣ ਵਾਲੇ ਬਣਾਏ ਜਾਣ।

ਹੁਣ ਹਰ ਆਟੋਮੈਟਿਕ takedown ਵਿੱਚ AI-ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਕਾਰਣ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ ਜੋ ਸਮਝਾਉਂਦਾ ਹੈ ਕਿ ਖ਼ਤਰਾ ਕਿਉਂ ਹਟਾਇਆ ਗਿਆ, ਜਿਸ ਨਾਲ ਗਾਹਕਾਂ ਨੂੰ ਤੁਰੰਤ ਇਹ ਸਮਝ ਆ ਜਾਂਦੀ ਹੈ ਕਿ ਕਾਰਵਾਈ ਕਿਉਂ ਕੀਤੀ ਗਈ—ਇਹ ਉਹ ਚੀਜ਼ ਸੀ ਜਿਸ ਲਈ ਪਹਿਲਾਂ ਵਿਸ਼ਲੇਸ਼ਕ ਦੀ ਦਖ਼ਲਅੰਦਾਜ਼ੀ ਲੋੜੀਂਦੀ ਸੀ।

ਇੱਕ ਡੈਸ਼ਬੋਰਡ ਦ੍ਰਿਸ਼ “d0ppel.click” ਡੋਮੇਨ ਲਈ takedown ਅਲਰਟ ਦਿਖਾਉਂਦਾ ਹੈ, ਜਿਸਨੂੰ Doppel ਦੀ ਨਕਲ ਕਰਨ ਲਈ ਫ਼ਲੈਗ ਕੀਤਾ ਗਿਆ ਹੈ। ਸਾਰ ਵਿੱਚ ਫ਼ਿਸ਼ਿੰਗ ਅਤੇ ਕ੍ਰੈਡੈਂਸ਼ਲ ਚੋਰੀ ਦਾ ਜ਼ਿਕਰ ਹੈ, ਅਤੇ ਸੱਜੇ ਪਾਸੇ ਦੀ ਟਾਈਮਲਾਈਨ 10 ਅਕਤੂਬਰ 2025 ਨੂੰ ਬਣਨ ਤੋਂ ਨਿਪਟਾਰੇ ਤੱਕ ਦੀਆਂ ਸਥਿਤੀ ਅਪਡੇਟਾਂ ਦਿਖਾਉਂਦੀ ਹੈ.

ਇਹ ਦ੍ਰਿਸ਼ਯਤਾ ਭਰੋਸੇ ਨੂੰ ਮਜ਼ਬੂਤ ਕਰਦੀ ਹੈ, ਜੋ Doppel ਦੇ ਯੂਜ਼ਰਾਂ ਲਈ ਇੱਕ ਨਿਰਣਾਇਕ ਕਾਰਕ ਹੈ। ਕੇਵਲ ਇਹ ਨਹੀਂ ਕਿ ਕਿਹੜੀ ਕਾਰਵਾਈ ਕੀਤੀ ਗਈ, ਸਗੋਂ ਇਹ ਵੀ ਕਿ ਕਿਉਂ, ਟੀਮਾਂ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਜਵਾਬ ਦੇਣ ਦਾ ਭਰੋਸਾ ਅਤੇ ਉਹਨਾਂ ਫ਼ੈਸਲਿਆਂ ਨੂੰ ਅੰਦਰੂਨੀ ਤੌਰ 'ਤੇ ਜਾਂ ਸਟੇਕਹੋਲਡਰਾਂ ਨੂੰ ਸਮਝਾਉਣ ਦਾ ਸੰਦਰਭ ਦਿੰਦਾ ਹੈ।

ਇੱਕ ਨਜ਼ਰ ਵਿੱਚ ਨਤੀਜੇ

  • ਵਿਸ਼ਲੇਸ਼ਕਾਂ ਦਾ ਕੰਮ 80% ਘਟਾਇਆ
  • ਖ਼ਤਰਾ ਜਵਾਬੀ ਸਮਾਂ ਘੰਟਿਆਂ ਤੋਂ ਮਿੰਟਾਂ ਤੱਕ ਘਟਾਇਆ
  • ਖ਼ਤਰਾ ਸੰਭਾਲਣ ਦੀ ਸਮਰੱਥਾ ਤਿੰਨ ਗੁਣਾ ਕੀਤੀ
  • ਜ਼ਿਆਦਾਤਰ ਖ਼ਤਰਿਆਂ ਦਾ ਵਰਗੀਕਰਨ ਆਪਣੇ ਆਪ ਕੀਤਾ ਗਿਆ

ਅੱਗੇ ਕੀ ਹੈ

ਫ਼ਿਸ਼ਿੰਗ ਅਤੇ ਨਕਲੀ ਡੋਮੇਨਾਂ ਲਈ ਲਗਭਗ ਪੂਰੀ ਆਟੋਮੇਸ਼ਨ ਹਾਸਲ ਕਰਨ ਤੋਂ ਬਾਅਦ, Doppel ਹੁਣ ਇਸੇ ਮਾਡਲ-ਚਲਿਤ ਫ੍ਰੇਮਵਰਕ ਨੂੰ ਹੋਰ ਉੱਚ-ਵੈਰੀਅੰਸ ਚੈਨਲਾਂ 'ਤੇ ਲਾਗੂ ਕਰ ਰਿਹਾ ਹੈ।

ਮੱਡੁਲੂਰੀ ਨੇ ਕਿਹਾ, “ਡੋਮੇਨ ਸੰਭਵ ਤੌਰ 'ਤੇ ਸਭ ਤੋਂ ਮੁਸ਼ਕਲ ਚੈਨਲ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਅਸੀਂ ਸੰਭਾਲਦੇ ਹਾਂ। ਸੰਕੇਤ ਉਲਝੇ ਹੋਏ ਹੁੰਦੇ ਹਨ, ਸਮੱਗਰੀ ਲਗਾਤਾਰ ਬਦਲਦੀ ਰਹਿੰਦੀ ਹੈ, ਅਤੇ ਖ਼ਤਰੇ ਇੱਕੋ ਵੇਲੇ ਕਈ ਸਤਹਾਂ 'ਤੇ ਤੇਜ਼ੀ ਨਾਲ ਵਿਕਸਿਤ ਹੁੰਦੇ ਹਨ। ਜੇ ਅਸੀਂ ਇਸਨੂੰ ਸ਼ੁਰੂ ਤੋਂ ਅੰਤ ਤੱਕ ਆਟੋਮੈਟ ਕਰ ਸਕਦੇ ਹਾਂ, ਤਾਂ ਅਸੀਂ ਇਹ ਕਿਸੇ ਵੀ ਚੀਜ਼ ਲਈ ਕਰ ਸਕਦੇ ਹਾਂ: ਸੋਸ਼ਲ ਮੀਡੀਆ, paid ads, ਤੁਸੀਂ ਜੋ ਨਾਮ ਲਓ।”

ਅਗਲੇ ਮੀਲ ਪੱਥਰਾਂ ਵਿੱਚ ਉਹਨਾਂ ਦੇ RFT ਡਾਟਾਸੈਟ ਨੂੰ ਦਸ ਗੁਣਾ ਪੱਧਰ ਤੱਕ ਵਧਾਉਣਾ, ਨਵੀਆਂ grading strategies ਨਾਲ ਪ੍ਰਯੋਗ ਕਰਨਾ, ਅਤੇ ਅੱਪਸਟ੍ਰੀਮ ਫੀਚਰ ਐਕਸਟ੍ਰੈਕਸ਼ਨ ਲਈ GPT‑5 ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ। ਇਹ ਤਬਦੀਲੀਆਂ Doppel ਨੂੰ ਪਾਈਪਲਾਈਨ ਦੇ ਪੜਾਵਾਂ ਨੂੰ ਇਕੱਠਾ ਕਰਨ ਅਤੇ ਪ੍ਰਕਿਰਿਆ ਦੇ ਪਹਿਲੇ ਹੀ ਪੜਾਅ ਵਿੱਚ ਹੋਰ ਜਟਿਲ ਖ਼ਤਰਾ ਸੰਕੇਤਕਾਂ 'ਤੇ ਰੀਜ਼ਨਿੰਗ ਕਰਨ ਦੀ ਆਗਿਆ ਦੇਣਗੀਆਂ।

ਹਰ ਦੁਹਰਾਅ ਨਾਲ, Doppel ਇੱਕ ਅਜੇਹੇ ਸਿਸਟਮ ਵੱਲ ਬਣਦਾ ਜਾ ਰਿਹਾ ਹੈ ਜੋ ਹਰ ਉਸ ਸਤਹ 'ਤੇ ਅਸਲੀ ਚੀਜ਼ ਦੀ ਰੱਖਿਆ ਕਰਦਾ ਹੈ ਜਿੱਥੇ ਭਰੋਸੇ 'ਤੇ ਹਮਲਾ ਹੁੰਦਾ ਹੈ।