ಮೇ 27, 2026

Codex ಜೊತೆಗೆ ಸ್ವಯಂ-ಸುಧಾರಿಸುವ ತೆರಿಗೆ ಏಜೆಂಟ್‌ಗಳ ನಿರ್ಮಾಣ

ತಾಂತ್ರಿಕ ಸಿಬ್ಬಂದಿಯ ಸದಸ್ಯರಿಂದ: Aravind Srinivasan & Samay Shamdasani (Thrive Holdings), Arthur Fernandes Araujo & John de Wasseige (OpenAI)

ಲೋಡ್ ಆಗುತ್ತಿದೆ…

ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ಪರಿಣತಿಯನ್ನು Codex ಚಾಲಿತ ಲೂಪ್ ಜೊತೆ ಸಂಯೋಜಿಸಿ Thrive Holdings ಮತ್ತು OpenAI ಹೇಗೆ Crete ಲೆಕ್ಕಪರಿಶೋಧಕರಿಗಾಗಿ Tax AI ಅನ್ನು ಸಹ-ಅಭಿವೃದ್ಧಿಪಡಿಸಿತು

ವಾಸ್ತವ ಜಗತ್ತಿನ ವ್ಯವಸ್ಥೆಗಳು ಪ್ರಯೋಗಾಲಯದಲ್ಲಿರುವುದಕ್ಕಿಂತ ಉತ್ಪಾದನೆಯಲ್ಲಿ ವಿಭಿನ್ನವಾಗಿ ವರ್ತಿಸುತ್ತವೆ; ನಿಯೋಜನೆಗೂ ಮುನ್ನ ಊಹಿಸಲು ಕಷ್ಟವಾದ ರೀತಿಯಲ್ಲಿ ಅವು ವಿಫಲವಾಗುತ್ತವೆ. ತಂಡಗಳು ಆ ವೈಫಲ್ಯಗಳನ್ನು ಬಹುಸಾರಿ ಬಿಡುಗಡೆ ನಂತರವೇ ಕಂಡುಹಿಡಿಯುತ್ತವೆ; ನಂತರ ಅಂಚಿನ ಪ್ರಕರಣಗಳನ್ನು ಪರಿಶೀಲಿಸಲು, ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಸರಿಪಡಿಸಲು ಮತ್ತು ಉತ್ಪಾದನಾ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ದೀರ್ಘಕಾಲಿಕ ಉತ್ಪನ್ನ ಸುಧಾರಣೆಗಳಾಗಿ ಪರಿವರ್ತಿಸಲು ವಾರಗಳನ್ನು ಕಳೆಯುತ್ತವೆ. ಪ್ರತಿಕ್ರಿಯಾ ಲೂಪ್ ಕೈಯಾರೆ ಮತ್ತು ನಿಧಾನವಾಗಿದೆ; ಎಂಜಿನಿಯರ್ ಅದನ್ನು ಮುಂದೂಡಿದಾಗ ಮಾತ್ರ ಅದು ಸುಧಾರಿಸುತ್ತದೆ. ಆದರೆ ಇಂದು, ಯೋಚಿಸಿ ವಿನ್ಯಾಸಗೊಳಿಸಿದ eval ಮೂಲಸೌಕರ್ಯ, ಪ್ರ್ಯಾಕ್ಟಿಷನರ್‌ಗಳು ಮತ್ತು ವಾಸ್ತವ ಜಗತ್ತಿನ ಪರಿಸರಗಳಿಗೆ ನೇರ ಪ್ರವೇಶ, ಮತ್ತು Codex ನ ಅಗ್ರಗಣ್ಯ ಏಜೆಂಟಿಕ್ ಸಾಮರ್ಥ್ಯಗಳೊಂದಿಗೆ, ನೀವು ಸ್ವಯಂ-ಸುಧಾರಿಸುವ ಏಜೆಂಟ್‌ಗಳನ್ನು ನಿರ್ಮಿಸಬಹುದು.

ಈ ಲೇಖನದಲ್ಲಿ, ಈ ರೀತಿಯ ಏಜೆಂಟ್ ನಿರ್ಮಿಸಲು ನಾವು Codex ಅನ್ನು ಹೇಗೆ ಬಳಸಿದೆವು ಎಂಬುದನ್ನು ವಿವರಿಸುತ್ತೇವೆ. ಕಳೆದ ಆರು ತಿಂಗಳಲ್ಲಿ, OpenAI ಯ forward deployed ಎಂಜಿನಿಯರ್‌ಗಳು ಮತ್ತು ಸಂಶೋಧಕರು, ಜೊತೆಗೆ Thrive Holdings ನ ಎಂಜಿನಿಯರ್‌ಗಳು, ಹೆಚ್ಚುತ್ತಿರುವ ಸಂಕೀರ್ಣ ತೆರಿಗೆ ರಿಟರ್ನ್‌ಗಳನ್ನು ತಯಾರಿಸಲು ಸಹಾಯ ಮಾಡಲು Crete⁠(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಯ 30+ ಲೆಕ್ಕಪತ್ರ ಸಂಸ್ಥೆಗಳ ಜಾಲದೊಂದಿಗೆ ಮತ್ತು ಅವರಿಗಾಗಿ Tax AI ಅನ್ನು ಸಹಯೋಗದಿಂದ ನಿರ್ಮಿಸಿದರು. ಪ್ರತಿ ವೈಫಲ್ಯವನ್ನು ಕಂಡುಹಿಡಿದು ಸರಿಪಡಿಸಲು ಎಂಜಿನಿಯರ್‌ಗಳ ಮೇಲೆ ಅವಲಂಬಿಸುವ ಬದಲು, Tax AI ಉತ್ಪಾದನಾ ಬಳಕೆಯನ್ನು ಸ್ವಾಯತ್ತ ಸುಧಾರಣೆಗೆ ಇಂಧನವಾಗುವ ರಚಿತ ಸಂಕೇತಗಳಾಗಿ ಪರಿವರ್ತಿಸಲು Codex ಅನ್ನು ಬಳಸುತ್ತದೆ.

Crete ಪ್ರ್ಯಾಕ್ಟಿಷನರ್‌ಗಳು ಪ್ರತಿ ಋತುವಿನಲ್ಲಿ ದಶಲಕ್ಷಾಂತರ ಮೂಲ ದಾಖಲೆಗಳ ಮೇಲೆ ಕೆಲಸ ಮಾಡಬೇಕಾಗುವ ದಶಸಾವಿರಾರು ತೆರಿಗೆ ರಿಟರ್ನ್‌ಗಳನ್ನು ತಯಾರಿಸುತ್ತಾರೆ. ಮಧ್ಯಮದಿಂದ ದೊಡ್ಡ ಸಂಕೀರ್ಣತೆಯ ಫೈಲಿಂಗ್‌ಗಳಿಗೆ, ಡೇಟಾ ಎಂಟ್ರಿ ಮಾತ್ರವೇ ಪ್ರತಿ ರಿಟರ್ನ್‌ಗೆ ಎಂಟು ಗಂಟೆಗಳವರೆಗೆ ತೆಗೆದುಕೊಳ್ಳಬಹುದು; ಇದರಲ್ಲಿ ಅಸ್ತವ್ಯಸ್ತ ಡೇಟಾ ಮೂಲಗಳು, ಹಿಂದಿನ ವರ್ಷದ ದಾಖಲೆಗಳು, ಮತ್ತು ಕೈಯಾರೆ ಎಕ್ಸ್ಟ್ರಾಕ್ಷನ್ ಹಾಗೂ ಲೆಕ್ಕಾಚಾರಗಳು ಸೇರಿರುತ್ತವೆ. ತೆರಿಗೆ ಋತುವಿನ ಅತ್ಯಂತ ಬ್ಯುಸಿ ಅವಧಿಯಲ್ಲಿ ತೆರಿಗೆ ತಯಾರಿಕೆಯನ್ನು ಪ್ರಮುಖ bottleneck ಎಂದು ಅವರು ನಮಗೆ ತೋರಿಸಿದರು.

ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು, ಈ ತೆರಿಗೆ ಋತುವಿನಲ್ಲಿ ಪೈಲಟ್‌ನಲ್ಲಿ ಭಾಗವಹಿಸಿದ Crete ಸಂಸ್ಥೆಗಳಾದ್ಯಂತ Tax AI 7,000 ತೆರಿಗೆ ರಿಟರ್ನ್‌ಗಳನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಿತು. ವ್ಯವಸ್ಥೆ 1040 ಮತ್ತು 1041 ತೆರಿಗೆ ರಿಟರ್ನ್‌ಗಳನ್ನು ತಯಾರಿಸುವ ಸಮಯವಹಿಸುವ ಪ್ರಕ್ರಿಯೆಯ ಬಹುಭಾಗವನ್ನು ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸುತ್ತದೆ; ಆದರೆ ದಕ್ಷತಾ ಲಾಭಗಳಿಗಿಂತಲೂ ಹೆಚ್ಚು ಆಕರ್ಷಕವಾದುದು, ಮೂರು ತಿಂಗಳ ಹಿಂದೆ ಮೊದಲಿಗೆ ನಿಯೋಜಿಸಲಾದ ಆವೃತ್ತಿಗಿಂತ ವ್ಯವಸ್ಥೆಯೇ ಅಳೆಯಬಹುದಾದ ಮಟ್ಟಿಗೆ ಉತ್ತಮವಾಗಿದೆ ಎಂಬುದು.

ಅಳೆಯಬಹುದಾದ ಸ್ವಯಂ-ಸುಧಾರಣೆ

Tax AI ಯಲ್ಲಿ, ಪ್ರ್ಯಾಕ್ಟಿಷನರ್‌ಗಳು ಯಾವುದೇ ಗ್ರಾಹಕ-ನಿರ್ದಿಷ್ಟ ಟಿಪ್ಪಣಿಗಳೊಂದಿಗೆ ಮೂಲ ಫೈಲ್‌ಗಳನ್ನು ಅಪ್‌ಲೋಡ್ ಮಾಡುತ್ತಾರೆ. ನಂತರ Tax AI ವಿಮರ್ಶೆಗೆ ಸಿದ್ಧವಾದ ತೆರಿಗೆ ಎಂಜಿನ್ ಸಲ್ಲಿಕೆಯನ್ನು ರಚಿಸುತ್ತದೆ. ಇದು ಪ್ರ್ಯಾಕ್ಟಿಷನರ್‌ಗಳಿಗೆ ತೆರಿಗೆ ತಯಾರಿಕೆಯಲ್ಲಿ ಅವರ ಸಮಯದ ಸುಮಾರು ಮೂರನೇ ಭಾಗವನ್ನು ಉಳಿಸುತ್ತದೆ, 97% ವರೆಗೆ ನಿಖರತೆಯೊಂದಿಗೆ ರಿಟರ್ನ್‌ಗಳನ್ನು ಕರಡುಗೊಳಿಸುತ್ತದೆ, ಮತ್ತು ಥ್ರೂಪುಟ್ ಅನ್ನು ಸುಮಾರು 50% ಹೆಚ್ಚಿಸುತ್ತದೆ; ಇದರಿಂದ ಅವರಿಗೆ ಗ್ರಾಹಕರೊಂದಿಗೆ ಸಮಯ ಕಳೆಯಲು ಹೆಚ್ಚು ಅವಕಾಶ ಸಿಗುತ್ತದೆ.

ನಂತರ ತಿದ್ದುಪಡಿ ಅಗತ್ಯವಿಲ್ಲದೆ Tax AI ಒಂದು ರಿಟರ್ನ್ ಅನ್ನು ಎಷ್ಟು ನಿಖರವಾಗಿ ಪೂರ್ಣಗೊಳಿಸಬಲ್ಲದು ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ ಮೂಲಕ ನಾವು ಈ ಸುಧಾರಣೆಯನ್ನು ಪ್ರಮಾಣೀಕರಿಸಬಹುದು. 75%, 90%, ಅಥವಾ 100% ಸರಿಯಾದ ಕ್ಷೇತ್ರ ಪೂರ್ಣತೆಯನ್ನು ತಲುಪುವ ರಿಟರ್ನ್‌ಗಳ ಪಾಲನ್ನು ಪರಿಶೀಲಿಸುವ ಮೂಲಕ ನಾವು ನಿಖರತೆಯನ್ನು ಅಳೆಯುತ್ತೇವೆ. ಬಿಡುಗಡೆಯ ಸಮಯದಲ್ಲಿ, ಕೇವಲ ನಾಲ್ಕೊಂದರಷ್ಟು ರಿಟರ್ನ್‌ಗಳು ಮಾತ್ರ 75% ಸರಿಯಾದ ಕ್ಷೇತ್ರ ಪೂರ್ಣತೆಯಲ್ಲಿ ಇದ್ದವು; ಆದರೆ ಆರು ವಾರಗಳೊಳಗೆ, 86% ಆ ಮಟ್ಟವನ್ನು ತಲುಪಿದವು. 90% ಮತ್ತು 100% ಸರಿಯಾದ ಕ್ಷೇತ್ರ ಪೂರ್ಣತೆ ಮಟ್ಟಗಳಲ್ಲಿ ವ್ಯವಸ್ಥೆ ಇನ್ನೂ ವೇಗವಾದ ಬೆಳವಣಿಗೆಯನ್ನು ತೋರಿಸಿತು. ಈ ಮಿತಿಗಳು ವಿಭಿನ್ನ ರಿಟರ್ನ್‌ಗಳಿಗೆ ಇನ್ನೂ ಎಷ್ಟು ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ಅನುಸರಣೆ ಬೇಕಿದೆ ಎಂಬುದರ ಪ್ರಾಯೋಗಿಕ ದೃಷ್ಟಿಕೋನವನ್ನು ನಮಗೆ ನೀಡುತ್ತವೆ.

ಆರಂಭದಲ್ಲಿ, Tax AI W-2s ಮತ್ತು 1099s ಮುಂತಾದ ಸರಳ ಕೆಲಸಗಳನ್ನು ನಿಭಾಯಿಸಿತು. ಋತು ಮುಂದುವರಿದಂತೆ, ಅದು K-1s, schedules ಮತ್ತು ಹೆಚ್ಚು ಕಠಿಣ ಅಂಚಿನ ಪ್ರಕರಣಗಳಿರುವ ಹೆಚ್ಚು ಸಂಕೀರ್ಣ ರಿಟರ್ನ್‌ಗಳಿಗೆ ಸಾಗಿತು. ಪ್ರತಿ ಹೊಸ ಸಾಮರ್ಥ್ಯವು ಹಿಂದಿನದಕ್ಕಿಂತ ಪ್ರತಿ ರಿಟರ್ನ್‌ಗೆ ಹೆಚ್ಚು ಸಮಯ ಉಳಿಸಿತು, ಏಕೆಂದರೆ ಅದು ಕೈಯಾರೆ ಮಾಡಲು ಹೆಚ್ಚು ಕಷ್ಟಕರ ಮತ್ತು ಹೆಚ್ಚು ಸಮಯವಹಿಸುವ ಕಾರ್ಯಗಳನ್ನು ತೆಗೆದುಕೊಂಡಿತು. ಇಂದಿಗೂ ನಾವು ನಿರಂತರ ಪ್ರಗತಿಯನ್ನು ನೋಡುತ್ತಲೇ ಇದ್ದೇವೆ.

ಮುಂದೆ, 1) ತಜ್ಞ ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ಪ್ರತಿಕ್ರಿಯೆ, 2) ಉತ್ಪಾದನಾ ಟ್ರೇಸ್‌ಗಳು (ಇನ್‌ಪುಟ್‌ಗಳಿಂದ ಅಂತಿಮ ಔಟ್‌ಪುಟ್‌ವರೆಗೆ ರಚಿತ ಇತಿಹಾಸ), ಮತ್ತು 3) ನಿರಂತರ, ವೇಗವಾದ ಉತ್ಪನ್ನ ಅಭಿವೃದ್ಧಿಗೆ ಅನುಕೂಲವಾಗುವಂತೆ ಹೊಂದಿಸಿದ evals ಆಧಾರಿತ Codex ಚಾಲಿತ ಪುನರಾವರ್ತನಾ ಲೂಪ್ ಎಂಬ ಮೂರು ಪ್ರಮುಖ ಸ್ತಂಭಗಳ ಮೇಲೆ ಅವಲಂಬಿಸಿ ನಮ್ಮ ತಂಡಗಳು Tax AI ಅನ್ನು ಸ್ವಯಂ-ಸುಧಾರಿಸುವಂತೆ ಹೇಗೆ ಸಹ-ಎಂಜಿನಿಯರ್ ಮಾಡಿವೆ ಎಂಬುದನ್ನು ನೋಡೋಣ. ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ಪರಿಣತಿ ಸಮಗ್ರ ವ್ಯವಸ್ಥೆಯ ಗುಣಮಟ್ಟ ಮತ್ತು ಅದರ ಮೂಲಕ ಹರಿಯುವ ಡೇಟಾವನ್ನು ರೂಪಿಸಲು ಮುಖ್ಯವಾಗಿರುವ ಕ್ಷೇತ್ರಗಳಲ್ಲಿನ ಇತರ ನಿರ್ಮಾತೃಗಳಿಗೆ ನಮ್ಮ ಅನುಭವ ಉಪಯುಕ್ತವಾಗಲಿದೆ ಎಂದು ನಾವು ಆಶಿಸುತ್ತೇವೆ.

Tax AI ಹೆಚ್ಚು ಸಂಕೀರ್ಣ ಫೈಲಿಂಗ್‌ಗಳಿಗೆ ವಿಸ್ತರಿಸಿದಂತೆ, ಅಂಕಿತ ರಿಟರ್ನ್‌ಗಳಲ್ಲಿ 75%, 90% ಮತ್ತು ಸಂಪೂರ್ಣ ಪೂರ್ಣತೆಯನ್ನು ತಲುಪಿದ ಪಾಲು ತೆರಿಗೆ ಋತುವಿನ ಅವಧಿಯಲ್ಲೂ ಏರಿಕೆಯಾಗುತ್ತಲೇ ಇತ್ತು.

ಸಮಸ್ಯೆ

ತೆರಿಗೆ ತಯಾರಿಕೆಯ ಹೆಚ್ಚು ಕಠಿಣ ಭಾಗಗಳಾದ K-1s, ಬಾಡಿಗೆ ರಿಯಲ್ ಎಸ್ಟೇಟ್ schedules, ಮತ್ತು ಅನೇಕ ಮೂಲ ಫೈಲ್‌ಗಳಾದ್ಯಂತ ಮೌಲ್ಯಗಳನ್ನು ಹೊಂದಿಸಬೇಕಾದ ತೆರಿಗೆ ಫಾರ್ಮ್‌ಗಳ ಕಡೆಗೆ ನಾವು ಮುಂದುವರಿದಂತೆ, ನಿಜವಾದ ಸವಾಲು ಉತ್ಪನ್ನವು ಸಂಕೀರ್ಣ ಉತ್ಪಾದನಾ ವೈಫಲ್ಯಗಳನ್ನು ಗೋಚರ, ಅರ್ಥಗರ್ಭಿತ ಮತ್ತು ಕಾರ್ಯಗತವಾಗಿಸಬಹುದೇ ಎಂಬುದೇ ಎಂದು ಸ್ಪಷ್ಟವಾಯಿತು.

ಉತ್ಪನ್ನದ ಆರಂಭಿಕ ದಿನಗಳಲ್ಲಿ, ಬಹುತೇಕ ತಿದ್ದುಪಡಿ ಕೈಯಾರೆ ಆಗುತ್ತಿತ್ತು. ಪ್ರ್ಯಾಕ್ಟಿಷನರ್‌ಗಳು ವ್ಯವಸ್ಥೆಯ ದೋಷಗಳನ್ನು ತಿದ್ದಬಹುದಾಗಿತ್ತು, ಆದರೆ ಉತ್ಪನ್ನವು ಸಂಪೂರ್ಣ ಸಂದರ್ಭವನ್ನು ಸೆರೆಹಿಡಿಯಲಿಲ್ಲ: ಫೈಲಿಂಗ್‌ಗೆ ಮುನ್ನ ಬದಲಾದ ಮೌಲ್ಯವು ನಿಜವಾದ ಎಕ್ಸ್ಟ್ರಾಕ್ಷನ್ ತಪ್ಪು, ಮ್ಯಾಪಿಂಗ್ ಸಮಸ್ಯೆ, ಕಾಣೆಯಾದ ಉತ್ಪನ್ನ ಬೆಂಬಲ, ಅಥವಾ ನಿರೀಕ್ಷಿತ ವರ್ಕ್‌ಫ್ಲೋ ಶಬ್ದವನ್ನು ಪ್ರತಿಬಿಂಬಿಸಬಹುದು. ಆ ಪ್ರಕರಣಗಳನ್ನು ಬೇರ್ಪಡಿಸಲು ಇನ್ನೂ ಎಂಜಿನಿಯರಿಂಗ್ ತಂಡದ ಅನುಸರಣೆ ಅಗತ್ಯವಿತ್ತು. ಎಂಜಿನಿಯರ್‌ಗಳು coding agents ಅನ್ನು ಬಳಸಬಹುದಾಗಿತ್ತು, ಆದರೆ ಸುಧಾರಣಾ ಲೂಪ್ ಒಳಗೆ AI ಅನ್ನು ಅರ್ಥಪೂರ್ಣವಾಗಿ ಬಳಸುವಂತೆ ವ್ಯವಸ್ಥೆಯನ್ನು ಇನ್ನೂ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿರಲಿಲ್ಲ. ಏರಬೇಕಾದ ಸರಿಯಾದ ಬೆಟ್ಟವನ್ನು ಗುರುತಿಸಲು ಬೇಕಾದ ಸಂಕೇತ ನಮ್ಮ ಬಳಿ ಇರಲಿಲ್ಲ.

ನಮ್ಮ ವಿಧಾನ: ಮೂರು-ಭಾಗದ ಲೂಪ್

ಅದು ನಮ್ಮನ್ನು ವ್ಯವಸ್ಥೆಯನ್ನು ಮೂರು ಸ್ತಂಭಗಳ ಸುತ್ತ ವಿನ್ಯಾಸಗೊಳಿಸಲು ಪ್ರೇರೇಪಿಸಿತು:

ಪ್ರ್ಯಾಕ್ಟಿಷನರ್‌ಗಳಿಗೆ ಹತ್ತಿರವಾಗಿರಿ: ಕೆಲಸ ಮಾಡುವ ಜನರು ಉತ್ಪನ್ನವು ಏನು ಕಲಿಯಬೇಕು ಎಂಬುದಕ್ಕೆ ದಿಕ್ಕು ನೀಡಬೇಕು. ಅವರ ಒಳನೋಟ ಮತ್ತು ಅರ್ಥೈಸುವಿಕೆ ಯಾವ ದೋಷಗಳು ಮುಖ್ಯವೆಂದು ತೋರಿಸುತ್ತವೆ ಮತ್ತು ವರ್ಕ್‌ಫ್ಲೋನ ಯಾವ ಭಾಗಗಳ ಮೇಲೆ ಮುಂದಾಗಿ ಗಮನಹರಿಸಬೇಕು ಎಂಬುದನ್ನು ತಿಳಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ.
ಉತ್ಪಾದನೆ ಸಾಕ್ಷ್ಯವನ್ನು ಸೃಷ್ಟಿಸುವಂತೆ ಉತ್ಪನ್ನವನ್ನು ನಿರ್ಮಿಸಿ: ಉತ್ಪನ್ನವು ಕೇವಲ ಇನ್‌ಪುಟ್‌ಗಳು ಮತ್ತು ಔಟ್‌ಪುಟ್‌ಗಳನ್ನು ಮಾತ್ರವಲ್ಲ, ಮೂಲ ವಸ್ತುವಿನಿಂದ ಎಕ್ಸ್ಟ್ರಾಕ್ಟ್ ಮಾಡಿದ ಕ್ಷೇತ್ರಗಳು ಮತ್ತು provenance ಮೂಲಕ ಮುಂದಿನ ಸಲ್ಲಿಕೆ ಮತ್ತು ತಜ್ಞ ತಿದ್ದುಪಡಿಯವರೆಗೆ ಸಂಪೂರ್ಣ ಮಾರ್ಗವನ್ನು ಸೆರೆಹಿಡಿಯಬೇಕು.
Codex ಚಾಲಿತ ಸುಧಾರಣಾ ಲೂಪ್ ರಚಿಸಿ: ಉತ್ಪಾದನಾ ಸಮಸ್ಯೆಗಳು ಗೋಚರ ಮತ್ತು ರಚಿತವಾದ ನಂತರ, ಅವು ಕಂಡುಬಂದವುಗಳು, ಹೊಂದಿಸಿದ evals ಮತ್ತು ಮಿತಿಗೊಳಿಸಿದ ಎಂಜಿನಿಯರಿಂಗ್ ಕಾರ್ಯಗಳಾಗಬಹುದು. ನಂತರ Codex ಪರಿಶೀಲಿಸಲು, ಬದಲಾವಣೆಗಳನ್ನು ಪ್ರಸ್ತಾಪಿಸಲು, ಗುರಿತಪ್ಪದ ಮತ್ತು regression evals ವಿರುದ್ಧ ಅವನ್ನು ಮಾನ್ಯಗೊಳಿಸಲು, ಮತ್ತು ಸಂಪೂರ್ಣ ಕೈಯಾರೆ ಪುನರಾವರ್ತನಾ ಚಕ್ರಕ್ಕಿಂತ ವೇಗವಾಗಿ ಉತ್ಪನ್ನವನ್ನು ಮುಂದಕ್ಕೆ ಕೊಂಡೊಯ್ಯಲು ಸಹಾಯ ಮಾಡಬಹುದು.

ಕೆಳಗಿನ ಬಾಡಿಗೆ ಆಸ್ತಿ ಉದಾಹರಣೆ ಆ ಲೂಪ್ ಪ್ರಾಯೋಗಿಕವಾಗಿ ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ; ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ತಿದ್ದುಪಡಿ ಹೇಗೆ ರಚಿತ ಕಂಡುಬಂದುವಾಗುತ್ತದೆ, ನಂತರ eval ಗುರಿಯಾಗುತ್ತದೆ, ಮತ್ತು ಕೊನೆಯಲ್ಲಿ Codex-ಮಿತಿಗೊಳಿಸಿದ ಎಂಜಿನಿಯರಿಂಗ್ ಕಾರ್ಯವಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಹಂತ ಹಂತವಾಗಿ ತೋರಿಸುತ್ತದೆ.

ಬಾಡಿಗೆ ಆಸ್ತಿ ಉದಾಹರಣೆ

ಬಾಡಿಗೆ ಆಸ್ತಿ ಆದಾಯವನ್ನು ವೈಯಕ್ತಿಕ ತೆರಿಗೆ ರಿಟರ್ನ್‌ನ Schedule E ನಲ್ಲಿ ವರದಿ ಮಾಡಲಾಗುತ್ತದೆ. ಎಂಜಿನಿಯರಿಂಗ್ ದೃಷ್ಟಿಕೋನದಿಂದ, ಅದನ್ನು ಎಕ್ಸ್ಟ್ರಾಕ್ಟ್ ಮಾಡುವ ಕಾರ್ಯವನ್ನು ವಿವರಿಸಲು ಸುಲಭವಾದರೂ ಚೆನ್ನಾಗಿ ಮಾಡಲು ಕಷ್ಟ. ವ್ಯವಸ್ಥೆಯು ಅಸ್ತವ್ಯಸ್ತ ಮೂಲ ವಸ್ತುಗಳನ್ನು ಓದಬೇಕು (ಕೈಬರಹದ ಟಿಪ್ಪಣಿಗಳು, ಇಮೇಲ್‌ಗಳು, ಸ್ಪ್ರೆಡ್‌ಶೀಟ್‌ಗಳು ಮತ್ತು ಇತರ ಗ್ರಾಹಕ ಫೈಲ್‌ಗಳು), ವ್ಯವಸ್ಥೆ ತೆರಿಗೆ ಎಂಜಿನ್‌ಗೆ ವಿಶ್ವಾಸದಿಂದ ಮ್ಯಾಪ್ ಮಾಡಬಹುದಾದ ಬಾಡಿಗೆ-ಆಸ್ತಿ ಕ್ಷೇತ್ರಗಳನ್ನು ಎಕ್ಸ್ಟ್ರಾಕ್ಟ್ ಮಾಡಬೇಕು, ಮತ್ತು ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ಫಲಿತಾಂಶವನ್ನು ಅನುಮೋದಿಸಲು ಅಥವಾ ತಿದ್ದಲು ಸಾಕಷ್ಟು ಸಾಕ್ಷ್ಯವನ್ನು ಉಳಿಸಬೇಕು. ಕೆಳಗಿನ ಸರಳೀಕೃತ ಉದಾಹರಣೆ ಆ ಮೂಲ ಫೈಲ್‌ಗಳು ಮತ್ತು ಎಕ್ಸ್ಟ್ರಾಕ್ಟ್ ಮಾಡಿದ ಔಟ್‌ಪುಟ್‌ಗಳು ಹೇಗಿರಬಹುದು ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ.

ಬಾಡಿಗೆ ಆಸ್ತಿಯ ಮೂಲ ಪ್ಯಾಕೇಜ್ ಅನ್ನು ಮೊದಲು ಉಲ್ಲೇಖಿತ ಕ್ಷೇತ್ರಗಳಾಗಿ ಸಾಮಾನ್ಯೀಕರಿಸಲಾಗುತ್ತದೆ, ನಂತರ ಅವನ್ನು ಮುಂದಿನ ತೆರಿಗೆ ಎಂಜಿನ್ ಪರಿಕಲ್ಪನೆಗಳಿಗೆ ಮ್ಯಾಪ್ ಮಾಡಲಾಗುತ್ತದೆ.

1. ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ತಿದ್ದುಪಡಿ ಒಂದು ವೈಫಲ್ಯವನ್ನು ಬಹಿರಂಗಪಡಿಸುತ್ತದೆ

ಏಜೆಂಟ್ ಊಹಿಸಿದ ಮೌಲ್ಯ ಮತ್ತು ಸಲ್ಲಿಸಲಾದ ತೆರಿಗೆ ರಿಟರ್ನ್‌ನ ನಿಜವಾದ ಮೌಲ್ಯದ ನಡುವಿನ ವ್ಯತ್ಯಾಸವು ನಿಜವಾದ ಎಕ್ಸ್ಟ್ರಾಕ್ಷನ್ ತಪ್ಪನ್ನು ತೋರಿಸಬಹುದು, ಆದರೆ ಅದು ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ಆದ್ಯತೆ, ತೆರಿಗೆ ಎಂಜಿನ್‌ನ ಹಿಂದಿನ ವರ್ಷದ ರಿಟರ್ನ್‌ನಿಂದ ಮುಂದಕ್ಕೆ ತರಲಾದ ಮೌಲ್ಯ, ಅಥವಾ ಫೈಲಿಂಗ್ ವರ್ಕ್‌ಫ್ಲೋನ ಬೇರೆಡೆ ಸೇರಿಸಲಾದ ಅಥವಾ ಬದಲಾಯಿಸಲಾದ ಮೌಲ್ಯವೂ ಆಗಿರಬಹುದು. ಯಾವ ಕ್ರಿಯೆಗಳಿಗೆ ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ತಿದ್ದುಪಡಿ ಬೇಕಾಯಿತು ಅಥವಾ ಯಾವವು ಸಲ್ಲಿಕೆಯನ್ನು ತಡೆದವು ಎಂಬುದನ್ನು ಗುರುತಿಸಲು ಪ್ರ್ಯಾಕ್ಟಿಷನರ್‌ಗಳು ನಮಗೆ ಆ ಪ್ರಕರಣಗಳನ್ನು ಬೇರ್ಪಡಿಸಲು ಸಹಾಯ ಮಾಡಿದರು.

ಈ ತಿದ್ದುಪಡಿಗಳನ್ನು ನಾವು ವಿವರವಾಗಿ ನೋಡಬಹುದಾಗಿದ್ದರಿಂದ, ವಿಮರ್ಶಾ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಅಂತಿಮ, ವೈಫಲ್ಯಾನಂತರದ ಹಂತದಿಂದ ನಿರಂತರ ಕಲಿಕೆಯ ಚಕ್ರವಾಗಿ ಪರಿವರ್ತಿಸಿದೆವು. ತಜ್ಞರ ಕ್ರಿಯೆಗಳನ್ನು ರಚಿತ ಡೇಟಾವಾಗಿ ಸೆರೆಹಿಡಿಯಲು ನಾವು ವರ್ಕ್‌ಫ್ಲೋವನ್ನು ವಿನ್ಯಾಸಗೊಳಿಸಿದೆವು. ಈಗ, Tax AI ಏನು ಪ್ರಸ್ತಾಪಿಸಿತು, ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ಏನು ಬದಲಾಯಿಸಿದರು, ಮತ್ತು ಅಂತಿಮವಾಗಿ ಸಲ್ಲಿಸಲಾದ ರಿಟರ್ನ್‌ಗೆ ಏನು ಸೇರಿತು ಎಂಬುದನ್ನು ನಿಖರವಾಗಿ ದಾಖಲಿಸುವ ಮೂಲಕ ಪ್ರತಿಯೊಂದು ಹಸ್ತಕ್ಷೇಪವೂ ಉತ್ಪನ್ನದ ಸುಧಾರಣಾ ಲೂಪ್‌ಗೆ ಇಂಧನವಾಗುತ್ತದೆ.

2. ಉತ್ಪನ್ನ ಟ್ರೇಸ್‌ಗಳು ತಿದ್ದುಪಡಿಗಳನ್ನು evals ಆಗಿ ಪರಿವರ್ತಿಸುತ್ತವೆ

ಬಾಡಿಗೆ ಆಸ್ತಿಗಳಂತಹ ಸಂಕೀರ್ಣ ವರ್ಕ್‌ಫ್ಲೋಗಾಗಿ, ಮೂಲ ಫೈಲ್‌ಗಳು ಮತ್ತು ಸಲ್ಲಿಸಲಾದ ರಿಟರ್ನ್ ನಡುವಿನ ಘಟನೆಗಳನ್ನು ವ್ಯವಸ್ಥೆ ಉಳಿಸಬೇಕು. ಆ ಮಾರ್ಗದಲ್ಲಿ, ದಾಖಲೆಗಳನ್ನು ಸಂಘಟಿಸಲಾಗುತ್ತದೆ, ವಿಭಜಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ; ಬಾಡಿಗೆ-ಆಸ್ತಿ ಕ್ಷೇತ್ರಗಳನ್ನು ಮೂಲ ವಸ್ತುವಿನ ಉಲ್ಲೇಖಗಳೊಂದಿಗೆ ಎಕ್ಸ್ಟ್ರಾಕ್ಟ್ ಮಾಡಲಾಗುತ್ತದೆ; ಆ ಮೌಲ್ಯಗಳನ್ನು ತೆರಿಗೆ ಎಂಜಿನ್‌ಗೆ ಮ್ಯಾಪ್ ಮಾಡಲಾಗುತ್ತದೆ; ಮತ್ತು ಸಲ್ಲಿಸುವ ಮೊದಲು ಪ್ರ್ಯಾಕ್ಟಿಷನರ್‌ಗಳು ಇನ್ನೂ ಅವನ್ನು ತಿದ್ದಬಹುದು. ಆ ಉತ್ಪನ್ನ-ಮಟ್ಟದ ಟ್ರೇಸ್‌ಗಳು ವೈಫಲ್ಯ ಎಲ್ಲಿ ಸಂಭವಿಸಿತು ಎಂಬುದನ್ನು ಪರಿಶೀಲಿಸಲು ಸಾಧ್ಯವಾಗಿಸುತ್ತವೆ. ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ತಿದ್ದುಪಡಿಗಳನ್ನು ಉಪಯುಕ್ತ ಮೌಲ್ಯಮಾಪನ ಗುರಿಗಳಾಗಿ ಪರಿವರ್ತಿಸಲು, ವ್ಯವಸ್ಥೆ ಅವನ್ನು ಮೂರು ಹಂತಗಳಲ್ಲಿ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುತ್ತದೆ:

ವ್ಯತ್ಯಾಸವನ್ನು ಸೆರೆಹಿಡಿಯಿರಿ: Tax AI ಔಟ್‌ಪುಟ್ ಅನ್ನು ಸಲ್ಲಿಸಲಾದ ರಿಟರ್ನ್‌ನೊಂದಿಗೆ ಹೋಲಿಸಿ, ನಿರೀಕ್ಷಿತ ಮೌಲ್ಯ, ಊಹಿತ ಮೌಲ್ಯ ಮತ್ತು ವ್ಯತ್ಯಾಸ ಕಾರ್ಯಗತವಾಗಿ ಕಾಣುತ್ತದೆಯೇ ಎಂಬುದನ್ನು ಸೆರೆಹಿಡಿಯುವ ಕ್ಷೇತ್ರ-ಮಟ್ಟದ ವಿಮರ್ಶಾ ಸಾಲುಗಳನ್ನು ಸೃಷ್ಟಿಸಲಾಗುತ್ತದೆ.
ಸಂಬಂಧಿತ ವೈಫಲ್ಯಗಳನ್ನು ಗುಂಪುಗೊಳಿಸಿ: ಮರುಕಳಿಸುವ ಉತ್ಪನ್ನ ವೈಫಲ್ಯಗಳನ್ನು ನಿರೀಕ್ಷಿತ ವರ್ಕ್‌ಫ್ಲೋ ಶಬ್ದದಿಂದ ಬೇರ್ಪಡಿಸಲು ಸಮಾನ ವಿಮರ್ಶಾ ಸಾಲುಗಳನ್ನು ಗುಂಪುಗೊಳಿಸಲಾಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ಮರುಕಳಿಸುವ ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ತಿದ್ದುಪಡಿಗಳು Tax AI ಬಹುಸಾರಿ fair-rental-day ಕ್ಷೇತ್ರಗಳನ್ನು ತಪ್ಪಿಸುತ್ತದೆ, “other expenses” ಅನ್ನು ತಪ್ಪಾಗಿ ನಿಭಾಯಿಸುತ್ತದೆ, ಅಥವಾ ಅದೇ ಮೂಲ ಪ್ಯಾಕೇಜ್‌ನಲ್ಲಿನ ಅನೇಕ ಬಾಡಿಗೆ ಆಸ್ತಿಗಳನ್ನು ಗೊಂದಲಗೊಳಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ತೋರಿಸಬಹುದು.
ಮರುಕಳಿಸುವ ಮಾದರಿಗಳನ್ನು eval ಗುರಿಗಳಾಗಿ ಪರಿವರ್ತಿಸಿ: ಪರಿಶೀಲಿಸಿ ಅಳೆಯಲಾದ ನಂತರ, ಮರುಕಳಿಸುವ ಕಂಡುಬಂದವುಗಳು Codex ಸುಧಾರಿಸಲು ಸ್ಪಷ್ಟ eval ಗುರಿಗಳಾಗುತ್ತವೆ.

ಬಾಡಿಗೆ ಆಸ್ತಿ ವಿಮರ್ಶಾ ಸಾಲುಗಳು ಮರುಕಳಿಸುವ ಉತ್ಪನ್ನ ವೈಫಲ್ಯಗಳನ್ನು ನಿರೀಕ್ಷಿತ ಶಬ್ದದಿಂದ ಬೇರ್ಪಡಿಸಿ, ನಂತರ ಕಾರ್ಯಗತ ಪ್ರಕರಣಗಳನ್ನು Codex ಏರಲು ಸಾಧ್ಯವಾದ ಮೌಲ್ಯಮಾಪನ ಗುರಿಗಳಾಗಿ ಪರಿವರ್ತಿಸುತ್ತವೆ.

3. ಕಂಡುಬಂದದ್ದು Codex ಏರಬೇಕಾದ ಬೆಟ್ಟವಾಗುತ್ತದೆ

ಮೂರನೇ ಸ್ತಂಭವೆಂದರೆ ಈ ಹೊಸ evals ಮೇಲೆ ಕಾರ್ಯನಿರ್ವಹಿಸಬಲ್ಲ ಎಂಜಿನಿಯರಿಂಗ್ ಲೂಪ್ ಅನ್ನು ನಿರ್ಮಿಸುವುದು. ಇಲ್ಲಿಯೇ Codex ಕೇಂದ್ರವಾಗುತ್ತದೆ.

ನಮ್ಮ eval ಪೈಪ್‌ಲೈನ್ Tax AI ನಿರಂತರವಾಗಿ “fair rental days” ಕ್ಷೇತ್ರವನ್ನು ತಪ್ಪಿಸುತ್ತಿದೆ, ಆದರೆ ಪ್ರ್ಯಾಕ್ಟಿಷನರ್‌ಗಳು ಅದನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ತುಂಬುತ್ತಾರೆ ಎಂದು ಗುರುತಿಸುತ್ತದೆ ಎಂದು ಊಹಿಸೋಣ. ಈ ಕಂಡುಬಂದದ್ದು ಈಗಾಗಲೇ ಗುರಿತಪ್ಪದ eval ಸೆಟ್ ಆಗಿ, ಪ್ರತಿನಿಧಿ ಮೂಲ ಪ್ಯಾಕೇಜ್‌ಗಳು ಮತ್ತು ನಿರೀಕ್ಷಿತ ಔಟ್‌ಪುಟ್‌ಗಳೊಂದಿಗೆ ಪ್ಯಾಕೇಜ್ ಆಗಿರುವುದರಿಂದ, Codex ಉತ್ಪನ್ನ scaffold ಒಳಗೆ ನೇರವಾಗಿ ಮೂಲ ಕಾರಣವನ್ನು ಪರಿಶೀಲಿಸಬಹುದು.

Codex ಕೇವಲ ಕಡಿಮೆ ಗುಣಮಟ್ಟದ ಅಂತಿಮ ಔಟ್‌ಪುಟ್‌ನೊಂದಿಗೆ ಮಾತ್ರ ಕೆಲಸ ಮಾಡುತ್ತಿಲ್ಲ. ಅದು trace, eval, repo ಮತ್ತು skills ಅನ್ನು ಒಟ್ಟಿಗೆ ಪರಿಶೀಲಿಸುತ್ತದೆ:

ಪೈಪ್‌ಲೈನ್ ಪರಿಶೀಲಿಸಿ: ಸಮಸ್ಯೆ ಬೆಂಬಲಿಸದ ಕ್ಷೇತ್ರವೇ, ತಪ್ಪಿದ ಎಕ್ಸ್ಟ್ರಾಕ್ಷನ್ ಮಾದರಿಯೇ, ಮೂಲ-ಆಯ್ಕೆ ಸಮಸ್ಯೆಯೇ, mapper ಅಂತರವೇ, ಅಥವಾ grader ಸಮಸ್ಯೆಯೇ ಎಂಬುದನ್ನು ತಿಳಿಯಲು ಮೂಲ ಪ್ಯಾಕೇಜ್‌ಗಳು, extraction schemas, mapper ವರ್ತನೆ ಮತ್ತು code paths ಅನ್ನು ಪರಿಶೀಲಿಸಿ.
ಗುರಿತಪ್ಪದ ತಿದ್ದುಪಡಿಗಳನ್ನು ಜಾರಿಗೆ ತರು: extraction schema ವಿಸ್ತರಿಸಿ, ಬಾಡಿಗೆ-ಆಸ್ತಿ ದಾಖಲೆಗಳಿಗಾಗಿ source selection ಸುಧಾರಿಸಿ, tax-engine mapper ನವೀಕರಿಸಿ, ಅಥವಾ ನಿರೀಕ್ಷಿತ workflow noise ಅನ್ನು ವೈಫಲ್ಯವಾಗಿ ಎಣಿಸುತ್ತಿದ್ದರೆ grader ಅನ್ನು ಪರಿಷ್ಕರಿಸಿ.
ಮಾನ್ಯಗೊಳಿಸಿ ಮತ್ತು ಪ್ರಸ್ತಾಪಿಸಿ: ಗುರಿತಪ್ಪದ eval ಅನ್ನು ಮರುಚಲಾಯಿಸಿ, ವಿಶಾಲ regression suites ಅನ್ನು ಚಲಾಯಿಸಿ, ಮತ್ತು ಎಂಜಿನಿಯರಿಂಗ್ ವಿಮರ್ಶೆಗೆ ಅಭ್ಯರ್ಥಿ pull request ಅನ್ನು ತೋರಿಸಿ.
ಲೂಪ್ ಮುಚ್ಚಿ: ಮರುಕಳಿಸುವ ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ತಿದ್ದುಪಡಿಯನ್ನು ಅಳೆಯಬಹುದಾದ ಎಂಜಿನಿಯರಿಂಗ್ ಕಾರ್ಯವಾಗಿ ಪರಿವರ್ತಿಸಿ. ಸಾಕ್ಷ್ಯ ಅಸ್ಪಷ್ಟವಾಗಿದ್ದರೆ ಅಥವಾ ಸುರಕ್ಷಿತವಾಗಿ ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸಲಾಗದಿದ್ದರೆ, ಪ್ರಕರಣವನ್ನು ಲೂಪ್ ಮೂಲಕ ಬಲವಂತವಾಗಿ ಸಾಗಿಸುವ ಬದಲು ಮತ್ತೆ ಉತ್ಪನ್ನ ತಂಡಕ್ಕೆ ಕಳುಹಿಸಲಾಗುತ್ತದೆ.

ಆರಂಭದಿಂದ ಅಂತ್ಯದವರೆಗಿನ ಸ್ವಯಂ-ಸುಧಾರಣಾ ಲೂಪ್: ಉತ್ಪಾದನಾ ಟ್ರೇಸ್‌ಗಳು ಮರುಕಳಿಸುವ ಕ್ಷೇತ್ರ-ಮಟ್ಟದ ತಿದ್ದುಪಡಿಗಳನ್ನು ಹೊರತರುತ್ತವೆ; ಅವು Codex ಟ್ರೇಸ್, evals, repo ಮತ್ತು skills ಜೊತೆಗೆ ಪರಿಶೀಲಿಸಬಹುದಾದ ವೈಫಲ್ಯ ಸಂಕೇತಗಳಾಗುತ್ತವೆ. ಕಾರ್ಯಗತ ಮಾದರಿಗಳು ಮಿತಿಗೊಳಿಸಿದ evals ಮತ್ತು ಸಾಧ್ಯ ಉತ್ಪನ್ನ ಬದಲಾವಣೆಗಳಾಗುತ್ತವೆ; ಅಸ್ಪಷ್ಟ ಪ್ರಕರಣಗಳು ಪರಿಶೀಲನೆಗಾಗಿ ಮತ್ತೆ ಎಂಜಿನಿಯರ್‌ಗಳ ಬಳಿಗೆ ಹೋಗುತ್ತವೆ. ರವಾನಿಸಲಾದ ಪ್ರತಿಯೊಂದು ಸುಧಾರಣೆಯೂ ಮುಂದಿನ ಚಕ್ರಕ್ಕೆ ಹೊಸ ಉತ್ಪಾದನಾ ಸಾಕ್ಷ್ಯವನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ.

ಈ ಲೂಪ್ ನಿರ್ಮಿಸಲು Codex ಅನ್ನು ಹೇಗೆ ಬಳಸುವುದು

ಬಾಡಿಗೆ ಆಸ್ತಿ ಉದಾಹರಣೆ ಒಂದು ವಿಶಾಲ ಮರುಬಳಕೆ ಮಾಡಬಹುದಾದ ಮಾದರಿಯ ಪ್ರತಿನಿಧಿಯಾಗಿದೆ: ಉತ್ಪಾದನಾ ಕಲಾಕೃತಿಗಳು ಮತ್ತು ಟ್ರೇಸ್‌ಗಳನ್ನು ಬಳಸಿ ಏಜೆಂಟ್‌ನ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಸುಧಾರಿಸುವುದು. ಉತ್ಪಾದನಾ ಡೇಟಾದಿಂದ ವಿಮರ್ಶಿಸಲಾದ ಕಂಡುಬಂದವುಗಳು, ಮೂಲ ಟ್ರೇಸ್‌ಗಳು, ನಿರೀಕ್ಷಿತ tax-engine output, ಸಂಬಂಧಿತ code ಉದಾಹರಣೆಗಳು ಮತ್ತು eval commands ಇನ್‌ಪುಟ್‌ಗಳ ಸಮೂಹವಾಗಿ ನೀಡಿದಾಗ, Codex ವಾರಗಳು ಮತ್ತು ತಿಂಗಳುಗಳ ಅವಧಿಯಲ್ಲಿ ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ನಿಖರತೆಯಲ್ಲಿ ಸ್ಪಷ್ಟ ಸುಧಾರಣೆ ತರಬಹುದು. ಇದು harness engineering ಮತ್ತು Symphony ಕುರಿತು ನಮ್ಮ ಕೆಲಸದಲ್ಲಿ ವಿವರಿಸಿದ ತತ್ವಗಳ ಮೇಲೆ ನಿರ್ಮಿತವಾಗಿದೆ; ಅವು ಕಾರ್ಯಗಳನ್ನು Codex ಗೆ ಸ್ಪಷ್ಟವಾಗುವಂತೆ ಹೇಗೆ ಮಾಡುವುದು, ಮಿತಿಗೊಳಿಸಿದ ಸಂದರ್ಭ ಮತ್ತು ಟೂಲ್‌ಗಳನ್ನು ಹೇಗೆ ಒದಗಿಸುವುದು, ಮತ್ತು ಮಾನ್ಯತೆ ಹಾಗೂ ಮಾನವ ವಿಮರ್ಶೆಯನ್ನು ಪರಿಸರದ ಭಾಗವಾಗಿಯೇ ಹೇಗೆ ಉಳಿಸುವುದು ಎಂಬುದನ್ನು ವಿವರಿಸುತ್ತವೆ.

ಆ ಸಾಕ್ಷ್ಯ ಸ್ವಯಂಚಾಲಿತವಾಗಿ Codex ಕಾರ್ಯವಾಗುವುದಿಲ್ಲ. ಪ್ರ್ಯಾಕ್ಟಿಷನರ್ ತಿದ್ದುಪಡಿ ಎಕ್ಸ್ಟ್ರಾಕ್ಷನ್ ತಪ್ಪು, ಮ್ಯಾಪಿಂಗ್ ಸಮಸ್ಯೆ, ಬೆಂಬಲಿಸದ ಉತ್ಪನ್ನ ವರ್ತನೆ, ತೆರಿಗೆ ತೀರ್ಮಾನ, ಅಥವಾ ನಿರೀಕ್ಷಿತ ವರ್ಕ್‌ಫ್ಲೋ ಶಬ್ದವನ್ನು ಪ್ರತಿಬಿಂಬಿಸಬಹುದು. ಮರುಕಳಿಸುವ ವ್ಯತ್ಯಾಸಗಳನ್ನು ವಿಮರ್ಶಿಸಿ ಕಾರ್ಯಗತ ಕಂಡುಬಂದುವಾಗಿ ಗುಂಪುಗೊಳಿಸಿದ ನಂತರ ಮಾತ್ರ ವ್ಯವಸ್ಥೆ ಅವನ್ನು ಸ್ಪಷ್ಟ ಯಶಸ್ಸಿನ ಷರತ್ತಿನೊಂದಿಗೆ ಮಿತಿಗೊಳಿಸಿದ ಕಾರ್ಯವಾಗಿ ಪರಿವರ್ತಿಸುತ್ತದೆ.

ನಾವು ಈ ಸ್ವಯಂಚಾಲನೆಯನ್ನು ಉತ್ಪನ್ನದ ಮಿತಿಗೊಳಿಸಿದ ಪದರಕ್ಕೆ ಅನ್ವಯಿಸುತ್ತೇವೆ. ಈ ಪದರವು ಎಕ್ಸ್ಟ್ರಾಕ್ಷನ್ ನಡೆಸಿ ಮೂಲ ದಾಖಲೆಗಳನ್ನು ತೆರಿಗೆ ವರ್ಕ್‌ಫ್ಲೋಗಳಿಗೆ ಮ್ಯಾಪ್ ಮಾಡುತ್ತದೆ. ವಾಸ್ತುಶಿಲ್ಪ, ಉತ್ಪನ್ನ ನಿರ್ಧಾರಗಳು ಮತ್ತು ರವಾನೆಯ ಜವಾಬ್ದಾರಿ ಎಂಜಿನಿಯರ್‌ಗಳದ್ದೇ ಆಗಿರುತ್ತದೆ. ಪ್ರ್ಯಾಕ್ಟಿಷನರ್‌ಗಳು ಅವರು ಈಗಾಗಲೇ ಮಾಡುವ ಕೆಲಸದ ಮೂಲಕ ಸುಧಾರಣಾ ಲೂಪ್‌ಗೆ ದಿಕ್ಕು ನೀಡುತ್ತಾರೆ: ಎಕ್ಸ್ಟ್ರಾಕ್ಟ್ ಮಾಡಿದ ಮೌಲ್ಯಗಳನ್ನು ತಿದ್ದುವುದು, ರಿಟರ್ನ್‌ಗಳನ್ನು ವಿಮರ್ಶಿಸುವುದು, ಮತ್ತು ಅಂತಿಮ ಫೈಲಿಂಗ್‌ಗಳನ್ನು ಅನುಮೋದಿಸುವುದು.

Codex ಗಾಗಿ, ಫಲಿತಾಂಶವು ಅಸ್ಪಷ್ಟ ಎಚ್ಚರಿಕೆ ಅಲ್ಲ; ಬದಲಾಗಿ ಸಾಕ್ಷ್ಯ, ಸಂಪಾದಿಸಬಹುದಾದ ಉತ್ಪನ್ನ ಮೇಲ್ಮೈಗಳು ಮತ್ತು ಸ್ಪಷ್ಟ ಮಾನ್ಯತಾ ಗೇಟ್‌ಗಳಿರುವ ಮಿತಿಗೊಳಿಸಿದ ಎಂಜಿನಿಯರಿಂಗ್ ಕಾರ್ಯವಾಗಿದೆ. ಪ್ರತಿನಿಧಿ ಬಾಡಿಗೆ ಆಸ್ತಿ ಕಾರ್ಯದ ಸಂದರ್ಭವನ್ನು ಹೀಗಾಗಿ ಸಂಕ್ಷಿಪ್ತಗೊಳಿಸಬಹುದು:

ಸರಳ ಪಠ್ಯ

1/candidates/FIND-RENTAL-0042/
2│
3├── repo/                                                   [1]
4│   └── branch: codex/fix-rental-0042
5│       │
6│       ├── AGENTS.md
7│       │
8│       ├── tasks/FIND-RENTAL-0042/
9│       │   ├── task.yaml
10│       │   ├── EXEC_PLAN.md
11│       │   └── RESULTS.md
12│       │
13│       ├── app/tax-ai/rental-income/                          [2]
14│       │   ├── agent.ts
15│       │   ├── schema.ts
16│       │   ├── provenance.ts
17│       │   └── mapper.ts
18│       │
19│       ├── evals/                                          [3]
20│       │   ├── datasets/fair-rental-days.yaml
21│       │   ├── suites/fair-rental-days.yaml
22│       │   ├── suites/rental-income-regression.yaml
23│       │   └── graders/rental-income.yaml
24│       │
25│       ├── skills/                                         [4]
26│       │   ├── eval-runner/
27│       │   └── tax-field-docs/
28│       │
29│       └── docs/                                           [4]
30│           ├── architecture/
31│           └── task-environments/
32│
33└── scoped-tools/                                           [5]
34    ├── production-trace
35    ├── source-artifacts
36    └── tax-engine-docs

ಮಿತಿಗೊಳಿಸಿದ Codex ಕಾರ್ಯ ಪರಿಸರವು ಬರೆಯಬಹುದಾದ worktree [1] ಅನ್ನು ಓದಲು ಮಾತ್ರ ಸಾಧ್ಯವಾದ ಉತ್ಪಾದನಾ ಸಂದರ್ಭ [5]ದಿಂದ ಬೇರ್ಪಡಿಸುತ್ತದೆ. worktree ಯಲ್ಲಿ Codex ಪರಿಶೀಲಿಸಬಹುದಾದ ಅಥವಾ ಬದಲಾಯಿಸಬಹುದಾದ ಮಿತಿಗೊಳಿಸಿದ ಉತ್ಪನ್ನ ಮೇಲ್ಮೈ [2], ಯಶಸ್ಸನ್ನು ನಿರ್ಧರಿಸುವ ಗುರಿತಪ್ಪದ ಮತ್ತು regression evals [3], ಹಾಗೂ ಕಾರ್ಯವನ್ನು ಹೇಗೆ ನಡೆಸಬೇಕು ಮತ್ತು ಹಿಂದಿನ ನಿರ್ಧಾರಗಳನ್ನು ಹೇಗೆ ಗೌರವಿಸಬೇಕು ಎಂಬುದನ್ನು ಸಂಕೇತಿಸುವ ಮರುಬಳಕೆ ಮಾಡಬಹುದಾದ skills/docs [4] ಇವೆ. ಓದಲು ಮಾತ್ರ ಸಾಧ್ಯವಾದ ಸಂದರ್ಭವು ಉತ್ಪಾದನಾ trace, ಮೂಲ ದಾಖಲೆಗಳು, Tax AI ಊಹೆ, ಅಂತಿಮಗೊಳಿಸಿದ ರಿಟರ್ನ್ ಮತ್ತು tax-engine ಕ್ಷೇತ್ರದ ದಾಖಲೆಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ; ಹೀಗಾಗಿ Codex ಮೂಲ ಸಾಕ್ಷ್ಯವನ್ನು ಬದಲಾಯಿಸದೆ ವೈಫಲ್ಯವನ್ನು ಪರಿಶೀಲಿಸಬಹುದು.

ಹೊಸ ಕ್ಷೇತ್ರಗಳಿಗೆ ವಿಸ್ತರಣೆ

ಅದೇ ಲೂಪ್ ಬಾಡಿಗೆ ಆಸ್ತಿಗಳಾಚೆಯೂ ಅನ್ವಯಿಸುತ್ತದೆ. ಬಾಡಿಗೆ ಆಸ್ತಿಗಳು 90% precision ಮತ್ತು recall ತಲುಪಲು ಸುಮಾರು ಆರು ವಾರಗಳು ಮತ್ತು ಸಾಕಷ್ಟು ಎಂಜಿನಿಯರಿಂಗ್ ಮೇಲ್ವಿಚಾರಣೆ ತೆಗೆದುಕೊಂಡವು, ಆದರೆ ಆ ಕೆಲಸವು ಮರುಬಳಕೆ ಮಾಡಬಹುದಾದ abstractions, review artifacts, eval conventions ಮತ್ತು implementation patterns ಅನ್ನು ನೀಡಿತು; ಇದರಿಂದ Schedule C ಮತ್ತು Schedule A ಮುಂತಾದ ಸಮಾನವಾಗಿ ಸಂಕೀರ್ಣ ಶೆಡ್ಯೂಲ್‌ಗಳಿಗೆ ಬೆಂಬಲ ನೀಡುವುದು ಸುಲಭವಾಯಿತು.

Tax AI ಸ್ವಯಂ-ಸುಧಾರಿಸುವ ಏಜೆಂಟ್‌ಗಳನ್ನು ನಿರ್ಮಿಸುವ ಮಾರ್ಗವನ್ನು ತೋರಿಸುತ್ತದೆ. ಪ್ರ್ಯಾಕ್ಟಿಷನರ್‌ಗಳು ಸೇವೆಯನ್ನು ಒದಗಿಸುವ ಮೂಲಕ ಹೆಚ್ಚಿನ ಮೌಲ್ಯದ ಪ್ರತಿಕ್ರಿಯಾ ಸಂಕೇತಗಳನ್ನು ಸೃಷ್ಟಿಸುತ್ತಾರೆ. ಉತ್ಪನ್ನ ವರ್ಕ್‌ಫ್ಲೋಗಳು ಆ ಸಂಕೇತಗಳನ್ನು ರಚಿತ ಸಾಕ್ಷ್ಯವಾಗಿ ಉಳಿಸುತ್ತವೆ. Eval ಆಧಾರಿತ ಎಂಜಿನಿಯರಿಂಗ್ ವ್ಯವಸ್ಥೆಗಳು ಸುಧಾರಣೆಗಳು ಉತ್ಪಾದನೆಗೆ ತಲುಪುವ ಮೊದಲು ಅವನ್ನು ಮಾನ್ಯಗೊಳಿಸುತ್ತವೆ, ಮತ್ತು ಏಜೆಂಟ್ ಚಾಲಿತ ಲೂಪ್ ವ್ಯವಸ್ಥೆಯನ್ನು ನಿರಂತರ ಸ್ವಯಂ-ಸುಧಾರಣಾ ಹರಿವಿನಲ್ಲಿ ಇಡುತ್ತದೆ.

Thrive Holdings ರಚನೆ ನಮಗೆ ಈ ಪರಿಸರವನ್ನು ನಿರ್ದಿಷ್ಟ ಕೈಗಾರಿಕೆಗಳಲ್ಲಿ ಮರುನಿರ್ಮಿಸಲು ಅವಕಾಶ ನೀಡುತ್ತದೆ. Holdings ಮಾಲೀಕರೂ Operator ಕೂಡ ಆಗಿರುವುದರಿಂದ, ನಮ್ಮ ಸಂಯುಕ್ತ ಎಂಜಿನಿಯರಿಂಗ್ ತಂಡಗಳು Crete ಮುಂತಾದ ವ್ಯವಹಾರಗಳ ಒಳಗಿನಿಂದಲೇ ಪ್ರ್ಯಾಕ್ಟಿಷನರ್‌ಗಳು ಮತ್ತು ಉತ್ಪಾದನಾ ಡೇಟాతో ನೇರವಾಗಿ ಕೆಲಸ ಮಾಡಬಹುದು; ವಿತರಕರಾಗಿ ಅಲ್ಲ, ಪಾಲುದಾರರಾಗಿ. ಇದರಿಂದ ತಂತ್ರಜ್ಞಾನ, ಉತ್ಪನ್ನ ಮತ್ತು ಸೇವೆ ಎಲ್ಲವೂ ಒಂದೇ ಗೂಡಿನಡಿ ಸೇರಿ ನಮಗೆ ವೇಗವಾಗಿ ಸಾಗಲು ಮತ್ತು ಅತ್ಯುತ್ತಮ ಉತ್ಪನ್ನಗಳನ್ನು ನಿರ್ಮಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ.

ಹಿಂದಿನ ವರ್ಷ ತೆರಿಗೆ ತಯಾರಿಕೆಗೆ 180 ಗಂಟೆಗಳನ್ನು ಖರ್ಚು ಮಾಡಿದ ಒಬ್ಬ ಹಿರಿಯ ಲೆಕ್ಕಪರಿಶೋಧಕಿ ಈ ವರ್ಷ ಅದಕ್ಕೆ ಕೇವಲ 15 ಗಂಟೆಗಳನ್ನು ಮಾತ್ರ ಖರ್ಚು ಮಾಡಿದರು. ಆ ಸಮಯದ ಒಂದು ಭಾಗವನ್ನು ಅವರು ತಮ್ಮ ಪ್ರತಿಯೊಬ್ಬ ಗ್ರಾಹಕರಿಗೂ ಕರೆ ಮಾಡಿ ಅವರ ರಿಟರ್ನ್‌ಗಳನ್ನು ವಿವರಿಸಲು ಬಳಸಿದರು; ಒಂದು ವರ್ಷದ ಹಿಂದೆ ಸಾಧ್ಯವಾಗದಷ್ಟು ಹೆಚ್ಚಿನ ಸ್ಪರ್ಶದ ಸೇವಾ ಮಟ್ಟ ಅದು. ಉಳಿದ ಸಮಯವನ್ನು ಅವರು ಹೊಸ ಗ್ರಾಹಕರನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಮತ್ತು ಹೊಸ ಸೇವಾ ಆಫರ್‌ಗಳಿಗೆ ವಿಸ್ತರಿಸಲು ಬಳಸಿದರು.

ಒಟ್ಟಾಗಿ, ನಮ್ಮ ತಂಡಗಳು ಈಗ Tax AI ಯ ಅದೇ ಮೂರು-ಭಾಗದ ವಿನ್ಯಾಸವನ್ನು Thrive Holdings⁠(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಅಡಿಯಲ್ಲಿ ಇತರ ಕ್ಷೇತ್ರಗಳ ವರ್ಕ್‌ಫ್ಲೋಗಳನ್ನು ನಿರ್ಮಿಸಲು ಬ್ಲೂಪ್ರಿಂಟ್ ಆಗಿ ಬಳಸುತ್ತಿವೆ; ಲೆಕ್ಕಪತ್ರ ವರ್ಕ್‌ಫ್ಲೋಗಳು ಉದಾಹರಣೆಗೆ bookkeeping ಮತ್ತು audit, ಹಾಗೂ ಕಾರ್ಯಾಚರಣಾ ವರ್ಕ್‌ಫ್ಲೋಗಳು ಉದಾಹರಣೆಗೆ IT help desk automation. ಕ್ಷೇತ್ರಗಳು ಮತ್ತು ಕೈಗಾರಿಕೆಗಳಾದ್ಯಂತ, ಸ್ವಯಂ-ಸುಧಾರಿಸುವ ಏಜೆಂಟ್‌ಗಳ ವಿಶಾಲ ವಾಗ್ದಾನ ಸ್ಥಿರವಾಗಿದೆ. ಅತ್ಯುತ್ತಮ ಏಜೆಂಟ್‌ಗಳಿಗೆ ಜನರು ದಿಕ್ಕು ನೀಡುತ್ತಾರೆ, ಹೀಗೆ ಅವು ಕಾಲಕ್ರಮೇಣ ಹೆಚ್ಚು ಸಾಮರ್ಥ್ಯವುಳ್ಳವು, ಹೆಚ್ಚು ವಿಶ್ವಾಸಾರ್ಹವು ಮತ್ತು ಹೆಚ್ಚು ಮೌಲ್ಯಯುತವಾಗಲು ಕಲಿಯುತ್ತವೆ.

ಈ ಯೋಜನೆಯಲ್ಲಿ ಕೆಲಸ ಮಾಡಿದ OpenAI ತಂಡದ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿಯಲು, ಸಂಪರ್ಕಿಸಿ.

ಲೇಖಕ

Aravind Srinivasan, Samay Shamdasani, Arthur Fernandes Araujo, John de Wasseige

ಓದು ಮುಂದುವರಿಸಿ

ಎಲ್ಲವನ್ನೂ ನೋಡಿ

Core dump epidemiology: fixing an 18-year-old bug

ಎಂಜಿನಿಯರಿಂಗ್ಜೂನ್ 30, 2026

Windows ನಲ್ಲಿ Codex ಅನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಲು ಸುರಕ್ಷಿತ, ಪರಿಣಾಮಕಾರಿ ಸ್ಯಾಂಡ್‌ಬಾಕ್ಸ್ ನಿರ್ಮಿಸುವುದು

ಎಂಜಿನಿಯರಿಂಗ್ಮೇ 13, 2026

ಗಾಬ್ಲಿನ್‌ಗಳು ಎಲ್ಲಿಂದ ಬಂದವು

ಎಂಜಿನಿಯರಿಂಗ್ಮೇ 5, 2026