
Korte videoer er drivkraften bag moderne handel, men det er sværere end det ser ud til at producere videoer, der rent faktisk virker. Klip, der fremstår ubesværede på TikTok, Reels og Shorts, er baseret på usynlige regler: hook-timing, optagelsesrytme, kamerabevægelser, tempo og andre subtile signaler, der får indholdet til at føles "naturligt" i forhold til det, der er populært.
Higgsfield(åbner i et nyt vindue) er en generativ medieplatform, der lader teams skabe korte, filmiske videoer fra et produktlink, et billede eller en simpel idé. Ved at bruge OpenAI GPT‑4.1 og GPT‑5 til at planlægge og Sora 2 til at skabe genererer systemet cirka 4 millioner videoer om dagen, og omdanner minimalt input til struktureret, social-first-videoer.
"Brugere beskriver sjældent, hvad en model egentlig har brug for. De beskriver, hvad de gerne vil føle. Vores opgave er at omsætte den hensigt til noget, som en videomodel kan udføre, ved at bruge OpenAI-modeller til at omsætte mål til tekniske instruktioner."
Folk tænker ikke i optagelseslister. De siger ting som “gør det dramatisk” eller “det her skal føles eksklusivt.” Videomodeller kræver derimod struktureret vejledning: regler for timing, bevægelsesbegrænsninger og visuelle prioriteter.
For at bygge bro over denne kløft har Higgsfield-teamet udviklet det, de kalder et filmisk logiklag, der fortolker den kreative intention og udvider den til en konkret videoplan, inden genereringen finder sted.
Når en bruger angiver en produkt-URL eller et billede, anvender systemet GPT‑4.1 mini og GPT‑5 til at udlede narrativ bue, tempo, kameralogik og visuel vægt. I stedet for at udsætte brugerne for rå prompts, integrerer Higgsfield filmisk beslutningstagning i systemet selv. Når planen er konstrueret, gengiver Sora 2 bevægelse, realisme og kontinuitet baseret på de strukturerede instruktioner.
Den planlægningsorienterede tilgang afspejler teamet bag produktet. Higgsfield samler ingeniører og erfarne filmskabere, herunder prisvindende instruktører, sammen med en ledelse, der har dybe rødder i forbrugermedier. Medstifter og administrerende direktør Alex Mashrabov ledte tidligere generativ AI hos Snap, hvor han opfandt Snap-linser og formede, hvordan hundreder af millioner af mennesker interagerer med visuelle effekter i stor skala.
For Higgsfield er viralitet et sæt målbare mønstre, der identificeres ved hjælp af GPT‑4.1 mini og GPT‑5 til at analysere korte sociale videoer i stor skala og destillere disse resultater til gentagelige kreative strukturer.
Internt definerer Higgsfield viralitet ud fra engagement-til-rækkevidde-forholdet, med særlig fokus på delingshastighed. Når delinger begynder at overhale likes, ændrer indhold sig fra passivt forbrug til aktiv distribution.
Higgsfield indkoder tilbagevendende, virale strukturer i et bibliotek af videoforudindstillinger. Hver forudindstilling har en specifik fortællestruktur, tempo og kameralogik, som ses i indhold med høj ydeevne. Der oprettes cirka 10 nye forudindstillinger hver dag, og ældre forudindstillinger fjernes, når engagementet aftager.
Disse forudindstillinger driver Sora 2 Trends, som lader skabere generere trendnøjagtige videoer fra et enkelt billede eller en idé. Systemet anvender automatisk bevægelseslogik og platformstempo, hvilket producerer output, der er tilpasset hver trend uden manuel justering.
Sammenlignet med Higgsfields tidligere baseline viser videoer genereret gennem dette system en stigning på 150 % i delingshastighed og cirka 3x højere kognitiv fastholdelse, målt gennem efterfølgende engagementadfærd.
Click-to-Ad er baseret på de samme planlægningsprincipper, som gælder for resten af platformen, og er udviklet på baggrund af den positive modtagelse af Sora 2 Trends. Funktionen fjerner “promptbarrieren” ved at bruge GPT‑4.1 til at fortolke produktintentionen og Sora 2 til at generere videoer.
Sådan fungerer det:
- En bruger indsætter et link til en produktside
- Systemet analyserer siden for at udtrække brandintention, identificere vigtige visuelle ankre og forstå, hvad der er vigtigt ved produktet
- Når produktet er identificeret, kortlægger systemet det til en af de foruddefinerede trendindstillinger
- Sora 2 genererer den endelige video og anvender hver forudindstillings komplekse professionelle standarder for kamerabevægelse, rytmisk pacing og stilistiske regler
Målet er hurtig, brugbar output, der passer til sociale platforme i første forsøg, og det skift ændrer, hvordan teams arbejder. Brugere får nu typisk en brugbar video i et eller to forsøg, i stedet for at skulle igennem fem eller seks prompter. For marketingteams betyder det, at kampagner kan planlægges ud fra volumen og variation, ikke ved at prøve sig frem.
En typisk generering tager 2‑5 minutter, afhængigt af arbejdsgangen. Fordi platformen understøtter samtidige kørsler, kan teams generere snesevis af variationer på en time, hvilket gør det praktisk at teste kreative retninger, efterhånden som trends skifter.
Siden lanceringen i begyndelsen af november er Click-to-Ad blevet taget i brug af mere end 20 % af professionelle skabere og virksomhedsteams på platformen, målt på om output downloades, publiceres eller deles som en del af livekampagner.
Higgsfields system er afhængigt af flere OpenAI-modeller, der hver især er valgt ud fra opgavens krav.
For deterministiske, formatbegrænsede arbejdsgange, såsom håndhævelse af forudindstillet struktur eller anvendelse af kendte kamera-bevægelsesskemaer, dirigerer platformen forespørgsler til GPT‑4.1 mini. Disse opgaver drager fordel af høj styrbarhed, forudsigelige resultater, lav varians og hurtig inferens.
Mere tvetydige arbejdsgange kræver en anderledes tilgang. Når systemet skal udlede hensigt fra delvise input, såsom at fortolke en produktside eller afstemme visuelle og tekstuelle signaler, dirigerer Higgsfield forespørgsler til GPT‑5, hvor dybere ræsonnering og multimodal forståelse opvejer hensyn til latenstid eller omkostninger.
Rutevalg styres af interne heuristikker, der vurderer:
- Påkrævet ræsonneringsdybde versus acceptabel latenstid
- Forudsigelighed af output versus kreativ frihed
- Eksplicit versus udledt hensigt
- Maskinforbrugte versus menneskevendte output
“Vi betragter det ikke som at vælge den bedste model,” siger Yerzat Dulat, CTO og medstifter af Higgsfield “Vi tænker i forhold til adfærdsmæssige styrker. Nogle modeller er bedre til præcision. Andre er bedre til at fortolke. Systemet dirigerer derefter i forhold til dette."
Mange af Higgsfields arbejdsgange ville ikke have været mulige for seks måneder siden.
Tidligere billed- og videomodeller kæmpede med konsistens: karakterer drev væk, produkter ændrede form, og længere sekvenser gik i stykker. Nylige fremskridt i OpenAI’s billed- og videomodeller har gjort det muligt at opretholde visuel kontinuitet på tværs af optagelser, hvilket muliggør mere realistisk bevægelse og længere fortællinger.
Det skift åbnede nye formater. Higgsfield lancerede for nylig Cinema Studio, et horisontalt arbejdsområde designet til trailere og kortfilm. Tidlige skabere producerer allerede videoer på flere minutter, der cirkulerer bredt online og ofte er svære at skelne fra live-action-optagelser.
Efterhånden som OpenAI-modellerne fortsætter med at udvikle sig, udvider Higgsfields system sig sammen med dem. Nye muligheder bliver omsat til arbejdsprocesser, der virker indlysende i bakspejlet, men som ikke var mulige før. Efterhånden som modeller modnes, bevæger arbejdet med storytelling sig væk fra administion af værktøjer og hen imod at træffe beslutninger om tone, struktur og mening.


