Denne uken har det vært bemerkelsesverdige fremskritt innen kunstig intelligens. Fra nye modeller med betydelig reduserte kostnader til innovative verktøy for kreativ utfoldelse – AI-teknologien fortsetter å utvikle seg i et høyt tempo. Her er ukens viktigste nyheter fra AI-verdenen.
Googles innovasjoner: Canvas, NotebookLM og mer
Google har lansert flere imponerende nyheter denne uken. Den nye Canvas-funksjonen i Gemini forenkler arbeidet med innhold og kode. Funksjonen inkluderer kodeforhåndsvisning og gir betydelig bedre muligheter for koding. Ved sammenligning av samme oppgave på tvers av ulike plattformer, viser Gemini Canvas seg å være overlegen når det gjelder å lage funksjonelle nettsider. Det mest bemerkelsesverdige er at denne funksjonen er helt gratis.
I tillegg har Google oppdatert NotebookLM med tankekart. Nå er det mulig å laste inn flere kilder i NotebookLM og visualisere hvordan alle ideene henger sammen med ett enkelt klikk. Dette er spesielt nyttig ved arbeid med store datamengder eller forsøk på å forstå komplekse temaer.
Google har også lagt til en lydoppsummering i både NotebookLM og Gemini, som muliggjør generering av podkast-lignende samtaler mellom to AI-stemmer. Ved opplasting av et dokument, skapes en 6-minutters lydoversikt med ett klikk. Resultatet er to AI-stemmer som har en naturlig samtale om emnet. Dette er foreløpig unikt for Googles økosystem – det er ikke mulig å gjøre dette med Claude, ChatGPT eller Grok.
Gemini har i tillegg fått en ny tegnefunksjon som forvandler enkle skisser til mer detaljerte kunstverk. Dette er basert på Gemini 2.0s innebygde bildegenerering og er underholdende å eksperimentere med. Det som er spesielt bra er hvordan den forstår hva man forsøker å tegne, selv om tegneferdighetene er begrensede.
En av de mest imponerende demonstrasjonene av Gemini Canvas er dens evne til å lage interaktive spill med en enkel prompt. Uten kodeerfaring er det mulig å få et fungerende spill med korrekt fysikk, lyd og poengberegning, alt fra en enkelt prompt.
Kinas AI-revolusjon: Baidu-modeller til 1% av OpenAIs kostnad
Baidu har lansert to nye modeller – Ernie 4.5 og Ernie X1. Ernie 4.5 er sammenlignbar med GPT-4.5, mens X1 er en tenkemodell som ligner DeepSeek eller OpenAI O1 Mini. Det mest oppsiktsvekkende er at Ernie 4.5 presterer på nivå med GPT-4.5, men til mindre enn 1% av prisen. Det dreier seg om 55 cent per million input-tokens sammenlignet med OpenAIs $40, og $2,20 per million output-tokens. X1-modellen er til og med halv pris av DeepSeek R1, som allerede var betydelig billigere enn vestlige modeller.
Claude kan nå søke på nettet
Anthropic har endelig lansert nettverkssøk for Claude. Dette er en viktig oppdatering ettersom Claude tidligere var begrenset til informasjon opp til datoen for treningsavslutning. Det som er imponerende med Claudes implementering er at den utfører flere søk samtidig for å oppnå mer omfattende resultater. Tester viser at Claude med nettverkssøk nå er kraftigere enn tidligere, og muligens bedre enn ChatGPT for de fleste bruksområder.
Mistral Small 3.1
Mistral, et fransk AI-selskap, har lansert Mistral Small 3.1 som overgår Googles Gemma 3 i ytelsestester, til tross for at den er designet for effektiv kjøring på enheter. Det som gjør dette imponerende er at den har et massivt 128k token kontekstvindu, er multimodal (kan håndtere tekst og bilder), og leverer 150 tokens per sekund. Den er også flerspråklig og god på programmering, resonnering og visuell forståelse. Det beste av alt er at den er åpen kildekode og kan kjøres lokalt.
Claude MCP-agenter
Claude har lansert MCP-servere som muliggjør tilkobling til applikasjoner uten separat installasjon. Den vanlige måten å sette opp dette på er komplisert og teknisk, men det finnes nå en svært enkel måte å gjøre det på ved hjelp av Claude 3.7 Sonnet i Visual Studio Code. Alt som kreves er å installere Visual Studio Code, legge til klientutvidelsen og koble til en Anthropic API-nøkkel. Deretter kan man gå til MCP Marketplace og installere servere for tjenester som Perplexity, Gmail, Google Drive, Airtable, Shopify og flere.
Roblox’ nye AI-system for 3D-modellgenerering
Roblox har introdusert et nytt AI-system kalt Cube som genererer 3D-modeller fra tekst- eller stemmekommandoer. Dette er første gang generative 3D-modeller er integrert i en plattform med hundrevis av millioner brukere. Roblox har rundt 85 millioner daglige aktive brukere, hvorav 2,5 millioner er utviklere som skaper innhold i spillet. I stedet for å lære kompleks 3D-modellering, kan brukere beskrive hva de ønsker, som «en rød buggy med knudrete dekk» eller «et grønt krystallsword med gulldetaljer», og AI-en genererer det umiddelbart.
Pika’s objektmanipulering for videoer
Pika lanserer en imponerende ny funksjon som lar brukere manipulere spesifikke objekter i en video, samtidig som alt annet holdes nøyaktig det samme. Dette presisjonsnivået for videogenerering er nytt. Funksjonen er foreløpig kun tilgjengelig for deres Creative Partner Program, men viser veien for AI-video – mot mer presis kontroll snarere enn å bare generere hele scener fra bunnen av.
Hva dette betyr for fremtiden
Innovasjonstakten som observeres for tiden er svimlende.
Dette er ikke bare trinnvise forbedringer – det observeres fundamentale endringer i hva som er mulig og hvem som kan skape med disse verktøyene. Barrierene for kreativ utfoldelse reduseres raskt. Det mest spennende er hvordan disse verktøyene blir mer tilgjengelige. Mye av det som presenteres her er tilgjengelig gratis eller til en svært lav kostnad.
En verden nærmer seg der alle med en idé kan realisere den, enten det er en nettside, et spill, en podkast eller en kompleks AI-agent som automatiserer deler av arbeidet. Den begrensende faktoren er ikke lenger teknisk evne eller ressurser – det er fantasien.
Dette er utvilsomt en av de mest spennende ukene i AI-historien. Antallet banebrytende funksjoner og kapabiliteter som er lansert på bare noen få dager er enestående. Det er tydelig at AI ikke lenger er i en potensiell-fase – den er solid forankret i den praktiske anvendelsesfasen.