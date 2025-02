Tillsammans med OpenAI:s ChatGPT, Microsofts Copilot och Apple Intelligence är Google Gemini en av de dominerande aktörerna inom artificiell intelligens (AI) och chatbotar. Gemini är både namnet på Googles chatbot och det stora språkmodellen (LLM) som driver den. Den är gratis att använda via en webbläsare eller mobil, men det finns även en betalversion, Gemini Advanced, som har några avancerade funktioner, inklusive Gemini Live.

Google Gemini gjorde entré i februari 2024 och skapade omedelbart stor uppmärksamhet i AI-världen, men det var lanseringen av Gemini Live på Made for Google-evenemanget i augusti 2024 som verkligen satte tekniken på kartan. Gemini Live är en version av Gemini som körs på Android-telefoner och låter dig ha naturliga konversationer om komplexa ämnen med din röst, istället för att skriva på tangentbordet.

Men är Gemini Live tillräckligt kraftfullt för att slå Apples AI-förbättrade Siri eller den kommande ChatGPT Voice Mode? Vad kan den göra idag och vad är planerat för framtiden? Och om du vill använda Gemini, hur gör du det?

Vi har gjort en djupdykning i världen av Google Gemini för att besvara alla dessa frågor och mer därtill. Om du är nyfiken på Googles senaste AI-satsning, har du kommit rätt.

Vad är Google Gemini?

Gemini är Googles stora språkmodell (LLM). En LLM är ett system som ligger till grund för de AI-verktyg som du förmodligen har sett och använt på internet. Till exempel driver GPT-4 OpenAI:s ChatGPT-4o, den kostnadsfria chatboten, samt ChatGPT Plus, dess betalversion.

Gemini är mer än bara en AI-modell, det är även det nya namnet på Googles chatbot, tidigare känd som Bard. Google har förenklat namngivningen genom att kalla både den underliggande modellen och chatboten för Gemini. Det finns också en gratis Gemini-app för Android och om du vill kan Gemini ersätta Google Assistant på din Android-telefon. På iOS finns Gemini integrerat i Google-appen. Dessutom kan den kostnadsfria versionen av Google Gemini användas via vilken webbläsare som helst.

Utöver detta har Google även döpt om sin Duet AI-tjänst, som är inriktad på företag, till Gemini for Workspace, där det erbjuds en mängd produktivitetsrelaterade funktioner.

Förutom den kostnadsfria versionen av Gemini för konsumenter finns även en prenumerationsbaserad version kallad Gemini Advanced. Denna betalversion bygger på en kraftfullare LLM vid namn Gemini Ultra och de som prenumererar på Google One AI Premium får extra fördelar, såsom möjligheten att använda Gemini Live på mobil – en röststyrd AI-upplevelse för Android-telefoner.

Alla Googles AI-tjänster har nu samlats under Gemini-paraplyet för att förenkla saker och ting, oavsett om det gäller AI för konsumenter eller företag, samt oavsett om du använder Gemini via webben, assistenten eller appen på din telefon.

Vad kan Gemini göra?

Gemini kan göra en hel del, men du vill förmodligen ha en mer detaljerad förklaring än så.

Som vi redan nämnt är Gemini ett omfattande AI-ekosystem som samlar en rad olika funktioner och möjligheter under ett och samma varumärke. Precis som andra chatbotar, exempelvis ChatGPT, har Gemini generativa egenskaper, vilket innebär att du kan be den hjälpa dig att packa inför din nästa resa eller få en historielektion om Sokrates.

Gemini är en multimodal LLM, vilket betyder att den kan hantera flera olika typer av in- och utdata, inklusive text, kod, ljud, bilder och video. Det ger den en stor flexibilitet att utföra många olika uppgifter. Du kan ladda upp en bild eller ta en med din telefon, och sedan låta Gemini analysera den och berätta mer om innehållet. Klistrar du in kod i chatten och ber den skriva om den, kan Gemini hantera det också.

Det finns dock fyra olika LLM-modeller som Google har implementerat i Gemini. Dessa är Gemini Ultra, Pro, Flash och Nano. När du använder Gemini via webbplatsen får du tillgång till Gemini Flash, vilket är Googles lättviktsmodell optimerad för snabbhet och effektivitet. Om du har en betalprenumeration via Gemini Advanced får du istället tillgång till Gemini Ultra, som är den största och mest kraftfulla modellen för avancerade uppgifter, samt Gemini Pro, som enligt Google är den bästa modellen för generella uppgifter över ett brett spektrum. Slutligen finns Gemini Nano, en mindre modell som är designad för att köras direkt på enheter. Den används på de nya Pixel 9-telefonerna och möjliggör Gemini Live-funktionen, där du kan ha en röststyrd konversation som känns mer naturlig. Alla dessa LLM-modeller är för närvarande på version 1.5.

Det är svårt att ignorera ironin i att Googles förenklade varumärkesstruktur under Gemini-namnet snarare har skapat en viss förvirring, med olika versioner och modeller som alla bär samma namn i någon form.

Så vad kan Gemini faktiskt göra? Det kan svara på frågor, sammanfatta text, skriva kod, översätta och skapa bilder (dock endast i mobilversionen, inte i en webbläsare som kör den kostnadsfria Gemini Flex 1.5). Google utvecklar även en konkurrent till Midjourney genom sin bildgenereringsmodell Imagen 3 och det är troligt att denna kommer att integreras i Gemini inom en snar framtid. Dessutom är Gemini kopplat till andra Google-tjänster som Gmail, Google Maps och YouTube. Det innebär att om du exempelvis ber om rekommendationer på sevärdheter kan Gemini visa dem direkt i Google Maps.

För Android-användare finns det ännu fler fördelar, då Gemini kan ersätta Google Assistant och använda sin AI-funktionalitet genom andra Google-tjänster, inklusive Maps och sök. Google Assistant tas dock inte bort helt från enheten utan finns kvar i bakgrunden. Om du är en Gemini Advanced-prenumerant får du dessutom ännu djupare integration och möjlighet att hantera mer komplexa uppgifter med hjälp av röststyrning.

Det valet kan få dig att undra: är Gemini en bra ersättare för Google Assistant? Vi har testat detta grundligt under vår tid med Gemini på Android och det finns definitivt vissa nackdelar med AI:n. Gemini är märkbart långsammare än Google Assistant och tekniken har fortfarande buggar. Till exempel kan den interagera med foton, men funktionen är inte alltid helt pålitlig.

Med det sagt var den första versionen av Gemini på Android betydligt mer problemfylld än den är nu. Ett exempel är att Gemini ursprungligen var tänkt att hantera smarthem-enheter, men misslyckades med det vid våra första tester. På senare tid har dock denna funktion förbättrats avsevärt och fungerar nu som förväntat.

Det verkar som att Google snabbt rättar till problemen med Gemini på mobil, vilket är positivt att se, och resultaten med Gemini-appen kan vara imponerande. Det finns fortfarande vissa brister när det gäller att ersätta Google Assistant på Android helt och hållet, men det är något som bör förbättras över tid.

Den kostnadsfria versionen erbjuder en hel del, speciellt för Android-användare. Däremot är betalversionen av Gemini faktiskt betydligt mer avancerad.

Gemini Ultra, som driver prenumerationstjänsten Gemini Advanced, har en rad kraftfulla funktioner, såsom möjligheten att hantera flerstegsförfrågningar och hjälpa till med mer komplexa uppgifter som programmering. På en generell nivå är den också mer exakt när det gäller att leverera bättre och mer strukturerade svar på frågor.

För de som använder Googles produktivitetsappar och har ett Google Workspace-konto är Gemini dessutom tillgängligt i Google Docs, Gmail och andra tjänster.

När släpptes Gemini?

Google Gemini lanserades den 8 februari, då Google bekräftade att det ersatte Bard, som nu har lagts ned. Gemini blev omedelbart tillgängligt i både sin kostnadsfria version och betalversionen, Gemini Advanced. Google började också rulla ut Android-appen i USA direkt.

Gemini-appen är även tillgänglig för Samsung-telefoner, vilket du kan läsa mer om i vår recension av Samsung Galaxy Z Flip 6. Tillgängligheten för iOS dröjde något, men Gemini finns nu även på Apple-telefoner, dock som en del av Google-appen och i en mer begränsad version jämfört med Android.

Är Google Gemini gratis?

Den vanliga versionen av Google Gemini är gratis, men den har fler begränsningar än betalversionen av AI:n. Som vi redan nämnt är den kostnadsfria Gemini AI baserad på en enklare modell, Gemini 1.5 Flash, medan de som prenumererar på Gemini Advanced får betydligt fler funktioner och mer avancerade möjligheter.

Google tar 20 dollar per månad för Gemini Advanced, men det går att testa tjänsten gratis under en begränsad period, då det för närvarande finns en en månads gratis provperiod. Prenumerationen inkluderar även andra förmåner, eftersom Gemini Advanced ingår i Google One AI Premium Plan, som dessutom ger 2 TB molnlagring och andra extrafunktioner.

Eftersom Google One med 2 TB lagring redan kostar 10 dollar per månad, kan Gemini Advanced vara ett mer prisvärt alternativ om du ändå behöver en molnlagringstjänst.

Hur använder jag Google Gemini?

Hur du använder Google Gemini beror på vilken version du är intresserad av och vilken produkt det har integrerats i. På en PC eller laptop kan du gå in på Gemini-hemsidan och använda AI:n gratis, precis som du skulle interagera med en vanlig online-chatbot. Då använder du modellen Gemini 1.5 Flash. Om du prenumererar på Gemini Advanced får du en mer omfattande AI-upplevelse, inklusive mer exakta svar, avancerade LLM-modeller för komplexa uppgifter och kreativa behov, samt de andra fördelarna vi redan gått igenom.

På mobil kan du använda Gemini-appen på din Android-telefon (eller ersätta Google Assistant med Gemini, som tidigare nämnts). På iOS hittar du Gemini i Google-appen. Om du har en telefon som Google Pixel 9 och är prenumerant på Gemini Advanced, kan du använda Gemini Live i appen, vilket gör det möjligt att interagera med Gemini med din röst.

Hur är den jämfört med GPT-4?

När Google först avslöjade Gemini påstod företaget att den var mer avancerad än GPT-4. I ett blogginlägg visade Google resultat från åtta textbaserade benchmark-tester, där Gemini vann i sju av dem. På tio multimodala benchmark-tester vann Gemini i samtliga, enligt Google.

Detta kan antyda att Gemini är det bättre systemet, men det är inte riktigt så enkelt. GPT-4 lanserades i mars 2023, medan Gemini 1.5 Pro kom i februari 2024 och Gemini 1.5 Flash i maj 2024. Det betyder att Gemini har hunnit ikapp sin konkurrent. Dock vet vi ännu inte hur kraftfull OpenAI:s nästa GPT-modell kommer att vara och det finns många nyanser i denna AI-strid som Googles egna tester inte fångar upp, vilket gör det svårt att säga vilken modell som är bäst just nu.

Dessutom jämförde Google endast sin mest avancerade modell, Gemini Ultra, mot GPT-4, och inte Gemini Pro. Med tanke på att skillnaden mellan GPT-4 och Gemini Ultra ofta är liten, verkar det troligt att OpenAI:s modell har ett övertag över Gemini Pro.