Genomsnittsanvändaren på en streamingplattform lägger ned mer tid på att leta efter något att titta på än på att faktiskt titta. Det är ett problem som kostar pengar. Churn ökar när innehållet känns svårhittat, och engagemanget sjunker när rekommendationerna missar målet. Ett välfungerande rekommendationssystem är inte en trevlig bonus - det är en affärskritisk komponent som direkt påverkar retention, tittartid och intäkter.
Den här artikeln går igenom hur moderna rekommendationsmotorer är uppbyggda, vilka tekniska metoder som finns, hur du testar dem och vad du bör tänka på när du bygger eller förbättrar systemet för din plattform. Vi riktar oss till dig som CTO eller produktansvarig och som behöver fatta välgrundade beslut - inte till någon som vill ha en kurs i maskininlärning.
Varför rekommendationer är avgörande för retention
Retention är streamingbranschens viktigaste nyckeltal. Det är billigare att behålla en befintlig användare än att förvärva en ny, och innehållsbiblioteket är sällan det som avgör om användaren stannar. Det som avgör är om hen hittar rätt innehåll vid rätt tillfälle.
Forskning från Netflix, som publicerat en stor del av sin metodologi, visar att en användare i snitt tar ett beslut om att stanna eller lämna en session inom 60 till 90 sekunder. Om ingenting fångar intresset stänger hen ner appen. Det är ett extremt snävt fönster, och det enda sättet att vinna det är att ge relevanta förslag direkt.
Rekommendationssystemets påverkan på affärsmålen går att mäta konkret:
- Ökad session-tid: Användare som får relevanta förslag fortsätter titta länger per session.
- Ökad antal sessioner per vecka: Bra rekommendationer skapar vanor. Användaren återkommer eftersom hen vet att det alltid finns något nytt och relevant.
- Lägre churn: Plattformar med starka rekommendationer ser lägre frivilliga avslut.
- Bättre innehållsutnyttjande: Äldre och nischade titlar som annars förblir dolda kan få en ny publik om de rekommenderas till rätt segment.
Det handlar alltså inte om att visa upp det senaste innehållet eller det som är populärast globalt. Det handlar om att förstå varje enskild användare och matcha henne mot rätt titel vid rätt tillfälle.
Kollaborativ filtrering
Kollaborativ filtrering är den mest välkända tekniken och bygger på en enkel premiss: om två användare har liknande beteende historiskt sett är chansen god att de också gillar liknande innehåll framöver.
Det finns två huvudvarianter:
Användarbaserad kollaborativ filtrering hittar användare som liknar målpersonen och rekommenderar det de gillar. Problemet är att den kräver ett stort antal användare för att fungera väl, och att den är beräkningstung när skalan ökar.
Objektbaserad kollaborativ filtrering tittar istället på likheter mellan innehållsobjekt baserat på hur de konsumeras av användarkollektivet. Om många som tittat på titel A också tittar på titel B, är B en bra rekommendation för någon som just sett A. Den här metoden skalar bättre och är enklare att hålla uppdaterad i realtid.
En vanlig implementationsmodell är matrixfaktorisering, där en stor glesar matris av användare och innehåll bryts ned i latenta faktorer. Tekniker som ALS (Alternating Least Squares) och SVD (Singular Value Decomposition) används flitigt för detta. Resultatet är vektorer som representerar både användare och innehåll i samma latenta rum, vilket gör det enkelt att beräkna relevans.
Kalla-start-problemet är kollaborativ filtrerings akilleshäl. En ny användare utan historik, eller ett nytt innehållsobjekt utan tittardata, är svårt att placera i systemet. Det kräver kompletterande metoder.
Innehållsbaserad filtrering
Innehållsbaserad filtrering tar en annan väg. Istället för att jämföra beteenden tittar den på egenskaper hos innehållet självt - genre, produktionsland, skådespelare, regissör, nyckelord, stämning - och matchar mot de egenskaper som användaren historiskt har visat intresse för.
Det stora fördelen är att metoden fungerar utan beroende av andra användares beteende. En ny titel kan rekommenderas direkt baserat på dess metadata, och en ny användare kan få relevanta förslag efter bara ett par interaktioner om man frågar om preferenser vid onboarding.
Utmaningen är kvaliteten på metadata. Dålig eller inkonsekvent taggning av innehållet slår direkt igenom i rekommendationskvaliteten. Många plattformar underskattar hur mycket arbete det krävs för att hålla en ren och rik innehållsmetadatabas.
En modernare variant är att använda semantiska embeddings. Istället för att enbart förlita sig på manuellt satta taggar tränar man modeller som förstår innehållets faktiska karaktär från text - synopsiser, recensioner, dialoger - och representerar det i ett vektorrymden. Det möjliggör mer nyanserade matchningar och fångar egenskaper som är svåra att tagga manuellt, som ton, tempo eller känsla.
Hybridmodeller: Det praktiska valet för produktionsmiljöer
I verkligheten väljer de flesta mogna streamingplattformar en hybridmodell som kombinerar kollaborativ filtrering och innehållsbaserade metoder, ofta med ytterligare lager för kontext och affärsregler.
Det finns flera sätt att kombinera metoderna:
Viktad hybrid: Beräkna poäng från båda metoderna och kombinera dem med vikter. Enkel att implementera och lätt att justera, men ger inte alltid de bästa resultaten eftersom det kan vara svårt att hitta rätt balans.
Switching hybrid: Välj metod baserat på vad som är lämpligt i situationen. För nya användare, använd innehållsbaserad filtrering. När det finns tillräckligt med beteendedata, byt till kollaborativ filtrering.
Feature-level integration: Använd egenskaper från både användarbeteende och innehållsattribut som input till en gemensam modell, ofta ett neuralt nätverk. Det ger mer flexibilitet och ofta bättre precision, men kräver mer ingenjörsarbete.
Cascade-modell: Börja med en snabb och grov rangordning av ett stort innehållsurval, och förfina sedan med en mer avancerad modell. Det är ett vanligt mönster för att hantera stora katalogstorlekar effektivt.
Utöver tekniken bör hybridmodellen ta hänsyn till kontextuella signaler som tid på dygnet, enhet, plats och om användaren tittar ensam eller i sällskap. En användare som öppnar appen på morgonen på sin telefon har troligen andra preferenser den stunden än när hen sätter sig framför TV:n på fredagskvällen.
A/B-testning av rekommendationer
Det är omöjligt att avgöra om ett rekommendationssystem är bra utan att mäta det. Och det är omöjligt att mäta utan ett strukturerat testramverk.
A/B-testning av rekommendationer skiljer sig på ett viktigt sätt från vanlig A/B-testning av gränssnitt: effekterna tar tid att visa sig. En rekommendationsmodell kan verka sämre på kort sikt men bygga starkare vanor och lägre churn på längre sikt. Välj därför rätt mätperiod och var tydlig med vad du mäter.
Viktiga mätvärden att följa:
- CTR (Click-Through Rate) på rekommendationerna: Hur ofta klickar användare på det som visas?
- Completion rate: Slutförs det rekommenderade innehållet?
- Return rate: Återkommer användaren till plattformen mer frekvent?
- Nöjdhet: Ratingdata om plattformen erbjuder det.
- Churn-delta: Skiljer sig churnnivån mellan testgrupp och kontrollgrupp?
Tänk på Goodharts lag: om du optimerar en modell för att maximera CTR kommer den att rekommendera klickbara titlar, inte nödvändigtvis bra titlar. Balansera kortsiktiga engagemangsmätvärden med längre mätvärden som reflekterar faktisk kundnöjdhet och retention.
En annan fälla är att rekommendationsmodeller kan skapa filterbubblar - användare fastnar i smala innehållssegment och utsätts aldrig för bredd. Överväg att aktivt inkludera ett element av utforskning i rekommendationerna, till exempel att en viss procent av förslagen alltid är utanför användarens vanliga mönster.
Sammanfattning och nästa steg
Ett välfungerande rekommendationssystem är inte ett enskilt beslut utan ett pågående ingenjörsprojekt. Det kräver en kombination av rätt algoritmer, ren och rik innehållsmetadata, en stabil datainfrastruktur för att samla och bearbeta användarsignaler i realtid, och ett disciplinerat testramverk som hjälper dig fatta datadrivna beslut.
Starta inte med att bygga det mest sofistikerade systemet du kan tänka dig. Starta med att lösa kalla-start-problemet, sätta upp grundläggande hybridrekommendationer och etablera ett testflöde. Iterera därifrån.
Shapp har byggt rekommendationslösningar för streamingplattformar i olika skeden - från MVP-stadiet till storskaliga system med miljontals användare. Vill du diskutera vad som passar din plattform är du välkommen att titta på vad vi gör inom AI-utveckling och streaming, eller kontakta oss direkt för ett förutsättningslöst samtal.