Automatisk bildkommentar (även känd som automatisk bildmärkning eller språklig indexering ) är den process genom vilken ett datorsystem automatiskt tilldelar metadata i form av bildtexter eller nyckelord till en digital bild . Denna tillämpning av datorseendetekniker används i bildhämtningssystem för att organisera och hämta bilder från en databas av intresse.
Denna metod kan ses som en typ av bildklassificering i flera klasser med ett mycket stort antal klasser – storleken är jämförbar med vokabulären. Vanligtvis används bildanalys i form av extraherade funktionsvektorer och annoteringsträningsord av maskininlärningstekniker för att försöka automatiskt applicera annoteringar på nya bilder. De första metoderna studerade sambanden mellan bildegenskaper och träningskommentarer, sedan utvecklades metoder med hjälp av maskinöversättning för att försöka översätta en textordbok med "visuellt ordförråd" eller grupperade regioner som kallas blobs. Arbetet efter dessa ansträngningar inkluderade klassificerande tillvägagångssätt, relevansmodeller och så vidare.
Fördelen med automatisk bildkommentar framför innehållsbildsökning (CBIR) är att frågor kan specificeras mer naturligt av användaren. [1] CBIR kräver vanligtvis (för närvarande) användare att söka efter bildkoncept som färg och textur, eller hitta exempelfrågor. Vissa bildfunktioner i exempelbilder kan åsidosätta konceptet som användaren faktiskt fokuserar på. Traditionella bildsökningsmetoder förlitar sig på manuellt märkta bilder, vilket är en kostsam och tidskrävande process, särskilt med tanke på de stora och ständigt växande bilddatabaserna som finns.
Flera motorer är anslutna till Internet, inklusive en realtidsmarkeringsmotor [2] utvecklad av forskare vid Pennsylvania State University and Behold. Företag som Playment, Edgecase.ai, Microsoft VOTT.ai och dataloop.ai har skapat inbyggda automatiserade videoannoteringsmotorer. Företag som Alegion.com, Infolks, DataPure.co, Scaleapi.com, Diffgram.com, Figure-eight.com erbjuder en kombination av automatisk bildkommentar med en kombination av manuell granskning när automatiseringen misslyckas.