Lobanov, Boris Methodievich

Boris Lobanov
Födelsedatum 18 juli 1938( 1938-07-18 ) [1] (84 år)
Födelseort
Land  Sovjetunionen , Vitryssland 
Vetenskaplig sfär datoranalys , talsyntes , taligenkänning
Arbetsplats Joint Institute for Informatics Problems vid National Academy of Sciences of Vitryssland
Alma mater Minsk Radio Engineering Institute
Akademisk examen Doktor i tekniska vetenskaper
Utmärkelser och priser Märke " Sovjetunionens hedersradiooperatör "; 1 silver och 2 bronsmedaljer av VDNKh i Sovjetunionen ; Jubileumsmedalj " Till ära av 80-årsdagen av National Academy of Sciences of Vitryssland "

Boris Methodievich Lobanov (född 18 juli 1938) är en sovjetisk och vitrysk vetenskapsman inom området teknisk kybernetik [2] . Utvecklade de teoretiska grunderna och metoderna för analys, syntes och taligenkänning . Han utvecklade de första enheterna i Sovjetunionen för syntes av ryskt och vitryskt tal [3] . Författare till mer än 300 vetenskapliga artiklar om problemen med talanalys, igenkänning och syntes [4] [5] [6] . Författaren till tre kapitel i den första handboken om artificiell intelligens , publicerad i Sovjetunionen , tillägnad talkommunikationssystem [7] . Gjorde ett antal uppfinningar inom detta område [8] .

Biografi

Boris Methodievich Lobanov föddes den 18 juli 1938 i staden Prokopyevsk (på det moderna Kemerovo oblastens territorium ). 1948 flyttade familjen till Minsk för permanent uppehållstillstånd [9] .

Utbildning och tidig forskning

Redan i skolan blev Boris Lobanov intresserad av att designa radioutrustning: i 6:e klass byggde han sin första detektorradio, i 8:e - ett rör, och på 10:e designade han sin egen VHF-radiostation. 1955 tog han examen från gymnasiet nr 13 i Minsk och bestämde sig slutligen för valet av sin framtida specialitet [10] [9] .

Vid den tiden fanns det ingen högre utbildningsinstitution med en lämplig profil i Minsk, och Boris Lobanov gick in på Radio Communications and Broadcasting Department vid Minsk Electrotechnical College of Communications . På tekniska skolan fortsatte han att vara radioamatör, organiserade de första republikanska radiotävlingarna i "rävjakt", fick den första kategorin i radiosport och ett certifikat som radioobservatör för signalerna från den första jordsatelliten [9] .

Efter examen från en teknisk skola 1958 fick Boris Lobanov ett diplom med hedersbetygelser, men istället för att fortsätta sina studier vid universitetet kallades han till militärtjänst i den sovjetiska armén som senior radiomästare ( Petrozavodsk ). Redan 1959, med tillräcklig specialutbildning och en radioverkstad väl utrustad med instrument, började Boris Lobanov studera tal och studera det med en mikrofon och ett oscilloskop. Samtidigt ingick han korrespondens med en välkänd vetenskapsman, professor L. A. Chistovich , från vilken han fick ett antal värdefulla tips om att bedriva forskning om tal. En dokumentärpost har bevarats i Lobanovs dagbok, daterad den 25 oktober 1959: " Fonemofonen leder till fonemografen ." Det kan ses från detta inlägg att Boris Lobanov redan då insåg och bestämde den allmänna strategin för sin framtida talforskning: " Mot taligenkänning genom syntes ", som han alltid höll fast vid under hela sin fortsatta vetenskapliga verksamhet [9] .

Efter examen från armén 1961 gick Boris Lobanov in på Minsk Radio Engineering Institute (MRTI) med en examen i radioteknik och blev redan under sitt första år ordförande för institutets studentvetenskapliga sällskap, inom vilken, tillsammans med en grupp av studenter började han utveckla en talsignalanalysator. 1965, som fjärdeårsstudent, publicerade Lobanov sina första fyra vetenskapliga artiklar om analys av talsignaler, vilka räknades som ett examensprojekt, vilket gjorde att han kunde avsluta institutet före schemat. Metoden som föreslagits i dessa arbeten för att förbättra huvudparametrarna för parallell spektralanalys användes sedan effektivt i utvecklingen av taligenkänningssystem [9] .

Efter examen från MRTI 1965 gick Boris Lobanov in i institutets forskarskola och fortsatte att arbeta med uppgifterna för primär analys av talsignaler för taligenkänning och syntessystem. 1968 avslutade han sina forskarutbildningar och försvarade sin doktorsavhandling på ämnet " Några frågor i analysen av talsignaler " [11] .

Vetenskaplig verksamhet på 60- och 70-talen

Medan han fortfarande gick på forskarskolan, organiserade B. M. Lobanov 1966 ett självbärande vetenskapligt laboratorium för analys och syntes av talsignaler vid avdelningen för radiomottagare vid MRTI, vars många anställda fortsatte att engagera sig i talforskning under lång tid. I laboratoriet under ledning av Lobanov, för första gången i Sovjetunionen, designades en spektrumanalysator för talforskning " Spektr-1 " och en enhet för intonografisk forskning av tal " Intonograph ". Samtidigt genomförde laboratoriet forskning om metoder för att automatiskt lyfta fram fonetiska egenskaper hos talljud, såsom "bullrigt", "röstande", "vokal", "explosivt". På grundval av dem, för första gången i Sovjetunionen, utvecklades en anordning för att känna igen talkommandon " Sesam-1 ", som tilldelades silvermedaljen för VDNKh i Sovjetunionen [11] .

Under andra hälften av 1960-talet deltog B. M. Lobanov i att lösa det grundläggande problemet med taligenkänning i samband med olinjära förvrängningar av tidsaxeln i processen att uttala talljud. Denna typ av förvrängning skapade betydande svårigheter att jämföra talade ord med deras standarder i processen för taligenkänning. 1968, oberoende och nästan samtidigt, föreslog G.S. Slutsker ( Moscow State Research Institute of Radio ) och T.K. Vintsyuk ( Institutet för cybernetik vid Vetenskapsakademin i den ukrainska SSR ) att använda den dynamiska programmeringsmetoden (DP-metoden) för att lösa detta problem [11] . 1969 publicerade B. M. Lobanov i samarbete med G. S. Slutsker en artikel där vidareutvecklingen av DP-metoden gavs för ett extremt viktigt praktiskt fall då gränserna för ett erkänt ord är okända, det vill säga att lösa problemet med upptäcka och känna igen ljudkombinationer i kontinuerlig röstsignal. DP-metoden blev sedan allmänt erkänd av utländska forskare [12] .

Nästa år efter det framgångsrika försvaret av sin avhandling, i november 1969, skickades B. M. Lobanov för en vetenskaplig praktik under en period av 10 månader i Storbritannien . B. M. Lobanov hade praktik på problemen med analys av talsignaler under ledning av professor K. Cheri vid Imperial College of Science and Technology ( London ), och om problemen med talsyntes - under ledning av professor R. Lorenz vid University of Edinburgh [12] .

Efter avslutad praktik i Storbritannien var huvudinriktningen för B. M. Lobanovs vetenskapliga arbete utvecklingen av metoder och anordningar för talsyntes från text. Redan under sin praktik vid University of Edinburgh genomförde han framgångsrika experiment med syntes av ryska talljud, vilket gjorde det möjligt att lägga grunden för formant talsyntes från en fonemisk text. Som ett resultat, redan 1972, under ledning av B. M. Lobanov, utvecklades den första i Sovjetunionens synthesizer av ryskt tal " Fonemofon-1 ", som tilldelades två medaljer av VDNKh i Sovjetunionen [12] . " Fonemofon " kunde inte bara syntetisera ryskt tal, utan också läsa den inskrivna texten på flera främmande språk, samt syntetisera sång [13] .

1973 tilldelades B. M. Lobanov titeln " Senior forskare ". I samband med öppningsutsikterna för införandet av talteknik i kommunikationsindustrin, uppmärksammade ledningen för Moskva-grenen av Central Research Institute of Communications (TsNIIS) B. M. Lobanovs arbete med syntesen av ryskt tal. Som ett resultat, 1974, på grundval av Minsk-avdelningen vid Central Research Institute, öppnades Laboratory of Speech Systems, ledd av B. M. Lobanov under de kommande 15 åren. Huvudinriktningen för laboratoriets arbete var utvecklingen av metoder och skapandet av system för automatisk taligenkänning och syntes, med fokus på deras praktiska användning i branschen " Kommunikation " [14] .

Tillsammans med praktiska aktiviteter i skapandet av taldialogsystem ägnade B. M. Lobanov stor uppmärksamhet åt vetenskapligt och organisatoriskt arbete. 1976 organiserade och höll han i Minsk All-Union School-Seminar " Automatic Recognition of Auditory Patterns " (ARSO), som deltog av mer än 200 deltagare från 75 olika vetenskapliga organisationer i Sovjetunionen. ARSO-skoleseminariet hölls regelbundet (vartannat år) fram till 1991, och sedan 1976 var B. M. Lobanov medlem av ARSO:s permanenta programkommitté. På seminariet visades deltagarna i ARSO i Minsk för första gången en prototyp av ett telefonförfrågningssystem med syntetiserat röstsvar [15] .

År 1978, på inbjudan av franska vetenskapsmän, skickades Lobanov på en två månader lång affärsresa till Frankrike för vetenskapligt arbete och bekantskap med arbetet vid ledande vetenskapliga centra för talforskning: universitet i Paris , Nancy och Aix-en-Provence , samt tallaboratorier i Toulouse , Grenoble , Orsay och Lanion. Under sin vistelse i Frankrike deltog Lobanov i en konferens om röstkommunikation och antogs som medlem av Francophone Countries Acoustic Society [15] .

1979 presenterade B. M. Lobanov på världsutställningen " Telecom-79 " i Genève en ny modell av talsyntes - " Fonemofon-3 ", belönad med ett diplom från utställningen. Den berömda science fiction-författaren Arthur Clark , efter att ha besökt USSR-paviljongen och bekantat sig med talsyntesen, skrev i gästboken: " Du förutsåg mina fantasier från filmen" A Space Odyssey 2001 " [15] [16] , och Den schweiziska tidningen Obozrevatel publicerade en artikel: " Nu lär ryssarna främmande språk med en dator som talar ." För en uppsättning verk om skapandet av talsyntes 1981 belönades Lobanov med titeln " Honorary Radio Operator of the USSR " [15] .

Vetenskaplig verksamhet på 80 -talet

I början av 1980-talet började B. M. Lobanov utveckla metoden för artikulatorisk-formant talsyntes som föreslagits av honom, vilket var grunden för en ny generation talsyntes. 1983 publicerade B. M. Lobanov, i samarbete med V. Ya. Kucherov, boken " Syntetiserat tal i kösystem " [17] .

I början av 1984 skapade Lobanov den slutliga formuleringen och genomförde den teoretiska och experimentella utvecklingen av en enhetlig linguoakustisk metod för att lösa problemet med talsyntes från text. De utvecklade metoderna och algoritmerna för deras implementering låg till grund för hans doktorsavhandling " Forskning och utveckling av metoder för automatisk talsyntes från fonemisk text ", som Lobanov framgångsrikt försvarade 1984 vid Institutet för elektronik och datorteknik vid Vetenskapsakademin. lettiska SSR i Riga . Senare anpassades de erhållna teoretiska och experimentella resultaten för talsyntessystem på andra europeiska språk. Framför allt utvecklades 1987 en engelskspråkig version av synthesizern, som demonstrerades på World Congress of Phonetic Sciences och som uppskattades mycket av engelsktalande experter [18] .

1980-talet var perioden för skapandet av de första industriella systemen för syntes och erkännande av tal och deras utbredda introduktion i kommunikationsindustrin i Sovjetunionen med direkt deltagande av B. M. Lobanov och hans kollegor - B. V. Panchenko, N. P. Degtyarev, V P Afanasiev. I Kaliningrad-mjukvaran genomfördes " Quartz " experimentell design med efterföljande serieproduktion av Mars-1- talterminalen , som inkluderar delsystemen för taligenkänning " Sesam " och talsyntes " Fonemofon ". På basis av Mars-1- röstterminalen utvecklades ett system för att automatiskt informera abonnenter på långdistanstelefonnät (AIAMTS) om skulden för samtal. AIAMTS-systemet implementerades framgångsrikt och drevs under lång tid i ett antal stora städer: Minsk , Novosibirsk , Alma-Ata , Frunze , Petropavlovsk-Kamchatsky . Ett annat system - ett system för övervakning av parametrarna för telefon- och radiostationers utrustning med omedelbar underrättelse till tjänstgörande personal om problem som har uppstått - introducerades vid de automatiska telefonväxlarna i Minsk, Moskva och Zelenograd, såväl som vid den vitryska republikanska radion relästation RTS-5 [19] .

Taligenkänning och synteslaboratoriet

1988 gick B. M. Lobanov med i Institutet för teknisk cybernetik vid BSSR: s vetenskapsakademi på inbjudan av direktören för institutet V. S. Tanaev och ledde det nyskapade Laboratory of Speech Recognition and Synthesis. Överföringen av B. M. Lobanov till Institutet för teknisk cybernetik sammanföll med uppkomsten av de första persondatorerna (PC) och laboratoriets arbetsplaner inkluderade ämnen relaterade till att utrusta datorer med system för talinmatning. Formantmetoden, som länge har spelat en nyckelroll i tal-till-text-system, var inte lämplig för detta ändamål på grund av behovet av en stor mängd realtidsberäkningar. 1989 föreslog B. M. Lobanov en ny mikrovågsmetod (MW-metod) för syntes av talsignaler, där istället för att beräkna formantoscillationer användes en förberedd uppsättning mikrovågor av en naturlig talsignal. Under ledning av B. M. Lobanov implementerades MW-metoden av laboratoriemedarbetaren A. N. Ivanov i Fonemofon-5 synthesizer . Kompaktheten hos dess mjukvara (endast 64 Kb) gjorde det möjligt att utrusta den första IBM PC/XT och till och med inhemska datorer EC-1840 med talsyntes . Talsyntesen har efterfrågats i många praktiska tillämpningar av blinda användare. Senare, på basis av MW-metoden, utvecklades versioner för de tjeckiska och polska språken, såväl som en autonom talsyntesmodul med en platta, vars ukrainska version fungerade under en tid på Kievs tunnelbanelinje [20 ] .

Akademiska examina och titlar

Stora publikationer

Monografier

Avhandlingar

Vissa artiklar i tidskrifter och konferenshandlingar

Anteckningar

  1. Vitryska uppslagsverk  (vitryska) - Vitryska uppslagsverk uppkallad efter Petrus Brocki , 1996.
  2. Vitryska uppslagsverk = Vitryska uppslagsverk / Redkol. G.P. Pashkov och andra - Minsk : Vitryska uppslagsverket uppkallad efter Petrus Brovka . - T. 9. - S. 80. - 560 sid.
  3. Lobanov B. Historia och utveckling av talvetenskap och teknologi i USSR  (engelska)  // Eds. D. Mehnert, D. Kordon, M. Wolff Systemteori Signalverarbeitung Sprachtechnologie: Rüdiger Hoffmann zum 65. Geburtstag. - Dresden: TUDpress, 2013. - P. 327-338 . — ISBN 9783944331195 .
  4. Boris  Lobanov . ResearchGate . _ Hämtad: 8 oktober 2018.
  5. B.M. Labanau  (vitryska) . Laboratoriet för taligenkänning och syntes . Hämtad 8 oktober 2018. Arkiverad från originalet 11 september 2018.
  6. Boris Methodievich Lobanov: med anledning av hans 70-årsdag, 2008 .
  7. Artificiell intelligens: Kommunikationssystem och expertsystem, 1990 .
  8. Patent av författaren LOBANOV BORIS MEFODIEVICH . " findpatent.ru ". Hämtad: 8 oktober 2018.
  9. 1 2 3 4 5 Boris Methodievich Lobanov: med anledning av hans 70-årsdag, 2008 , sid. 7.
  10. Boris Methodievich Lobanov: med anledning av hans 70-årsdag, 2008 , sid. 3.
  11. 1 2 3 Boris Methodievich Lobanov: med anledning av hans 70-årsdag, 2008 , sid. åtta.
  12. 1 2 3 Boris Methodievich Lobanov: med anledning av hans 70-årsdag, 2008 , sid. 9.
  13. Phonemophone - En mänsklig talsyntes skapad vid Institute of Communications. 1976 . Hämtad: 18 mars 2019.
  14. Boris Methodievich Lobanov: med anledning av hans 70-årsdag, 2008 , sid. 9-10.
  15. 1 2 3 4 Boris Methodievich Lobanov: med anledning av hans 70-årsdag, 2008 , sid. tio.
  16. Lobanov, B.M. Om historien om rysktalande maskiner (Från en robots röst till en personlig klon av en mänsklig röst)  // Artificial Intelligence News. - Moskva , 2003. - Nr 1 (55) . - S. 3-9 .
  17. Syntetiserat tal i kösystem, 1983 .
  18. Boris Methodievich Lobanov: med anledning av hans 70-årsdag, 2008 , sid. 10-11.
  19. Boris Methodievich Lobanov: med anledning av hans 70-årsdag, 2008 , sid. elva.
  20. Boris Methodievich Lobanov: med anledning av hans 70-årsdag, 2008 , sid. 11-12.
  21. Forskning och utveckling av metoder för automatisk talsyntes från fonemisk text . " dslib.net ". Hämtad 9 oktober 2018. Arkiverad från originalet 30 juni 2018.

Litteratur