百度地圖語音包怎么設(shè)置自己的聲音,百度地圖語音包怎么設(shè)置自己的聲音個(gè)性?
系列報(bào)道之③
快60歲的老張最近迷上了聽自己的聲音。每次開車和幾位老伙計(jì)出去玩,一打開導(dǎo)航就會(huì)跳出他的聲音——“前方十字路口請(qǐng)直行,走左側(cè)車道”,一車人都得“聽命行事”。就連呼喚“小度小度”,問它要去哪、幾點(diǎn)了,傳出來的也是老張的聲音。老伙伴們都被驚著了,紛紛湊上來問怎么弄的。一種自豪感油然而生,張大爺抽空教了教,讓大家都崇拜了一把。
起初,老張并不知道什么是語音包。上個(gè)月,他坐在兒子小張的車?yán)?,突然聽見百?a href="http://www.qjsdgw.cn/tag/%e5%9c%b0%e5%9b%be" title="【查看含有[地圖]標(biāo)簽的文章】" target="_blank">地圖導(dǎo)航里傳來兒子的聲音,問了才知道原來他制作了語音包,好奇心一下就上來了。在兒子的指導(dǎo)下,老張對(duì)著手機(jī)錄9句話、等幾分鐘,一個(gè)屬于自己的語音包就生成了。老張忍不住自己錄了好幾個(gè)語音包,玩了半天……這趟行程結(jié)束后,他興沖沖地給兒子小張打電話:“我最近和老伙伴們出去玩可長臉了!”
越來越多個(gè)性化、有溫度的聲音正在百度地圖上匯聚,語音技術(shù)與地圖的融合,讓科技力量有了溫度,成為人與人之間傳遞溫情的紐帶。
錄制2分鐘、9句話合成語音包
在2016年上映的電影《從你的全世界路過》中,主人公茅十八在駛往稻城亞丁的路上,用他精通的技能為心儀的女孩荔枝定制的一個(gè)導(dǎo)航語音包,成了浪漫而又暖心的禮物。三年后,電影的情節(jié)成為現(xiàn)實(shí),普羅大眾也能像茅十八一樣,錄制屬于自己獨(dú)一無二的語音包。
2019年9月,百度在行業(yè)內(nèi)首次推出地圖語音定制產(chǎn)品,將此前專注于明星名人的語音定制功能開放給普通用戶群體。用戶在安靜的環(huán)境中,在百度地圖APP上錄制20句話,用20分鐘左右就可以生成一個(gè)專屬的完整語音包,可在導(dǎo)航、智能語音交互、景區(qū)智能語音導(dǎo)覽等全部場景使用。這樣一來,人人都可以是“大明星”。
過去,語音合成主要依靠拼接語音合成系統(tǒng),制作地圖語音包需要在專業(yè)錄音棚錄制上萬句語料,再經(jīng)過長達(dá)數(shù)月的制作才能生成,流程復(fù)雜、耗時(shí)長,讓地圖語音包只是“明星專屬”。隨著百度大腦語音技術(shù)對(duì)語音定制功能進(jìn)行賦能,個(gè)性化語音包合成的定制門檻大大降低。AI技術(shù)的加持,讓地圖語音包生產(chǎn)實(shí)現(xiàn)了從月級(jí)別到分鐘級(jí)別的突破性進(jìn)展,也重新定義了語音包的生產(chǎn)模式。
推出三年多以來,語音定制功能已經(jīng)迭代了10多個(gè)版本。伴隨技術(shù)的持續(xù)突破,錄制的門檻不斷降低,噪聲檢測的標(biāo)準(zhǔn)放低,語音包錄制場景、玩法也日趨豐富:2020年1月,自定義播報(bào)功能上線,用戶可以在語音廣場選擇好“稱呼”和“風(fēng)格”,使用個(gè)人特色的語音包。2021年4月,用戶錄制的效率進(jìn)一步提升——錄制時(shí)長和語量分別減少到錄制2分鐘、9句話,即可生成語音包。現(xiàn)在,在極速錄制模式中甚至只錄3句話后退出也可以生成語音包。
作為一種聲音內(nèi)容產(chǎn)品,用戶可以錄制語音包給家人、朋友,可以根據(jù)自己的創(chuàng)意、腦洞錄制方言、模仿類的語音包,用戶錄制的語音包也都可以選擇發(fā)布到百度地圖語音廣場的各個(gè)分類里,供更多的用戶試聽和使用。
一位資深用戶坦言,自己最初愿意錄語音包,是帶著一些獵奇的心理,“想嘗試一下原本只有明星才能錄的語音包,自己也能錄了是什么體驗(yàn),需要怎么錄制、錄制多久能合成、合成后效果怎么樣,像不像自己的聲音之類的”。后來他錄得“一發(fā)不可收拾”,自發(fā)挖掘出了更多的玩法和場景,還會(huì)忍不住發(fā)動(dòng)身邊人一起玩。
語音包成為傳遞情感的“橋梁”
“語音定制”功能在百度地圖有個(gè)內(nèi)部代號(hào)叫“百雀靈”。據(jù)說,之所以叫“百雀靈”,主要是因?yàn)榘偃甘谴笞匀恢懈鞣N鳥兒的總稱,這些鳥兒有各種各樣悅耳的叫聲,類比下來,百度地圖App千千萬萬個(gè)用戶就是“百雀”。“千人千面”的定制化語音突破了傳統(tǒng)明星語音包的圈層限定,滿足了用戶個(gè)性化需求。
“語音包我太有發(fā)言權(quán)了!”一位用戶忍不住感慨:“有天我照常上班打開導(dǎo)航,一句‘hi寶貝,今天我來給你導(dǎo)航’,直接嚇了我一跳,聽了聽才發(fā)現(xiàn)是女朋友的聲音,真的太驚喜了!感覺一路上都在拆盲盒,不知道她會(huì)突然冒出來什么話,反正剛開始導(dǎo)航的時(shí)候還挺甜的,但一開快了就罵我,感覺她坐在副駕一樣。后來一問,才知道她偷偷給我錄了個(gè)語音包,太逗了!”
越來越多用戶從親友的語音包中,感受到科技帶來的溫暖。陳林(化名)便是其中之一。他感慨,“現(xiàn)在年輕人無論是叫外賣、打車、支付幾乎所有的場景都可以用手機(jī)搞定,但這些對(duì)老人來說難上加難。我爸爸也是這樣?!彼训貓D導(dǎo)航等各種手機(jī)軟件的使用方法教給父親,但父親總是記不住,出門還是繞暈了。于是,他為父親錄制了一個(gè)語音包,“這樣即使走錯(cuò)了路,我的聲音在陪伴他,他也不會(huì)那么慌張了?!?/p>
每天獨(dú)自上下班的玉琳(化名)覺得,對(duì)于異地戀的人來說,語音包帶來了跨越距離的陪伴感。有天,玉琳的男朋友分享給她一個(gè)“忠狗語音包”?!翱吹矫值臅r(shí)候我還在納悶這是什么,一點(diǎn)開就聽到了他的聲音,直接就打開百度地圖換了這個(gè)語音包,還用小度跟他閑聊了幾天,聽著他的聲音我差點(diǎn)就哭出來了?!彼f,“有了他的語音包,起碼我每天上下班的路都不再寂寞了?!?/p>
有人說,地圖出行工具是每天都會(huì)用的,那用戶喜歡的聲音也會(huì)每天陪伴用戶出行,這就是一種溫暖的體現(xiàn)。語音包是個(gè)有溫度的產(chǎn)品,可以傳遞親情、愛情、友情,已經(jīng)成為人與人之間情感的“橋梁”。語音技術(shù)與地圖工具的融合,也釋放了科技力量,讓每個(gè)人都感受到科技進(jìn)步帶來的改變和情懷。
現(xiàn)在,百度地圖定制語音功能,囊括了多種錄制模式:極速模式(錄3-9句話)、經(jīng)典模式(錄20句話)、萌娃模式(更簡單的短句)、專業(yè)模式(錄100句)……錄制語音包的用戶,年齡最小的甚至只有三歲。
寶寶也可以做“導(dǎo)航員”。
有寶媽感慨,“萌娃模式錄制很適合小寶寶,我說一句、他學(xué)一句,沒幾句話就錄完了,試聽了一下,聲音奶聲奶氣的,太可愛了,迫不及待就發(fā)在了家族群里,家里老人都驚喜得不得了。我以后每年都要讓孩子錄一個(gè),這樣就不光有照片的記錄,更有聲音的記錄了。”語音包還給了她一個(gè)意外收獲:“寶寶爸爸說,堵車時(shí)候用寶寶的導(dǎo)航,路怒癥都治好了……”
AI讓語音技術(shù)創(chuàng)新?lián)碛袩o限可能
有業(yè)內(nèi)人士表示,語音定制功能還會(huì)有很多迭代空間:比如繼續(xù)減少錄制句數(shù)降低錄制門檻;在小朋友錄制中增加繪本、兒童激勵(lì)(音效、動(dòng)效),提升錄制的趣味性;在導(dǎo)航中增加諸如紅綠燈、車道級(jí)等更多元的個(gè)性化播報(bào)場景;個(gè)性化播報(bào)也可以應(yīng)用于小度語音交互,如應(yīng)答音、檢索場景播報(bào)個(gè)性化等……“未來,語音包的錄制成本會(huì)更低,應(yīng)用場景會(huì)繼續(xù)拓寬,用戶自己個(gè)性化可定制的內(nèi)容會(huì)更多?!?/p>
據(jù)介紹,個(gè)性化語音定制功能的背后,是基于百度獨(dú)創(chuàng)的說話人韻律遷移技術(shù)Meitron。這一技術(shù)起到的作用集中體現(xiàn)在發(fā)音人音色轉(zhuǎn)換,多情感朗讀和韻律風(fēng)格遷移三個(gè)方面,通過機(jī)器學(xué)習(xí),AI合成模型持續(xù)優(yōu)化迭代以適應(yīng)不同口音、不同表達(dá)習(xí)慣的用戶,最終令個(gè)性化語音合成的定制門檻大大降低。
在語音技術(shù)與地圖場景融合的過程中,創(chuàng)新成果不斷地迸發(fā)出來。根據(jù)2022年10月由國家工業(yè)信息安全發(fā)展研究中心和工業(yè)和信息化部電子知識(shí)產(chǎn)權(quán)中心聯(lián)合發(fā)布的《中國人工智能專利分析報(bào)告(2022)》顯示,百度以將近2000件智能語音相關(guān)專利在創(chuàng)新主體排名中位列第一。這其中,就語音包產(chǎn)品百度已經(jīng)布局相關(guān)專利100余件,內(nèi)容涵蓋語音識(shí)別、語音合成、聲紋認(rèn)證、語音包錄制、語音導(dǎo)航等多個(gè)核心方向,相關(guān)語音識(shí)別技術(shù)專利更是榮獲第二十屆中國專利獎(jiǎng)銀獎(jiǎng),全面印證了百度地圖個(gè)性化語音定制底層強(qiáng)勁的技術(shù)能力,也見證著語音技術(shù)在地圖創(chuàng)新和服務(wù)能力邊界的拓展。
個(gè)人語音包錄制流程。
數(shù)據(jù)顯示,作為國民級(jí)智能地圖平臺(tái),百度地圖實(shí)現(xiàn)了96%的地圖數(shù)據(jù)生產(chǎn)AI化,上線了北斗高精“真”車道級(jí)導(dǎo)航、室內(nèi)外無縫融合的車位級(jí)導(dǎo)航、具備紅綠燈精準(zhǔn)倒計(jì)時(shí)功能的智能路口導(dǎo)航、結(jié)合20億張全景照片的全景指路服務(wù)、虛實(shí)結(jié)合的AR實(shí)景步行導(dǎo)航等多項(xiàng)應(yīng)用“北斗高精”自研技術(shù)的特色出行服務(wù),道路覆蓋里程突破1200萬公里,而AI在地圖的每個(gè)功能中無處不在。
例如,AI技術(shù)能夠令地圖的核心能力——導(dǎo)航變得更為精準(zhǔn)。百度地圖基于自研的AI技術(shù)推出業(yè)內(nèi)首創(chuàng)的智能定位功能,結(jié)合高精度傳感器模式識(shí)別以及航跡推算技術(shù),可輔助駕車導(dǎo)航功能在衛(wèi)星信號(hào)弱的時(shí)候,依舊持續(xù)工作。通過基于交通影像的AI圖像識(shí)別技術(shù),可以識(shí)別道路上的車輛密度,進(jìn)一步提升路況識(shí)別準(zhǔn)確度。
創(chuàng)新驅(qū)動(dòng)是加快建設(shè)交通強(qiáng)國的重要?jiǎng)恿Γ?span id="7cv38ze8gk" class="candidate-entity-word" data-gid="1793154">人工智能是交通運(yùn)輸發(fā)展的強(qiáng)大引擎。有分析指出,隨著人工智能與出行產(chǎn)業(yè)的深度融合,以人、車、路、云、網(wǎng)、圖等要素為核心的車路智行智能交通將迎來深刻變革。地圖作為國家重要數(shù)字基礎(chǔ)設(shè)施的意義將進(jìn)一步凸顯。在國家政策紅利支持下,AI技術(shù)還將持續(xù)在智慧出行更多細(xì)分領(lǐng)域快速落地和賦能,進(jìn)一步推動(dòng)交通信息化發(fā)展,助力交通強(qiáng)國建設(shè)。
采寫:南都記者 傅曉羚

如若轉(zhuǎn)載,請(qǐng)注明出處:http://www.qjsdgw.cn/150798.html