【ITBEAR】Google Research近日發(fā)布了一項名為InkSight的前沿人工智能技術(shù),該技術(shù)能夠直接提取手寫文字圖片中的數(shù)字文本,無需任何中轉(zhuǎn)設(shè)備,為手寫文字識別帶來了革命性的進步。
與傳統(tǒng)的依賴光學字符識別(OCR)技術(shù)相比,InkSight在處理含有復雜背景、模糊或光線不足的手寫文字時展現(xiàn)出更高的性能。該技術(shù)采用了一種模擬人類學習閱讀的方法,通過反復重寫文本來掌握單詞的外觀和意義。
特別InkSight在應對復雜場景下的手寫文字識別時表現(xiàn)尤為出色。即便文本部分被遮擋或存在背景干擾,它也能精準地識別出手寫內(nèi)容。研究結(jié)果顯示,人們閱讀由InkSight生成的文本描摹時,準確率高達87%,且其中三分之二的描摹與真實手寫極為相似,難以區(qū)分。
對于喜愛手寫的人群而言,InkSight技術(shù)無疑具有巨大的應用潛力。用戶只需拍攝手寫筆記的照片,便可迅速將其轉(zhuǎn)換成可搜索的數(shù)字文本。即便是對于字跡潦草的內(nèi)容,InkSight也能實現(xiàn)清晰、精確的打印文本轉(zhuǎn)換。
然而,在手寫識別AI技術(shù)領(lǐng)域,谷歌并非孤軍奮戰(zhàn)。亞馬遜的Kindle Scribe電子閱讀器以及數(shù)字筆記應用Goodnotes等也已推出類似功能,旨在將手寫文字轉(zhuǎn)換成可編輯的數(shù)字文本,共同推動這一領(lǐng)域的發(fā)展。