在多媒體技術和互聯網高速發展的現在,高清晰度、大尺寸圖片越來越被人們所需要,然而高清晰度、大尺寸帶來的問題也隨之出現:存儲圖像所需的空間成本大大增加,以及傳輸圖像所需的時間成本大幅攀升。
為了保證圖像失真盡可能少的情況下,用更少的網絡帶寬傳輸圖像或者用更少的空間存儲圖像,2023年初,我校章為川教授聯合青島認知人工智能研究院黃杰研究員提出了一個注意力再注意力的非線性變換端到端網絡架構來代替線性變換作為圖像和視頻壓縮的主體架構。該成果較好的應用于浙江某銀行業務單據壓縮,該行在全省有支行82個,網點大約4000個,平均每個支行每天產生的業務流水單據圖片數據量約20GB;總行擬對全省82家支行業務流水單據進行統一管理,通過對這些業務單據數據進行壓縮,降低支行到總行的傳輸帶寬投入,以及總行的存儲設備投入。每年為該銀行直接節省成本1217萬元。并且該成果已應用于三一重工昆山園區的視頻壓縮。該園區建設有視頻監控7000路,且均為800萬超高清像素,視頻時長需保存90天,存儲投入成本巨大,經壓縮系統壓縮后,微動態場景下,可將視頻碼率從4M壓縮到150K左右,復雜動態場景下,可將視頻碼率從4M壓縮到800K以內,畫質肉眼無法區分;降低了廠區存儲成本投入以及前端網絡帶寬總費用節省近1000萬。
(核稿:強濤濤 編輯:劉倩)