本內容來源於@什麼值得買APP,觀點僅代表作者本人 |作者:拉德佈魯赫信徒

1 引言

關於白描這個軟件的使用,可能從它剛出來就開始瞭。一開始,白描隻有手機端的軟件,但是在那個ocr軟件較少的年代,其簡潔的界面,簡單易用的體驗,瞬間就get到瞭我的痛點。與當時很多軟件不同的是,它在識別之後可以自行選擇自己需要的文字,可以復制到剪貼板或者直接導出為txt文件。

但是,在後來不斷變換的使用場景中,白描的劣勢就逐步凸顯出來瞭。由於其隻支持移動端,在pc端需要識別的時候,還得截圖並且分享到手機讓它來進行識別,再把識別的結果再次粘貼回電腦,一來二去,也就慢慢把其使用場景限定到瞭移動端使用。

期間,pc端也不斷冒出很多優秀的ocr軟件,如天若ocr、panda ocr等等優秀的國產軟件。但是缺點在於,對於設備的支持並不全,這一類軟件通常使用場景限定於pc端,而且通常限制瞭每日的識別次數(雖然每天可能用不到那麼多,但是有時候翻閱電子版pdf或者文獻的時候就難免會超出次數限制),這個就比較雞肋瞭,我可以用不到,但你不可以沒有。

到後來隨著paddle ocr模型和各大廠商的ocr方案的盛行,各種各樣的產品也逐漸豐富瞭起來,但是大多都是內嵌在自傢app中的。比如說百度網盤或者微信這種的,你想要識別一張圖片,就必須打開這個軟件,找到ocr功能的專區,拖入圖片,進行識別。雖然說不限次數瞭,但是這種體驗完全稱不上完美。

橫向來說,雖然很多國產的ocr軟件開始支持離線模型,如cnocr或者paddleocr,但是在下載的時候還得一並下載對應的模型,然後還得再設置好對應的路徑,無形中增加瞭太多的使用成本。

為瞭解決接口次數的限制,如天若ocr這類軟件已經開放瞭自定義的接口,如可以去百度購買一定的次數包,根據自己的需求來進行調用。但是,隨著ocr這項技術的發展,識別的場景已經不僅限於識別圖片中的文字,很多時候需要識別表格的時候,單一購買百度的ocr接口是不能滿足需求的,還得再行購買識別表格的次數包,這也增加瞭太多的使用成本,還得不定期關註次數包的使用情形(雖然買一次能用很久,但是想到還要為瞭維護這個而耗費精力覺得實在優點不值當)。

在近期,突然看到瞭白描支持pc端瞭,不僅僅支持windows,就連mac os都支持瞭,這不就直接實現瞭軟件層面的all in one瞭嘛!隻需要一個軟件,不管在任何設備上都可以擁有相同的使用體驗。而且,這個會員隻需要30元,一杯奶茶錢,終身無限次的識別圖片以及表格,而且所有平臺隻需要購買這一個會員就可以瞭(筆者在剛推出會員的時候就已經購買瞭),這就是花小錢辦大事瞭。

2 使用介紹

2.1 功能簡介

這部分由於偷懶就不想自己截圖瞭,直接把官網的圖搬運過來瞭,大傢見諒。

生成掃描件

文字識別

表格識別

快捷方式識別

翻譯

掃描邊界

批量識別

校對

同步識別

2.2 電腦端實際使用體驗

正常界面

可以看到,這個軟件的電腦端支持的不僅僅包括表格識別、文字識別,甚至還包括瞭公式識別。

設置界面

設置界面除瞭提供快速截圖識別的快捷鍵設置外,還提供瞭多種選項可以選擇,這一點基本覆蓋瞭天若ocr的使用場景。

文字識別測試:

文字識別

圖片文字的識別還是非常準確的,基本沒有錯誤,除瞭支持導出到剪貼板外,還支持導出為txt文件和docx格式word文檔。

表格識別測試:

這裡用值得買公司的高管信息進行測試

測試用圖

識別結果1

識別結果2

導出excel後,可以看到,除瞭第一列幹擾信息過多導致的原因外,基本的格式還是保留的較為完整的。

公式識別:

這裡用微積分的公式進行測試

微積分公式

識別結果3

可以看出,對公式的識別結果還是較為完美的。

3 總結

筆者之前也有折騰過paddleocr的識別,也想過去折騰百度新出的pp-structure表格識別,但是在某一天發現這個軟件之後,發現好像完全沒有折騰的必要瞭。

因此,在國慶的最後一天,為大傢推薦一下這個軟件。好的軟件,總是需要收費,才能保證其功能的不斷完善,相對於折騰所耗費的時間,倒不妨花小錢辦大事瞭。

希望大傢在國慶後的工作生活中,此軟件能夠助力學習工作,實現效率的提升。

本文無利益相關,買這個會員少說也是五六年前的事情瞭,隻是單純覺得這款軟件不錯才加以推薦。

作者聲明本文無利益相關,歡迎值友理性交流,和諧討論~