Follow us on Facebook to receive important updates Follow us on Twitter to receive important updates Follow us on sina.com's microblogging site to receive important updates Follow us on Douban to receive important updates
Chinese Text Project
Discussion -> Chinese Text Project -> 請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR

2024-12-29 08:54:13請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR
Posted by: oscarsun72 (孫守真)諸位賢友慈悲:
  感恩 諸位大慈大悲參與本站文本輸入及校讀之工作,只是經常看到 諸仁仍多以打字鍵入的方式輸入文本,似尚不知網路上已經有不少免費資源可供利用。末學淺陋,只知北京龍泉寺 賢超法師之《古籍酷》AI服務及《看典古籍》二站便有性能極佳、辨識度極高的OCR工具,且均是面向全球免費開放使用的。唯《古籍酷》只須註冊個帳號,便每日有6頁OCR的免費額度。(每日1000點,一次150點。)而《看典古籍》更是完全免帳密就能使用。不知 各位大德何故不用,依然逕自打字輸入?若偏好傳統、過去的方式輸入,胡亦不妨在OCR結果中再予校正打字,不亦較但用本站原有OCR之文本要高明許多?何啻事半功倍!
  本學於本討論區也已有幾帖說明其詳,並有影片演示:
【演示直播預告】簡易輸入本站圖文對照文本的工具 TextForCtext 與賢超法師《古籍酷AI》OCR、自動標點暨《看典古籍》OCR加速輸入本站圖文對照文本之演示
https://ctext.org/discuss.pl?if=gb&thread=8177401

簡易輸入本站圖文對照文本的工具

https://ctext.org/discuss.pl?if=gb&thread=1519833

分段符號「<p>」與分行符號「|」的區別與使用:以TextForCtext 排版檢索加速輸入《中國哲學書電子化計劃》:《古籍酷》《看典古籍》OCR及自動標點輸入,字統網、異體字字典查詢

https://ctext.org/discuss.pl?if=gb&thread=7805224

《古籍酷》OCR網址:gj.cool/try_ocr

《看典古籍》OCR網址:kandianguji.com/ocr

末學經驗是《古籍酷》在墨淡或漫漶之書頁、及大字、行草之書頁,辨識度不如《看典古籍》,而《看典古籍》在文本次序上之識別也遜於《古籍酷》。若能擇優而取、知人善用,則愈優然已。
若如末學向 他們申請「數字萬舟」計劃,則更可有一次5000次以上的額度(詳gj.cool/digital_fleet ),而《看典古籍》則可申請其API,便有一次1000次OCR的額度。

此外《古籍酷》AI服務的自動標點與《AI太炎》的標點功能也是非常卓越的,均是免費面世,可多加利用、善用。花開堪折直須折,莫待無花空折枝。與其從零開始,不如在此諸工具的成果上再加校讀,則何啻站在巨人的肩膀上,來得牛、頓了!願吾 同志大德共勉旃。感恩感恩 讚歎讚歎 南無阿彌陀佛 讚美主


Ps. 末學已經演示很多了。若真仍有需求,請再向末學提出,末學再開直播。否則,不願再自作多情了。容諒。

Reply

2024-12-29 09:12:57請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR
Posted by: oscarsun72 (孫守真)曾經詢問過《古籍酷》與《看典古籍》站長與執事,均樂願與本站合作,也願 站長大人 @dsturgeon (Donald Sturgeon) 能撥冗與之接洽,探看合作事宜,使本站OCR文本質量大幅提昇,省卻共襄校入者之心力,而不但只以2016-10-10哈佛贈書標眉也。(Harvard Yenching Library Chinese materials added) 感恩感恩 讚歎讚歎 南無阿彌陀佛 讚美主
Reply

2024-12-29 09:37:23請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR
Posted by: oscarsun72 (孫守真)竟然忘了,《古籍酷》首頁有「快速體驗 Fast Experience」按鈕,按下,即可執行OCR,每日約有10頁的配額。亦是免費、且免帳密的!感恩感恩 讚歎讚歎 賢超法師諸大德 南無阿彌陀佛

gj.cool/
Reply

2024-12-31 09:44:00請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR
Posted by: stonechi8 (Stone Chi)發現不少OCR後的文字分段或分頁常常有2-5个字錯行或錯頁,想得到善本還需要大量手工調整,不知是否這個軟體導致?
Reply

2025-01-01 07:23:52請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR
Posted by: oscarsun72 (孫守真)
Quote: stonechi8 @ 2024-12-31 09:44:00
發現不少OCR後的文字分段或分頁常常有2-5个字錯行或錯頁,想得到善本還需要大量手工調整,不知是否這個軟體導致?

@stonechi8 賢友慈悲:
  「有2-5个字錯行……」 這應該就是末學所提到的「文本次序」(…而《看典古籍》在文本次序上之識別也遜於《古籍酷》…)但這應不常見,主要是在有夾注時才偶會發生。《古籍酷》罕遘,而《看典古籍》則較常見,可勾選其網頁中的「语序优化beta版」選項,( kandianguji.com/ocr )或利用末學TextForCtext軟件操作讀入OCR結果(程式中已啟用此選項,此亦該站 站長慈示告知者。詳愚GitHub開發歷程記錄 github.com/oscarsun72/TextForC...
  至於「……或錯頁」 末學就不明白了,只能一頁頁操作,何來錯頁問題?除非 賢友是以PDF批量執行操作的。這部分末學就沒經驗了。阿彌陀佛 (前已奉告討論區此處論述不易明白者,可於臉書或新浪微博與末學聯絡(以末學本名「孫守真」或「oscarsun72」找都可找到),或可再加Line或微信詳談,起碼有語音、影像可資瞭解實情。 賢友若仍堅持在此以純文字,聯繫末學,則若鞭長莫及,想 您亦能體諒愛、莫能助之苦衷矣。)

  「大量手工」?難道會比用本站原來的OCR文本、或自己徒手打字校讀來得「大量」許多嗎??難道《古籍酷》與《看典古籍》的OCR結果會比本站的糟上許多麼?捫心自問,真的都沒有省力省事多多嗎?若真沒有,當然就棄置勿用了!然此非末學經驗事實也,末學實境秀鑿鑿可鑑,豈可以片言隻字誣蔑菲薄呢?若此措詞語氣及其言下之意,末學不佞亦萬萬不敢苟同。 有錄影,有真相:github.com/oscarsun72/TextForC... 豈容一語遮天。

  另,附,此等工具均是無償無私的奉獻供普世利用厚生,未取分文,而吾輩坐享其成,滿懷感激亦不足報其萬一,矧吹毛以求疵?可以建議祈請改進,略表薄誠感謝,亦庶幾不愧於讀書種子。感恩感恩 南無阿彌陀佛

  此二站每日均有免費額度可供任何成人善用,而吾輩卻忍心將之荒蕪,棄置不顧,卻依然字字鍵入?真是田園將蕪,於心何忍?真是這麼愛自己打字,OCR完的結果一樣可以讓 您享受打字校訂的快感啊!就算某頁精到一字不誤,也有那麼海量的書頁待喒OCR啊,還怕無誤可校?沒字可打??何況還要排版對齊、仿真原式呢!總有機會按到按鍵的嘛。何苦苦苦執著於、死守在本站十數年前OCR技術下的文本,將自己寶貴的精氣神與之陪葬呢?

  末學所以大聲疾呼者,蓋深知其中利害存廢:日後科技,除非世界末日,只會愈來愈精進,吾輩今牛步所改之丁點,日後倘遇賢能,極其可能會被成批淘汰、整個汰換,則今所付出者,不全都白作了?且後人若尊重咱們,將且不忍心不顧前人苦心編輯者而逕自蓋過,然今兒咱們卻只顧隻字片語校訂改過,或只是在標題、格式小事上動手腳,所餘錯誤卻依然蕪雜繁複,根本無濟於事,在其看來,豈不平添困擾?這是末學在快速批量整理時所深刻體會到的窘境與危機,而 諸仁乃仍燕雀處堂、火宅自安,渾然不知大難,豈不亟可吁嘆!不信,可詳末學實境秀所錄實境,即略知一二。今有此工具幫助吾人在同樣的時間與心力下,盡量最大化校讀成果,卻不思利用,也不願瞭解,如是存心用心,明知故犯,末學愚實不知是何緣故,只能名曰慈禧義和現象了麼?若仍冥頑不靈,故步自封,依然故我,我行我素,老子高興就好,則後人不恤吾先之苦辛,亦何可怪矣,亦何復責云。謹納直諒,望務 自愛。感恩感恩 南無阿彌陀佛 佛弟子文獻學者孫守真任真甫合十敬白
Reply

2025-01-01 08:31:21請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR
Posted by: oscarsun72 (孫守真)
Quote: stonechi8 @ 2024-12-31 09:44:00
發現不少OCR後的文字分段或分頁常常有2-5个字錯行或錯頁,想得到善本還需要大量手工調整,不知是否這個軟體導致?

賢友慈悲:剛才整理此頁時,以《看典古籍》API 用 TextForCtext 讀入,即如 賢友菩薩所提者,前後文序大亂也。
  https://ctext.org/library.pl?if=en&file=73226&page=4
若此者自可斟酌去取;唯仍不宜瑕而棄玉、偏以概全,而略其不亂之功、與夫卓然少誤者也。也願吾 賢友倘得其便利,亦不吝賜予褒揚,周知同志也。感恩感恩 南無阿彌陀佛
Reply

2025-01-07 03:43:18請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR
Posted by: oscarsun72 (孫守真)呼籲 大家多試用,別把免費的額度給浪費掉了。我近來也是多利用其免費額度參與編輯的,直怕浪費虛擲,就很有可觀,何況,如《古籍酷》標注平台( gj.cool/try_ocr?tab=line )雖要登入,一日也有6頁/次額度,十天就60頁,百日就600頁…… 僅舉此一隅,即能積少成多、累沙為塔,豈忍忽視放過?不猶較 諸仁一字、二字這樣點點滴滴、丁丁點點校改,來得殊勝許多?……至於首頁「快速體驗」(那個大紅按鈕 gj.cool/ )至少也有10頁,也不用登入,一如《看典古籍》一般,而《看典古籍》( kandianguji.com/ocr )目前還沒有額度限制呢!!! ……~~~ 嗟哉咄咄,胡為乎不試用?如有所譽,其有所試矣。感恩感恩 讚嘆讚嘆 南無阿彌陀佛
Reply

2025-01-08 06:49:52請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR
Posted by: oscarsun72 (孫守真)工欲善其事必先利其器!感恩感恩 讚歎讚歎 南無阿彌陀佛 讚美主

dict.idioms.moe.edu.tw/idiomVi...

dict.revised.moe.edu.tw/dictVi...

ivantsoi.myds.me/web/hydcd/org...

https://ctext.org/wiki.pl?if=gb&res=902299&searchu=%E5%B7%A5%E6%AC%B2%E5%96%84%E5%85%B6%E4%BA%8B%E5%BF%85%E5%85%88%E5%88%A9%E5%85%B6%E5%99%A8

https://ctext.org/library.pl?if=gb&file=98095&page=140#%E5%B7%A5%E6%AC%B2%E5%96%84%E5%85%B6%E4%BA%8B%E5%BF%85%E5%85%88%E5%88%A9%E5%85%B6%E5%99%A8

https://ctext.org/wiki.pl?if=gb&res=691895&searchu=%E5%B7%A5%E6%AC%B2%E5%96%84%E5%85%B6%E4%BA%8B%E5%BF%85%E5%85%88%E5%88%A9%E5%85%B6%E5%99%A8

https://ctext.org/library.pl?if=gb&file=88927&page=104#%E5%B7%A5%E6%AC%B2%E5%96%84%E5%85%B6%E4%BA%8B%E5%BF%85%E5%85%88%E5%88%A9%E5%85%B6%E5%99%A8
Reply



To participate in the discussion, please log in to your CTP account using the form below. If you don't yet have an account, click here to set one up.

Log in
Username:
Password:
Keep me logged in
Forgotten password

Enjoy this site? Please help.Site design and content copyright 2006-2025. When quoting or citing information from this site, please link to the corresponding page or to http://ctext.org. Please note that the use of automatic download software on this site is strictly prohibited, and that users of such software are automatically banned without warning to save bandwidth. 沪ICP备09015720号-3Comments? Suggestions? Please raise them here.Do not click this link