Chinese Text Project |
2024-12-29 08:54:13請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR | |
---|---|
Posted by: oscarsun72 (孫守真) | 諸位賢友慈悲:
感恩 諸位大慈大悲參與本站文本輸入及校讀之工作,只是經常看到 諸仁仍多以打字鍵入的方式輸入文本,似尚不知網路上已經有不少免費資源可供利用。末學淺陋,只知北京龍泉寺 賢超法師之《古籍酷》AI服務及《看典古籍》二站便有性能極佳、辨識度極高的OCR工具,且均是面向全球免費開放使用的。唯《古籍酷》只須註冊個帳號,便每日有6頁OCR的免費額度。(每日1000點,一次150點。)而《看典古籍》更是完全免帳密就能使用。不知 各位大德何故不用,依然逕自打字輸入?若偏好傳統、過去的方式輸入,胡亦不妨在OCR結果中再予校正打字,不亦較但用本站原有OCR之文本要高明許多?何啻事半功倍! 本學於本討論區也已有幾帖說明其詳,並有影片演示: 【演示直播預告】簡易輸入本站圖文對照文本的工具 TextForCtext 與賢超法師《古籍酷AI》OCR、自動標點暨《看典古籍》OCR加速輸入本站圖文對照文本之演示 https://ctext.org/discuss.pl?if=gb&thread=8177401 簡易輸入本站圖文對照文本的工具 https://ctext.org/discuss.pl?if=gb&thread=1519833 分段符號「<p>」與分行符號「|」的區別與使用:以TextForCtext 排版檢索加速輸入《中國哲學書電子化計劃》:《古籍酷》《看典古籍》OCR及自動標點輸入,字統網、異體字字典查詢 https://ctext.org/discuss.pl?if=gb&thread=7805224 《古籍酷》OCR網址:gj.cool/try_ocr 《看典古籍》OCR網址:kandianguji.com/ocr 末學經驗是《古籍酷》在墨淡或漫漶之書頁、及大字、行草之書頁,辨識度不如《看典古籍》,而《看典古籍》在文本次序上之識別也遜於《古籍酷》。若能擇優而取、知人善用,則愈優然已。 若如末學向 他們申請「數字萬舟」計劃,則更可有一次5000次以上的額度(詳gj.cool/digital_fleet ),而《看典古籍》則可申請其API,便有一次1000次OCR的額度。 此外《古籍酷》AI服務的自動標點與《AI太炎》的標點功能也是非常卓越的,均是免費面世,可多加利用、善用。花開堪折直須折,莫待無花空折枝。與其從零開始,不如在此諸工具的成果上再加校讀,則何啻站在巨人的肩膀上,來得牛、頓了!願吾 同志大德共勉旃。感恩感恩 讚歎讚歎 南無阿彌陀佛 讚美主 Ps. 末學已經演示很多了。若真仍有需求,請再向末學提出,末學再開直播。否則,不願再自作多情了。容諒。 |
Reply |
2024-12-29 09:12:57請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR | |
---|---|
Posted by: oscarsun72 (孫守真) | 曾經詢問過《古籍酷》與《看典古籍》站長與執事,均樂願與本站合作,也願 站長大人 @dsturgeon (Donald Sturgeon) 能撥冗與之接洽,探看合作事宜,使本站OCR文本質量大幅提昇,省卻共襄校入者之心力,而不但只以2016-10-10哈佛贈書標眉也。(Harvard Yenching Library Chinese materials added) 感恩感恩 讚歎讚歎 南無阿彌陀佛 讚美主 |
Reply |
2024-12-29 09:37:23請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR | |
---|---|
Posted by: oscarsun72 (孫守真) | 竟然忘了,《古籍酷》首頁有「快速體驗 Fast Experience」按鈕,按下,即可執行OCR,每日約有10頁的配額。亦是免費、且免帳密的!感恩感恩 讚歎讚歎 賢超法師諸大德 南無阿彌陀佛
gj.cool/ |
Reply |
2024-12-31 09:44:00請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR | |
---|---|
Posted by: stonechi8 (Stone Chi) | 發現不少OCR後的文字分段或分頁常常有2-5个字錯行或錯頁,想得到善本還需要大量手工調整,不知是否這個軟體導致? |
Reply |
2025-01-01 07:23:52請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR | |||
---|---|---|---|
Posted by: oscarsun72 (孫守真) |
@stonechi8 賢友慈悲: 「有2-5个字錯行……」 這應該就是末學所提到的「文本次序」(…而《看典古籍》在文本次序上之識別也遜於《古籍酷》…)但這應不常見,主要是在有夾注時才偶會發生。《古籍酷》罕遘,而《看典古籍》則較常見,可勾選其網頁中的「语序优化beta版」選項,( kandianguji.com/ocr )或利用末學TextForCtext軟件操作讀入OCR結果(程式中已啟用此選項,此亦該站 站長慈示告知者。詳愚GitHub開發歷程記錄 github.com/oscarsun72/TextForC... 至於「……或錯頁」 末學就不明白了,只能一頁頁操作,何來錯頁問題?除非 賢友是以PDF批量執行操作的。這部分末學就沒經驗了。阿彌陀佛 (前已奉告討論區此處論述不易明白者,可於臉書或新浪微博與末學聯絡(以末學本名「孫守真」或「oscarsun72」找都可找到),或可再加Line或微信詳談,起碼有語音、影像可資瞭解實情。 賢友若仍堅持在此以純文字,聯繫末學,則若鞭長莫及,想 您亦能體諒愛、莫能助之苦衷矣。) 「大量手工」?難道會比用本站原來的OCR文本、或自己徒手打字校讀來得「大量」許多嗎??難道《古籍酷》與《看典古籍》的OCR結果會比本站的糟上許多麼?捫心自問,真的都沒有省力省事多多嗎?若真沒有,當然就棄置勿用了!然此非末學經驗事實也,末學實境秀鑿鑿可鑑,豈可以片言隻字誣蔑菲薄呢?若此措詞語氣及其言下之意,末學不佞亦萬萬不敢苟同。 有錄影,有真相:github.com/oscarsun72/TextForC... 豈容一語遮天。 另,附,此等工具均是無償無私的奉獻供普世利用厚生,未取分文,而吾輩坐享其成,滿懷感激亦不足報其萬一,矧吹毛以求疵?可以建議祈請改進,略表薄誠感謝,亦庶幾不愧於讀書種子。感恩感恩 南無阿彌陀佛 此二站每日均有免費額度可供任何成人善用,而吾輩卻忍心將之荒蕪,棄置不顧,卻依然字字鍵入?真是田園將蕪,於心何忍?真是這麼愛自己打字,OCR完的結果一樣可以讓 您享受打字校訂的快感啊!就算某頁精到一字不誤,也有那麼海量的書頁待喒OCR啊,還怕無誤可校?沒字可打??何況還要排版對齊、仿真原式呢!總有機會按到按鍵的嘛。何苦苦苦執著於、死守在本站十數年前OCR技術下的文本,將自己寶貴的精氣神與之陪葬呢? 末學所以大聲疾呼者,蓋深知其中利害存廢:日後科技,除非世界末日,只會愈來愈精進,吾輩今牛步所改之丁點,日後倘遇賢能,極其可能會被成批淘汰、整個汰換,則今所付出者,不全都白作了?且後人若尊重咱們,將且不忍心不顧前人苦心編輯者而逕自蓋過,然今兒咱們卻只顧隻字片語校訂改過,或只是在標題、格式小事上動手腳,所餘錯誤卻依然蕪雜繁複,根本無濟於事,在其看來,豈不平添困擾?這是末學在快速批量整理時所深刻體會到的窘境與危機,而 諸仁乃仍燕雀處堂、火宅自安,渾然不知大難,豈不亟可吁嘆!不信,可詳末學實境秀所錄實境,即略知一二。今有此工具幫助吾人在同樣的時間與心力下,盡量最大化校讀成果,卻不思利用,也不願瞭解,如是存心用心,明知故犯,末學愚實不知是何緣故,只能名曰慈禧義和現象了麼?若仍冥頑不靈,故步自封,依然故我,我行我素,老子高興就好,則後人不恤吾先之苦辛,亦何可怪矣,亦何復責云。謹納直諒,望務 自愛。感恩感恩 南無阿彌陀佛 佛弟子文獻學者孫守真任真甫合十敬白 | ||
Reply |
2025-01-01 08:31:21請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR | |||
---|---|---|---|
Posted by: oscarsun72 (孫守真) |
賢友慈悲:剛才整理此頁時,以《看典古籍》API 用 TextForCtext 讀入,即如 賢友菩薩所提者,前後文序大亂也。 https://ctext.org/library.pl?if=en&file=73226&page=4 若此者自可斟酌去取;唯仍不宜瑕而棄玉、偏以概全,而略其不亂之功、與夫卓然少誤者也。也願吾 賢友倘得其便利,亦不吝賜予褒揚,周知同志也。感恩感恩 南無阿彌陀佛 | ||
Reply |
2025-01-07 03:43:18請多利用《古籍酷》《看典古籍》《AI太炎》諸免費服務,尤其是OCR | |
---|---|
Posted by: oscarsun72 (孫守真) | 呼籲 大家多試用,別把免費的額度給浪費掉了。我近來也是多利用其免費額度參與編輯的,直怕浪費虛擲,就很有可觀,何況,如《古籍酷》標注平台( gj.cool/try_ocr?tab=line )雖要登入,一日也有6頁/次額度,十天就60頁,百日就600頁…… 僅舉此一隅,即能積少成多、累沙為塔,豈忍忽視放過?不猶較 諸仁一字、二字這樣點點滴滴、丁丁點點校改,來得殊勝許多?……至於首頁「快速體驗」(那個大紅按鈕 gj.cool/ )至少也有10頁,也不用登入,一如《看典古籍》一般,而《看典古籍》( kandianguji.com/ocr )目前還沒有額度限制呢!!! ……~~~ 嗟哉咄咄,胡為乎不試用?如有所譽,其有所試矣。感恩感恩 讚嘆讚嘆 南無阿彌陀佛 |
Reply |
To participate in the discussion, please log in to your CTP account using the form below. If you don't yet have an account, click here to set one up.
Log in |
---|
Enjoy this site? Please help. | Site design and content copyright 2006-2025. When quoting or citing information from this site, please link to the corresponding page or to http://ctext.org. Please note that the use of automatic download software on this site is strictly prohibited, and that users of such software are automatically banned without warning to save bandwidth. 沪ICP备09015720号-3 | Comments? Suggestions? Please raise them here.Do not click this link |