All Projects → sum1re → Caption_ocr_tool

sum1re / Caption_ocr_tool

Licence: apache-2.0
视频硬字幕提取工具

Programming Languages

java
68154 projects - #9 most used programming language

Projects that are alternatives of or similar to Caption ocr tool

Hplayer
A multi-screen player using Qt + FFmpeg.
Stars: ✭ 330 (+236.73%)
Mutual labels:  opencv, ffmpeg
Codeguide
📚 本代码库是作者小傅哥多年从事一线互联网 Java 开发的学习历程技术汇总,旨在为大家提供一个清晰详细的学习教程,侧重点更倾向编写Java核心内容。如果本仓库能为您提供帮助,请给予支持(关注、点赞、分享)!
Stars: ✭ 6,750 (+6787.76%)
Mutual labels:  springboot, javafx
Springboot Javafx Support
SpringBoot / JavaFX8 Integration
Stars: ✭ 354 (+261.22%)
Mutual labels:  springboot, javafx
TinyClip
🚀 JavaFX开发的FFMPEG-GUI客户端
Stars: ✭ 59 (-39.8%)
Mutual labels:  ffmpeg, javafx
Video To Ascii
It is a simple python package to play videos in the terminal using characters as pixels
Stars: ✭ 960 (+879.59%)
Mutual labels:  opencv, ffmpeg
Ffdynamic
Library with dynamic audio/video composition and runtime control
Stars: ✭ 274 (+179.59%)
Mutual labels:  opencv, ffmpeg
Piper
piper - a distributed workflow engine
Stars: ✭ 374 (+281.63%)
Mutual labels:  springboot, ffmpeg
Spacextract
Extraction and analysis of telemetry from rocket launch webcasts (from SpaceX and RocketLab)
Stars: ✭ 131 (+33.67%)
Mutual labels:  opencv, ffmpeg
Rtsp Client Ffmpeg Opencv On Qt
RTSP Client Program using FFmpeg and OpenCV on Qt
Stars: ✭ 31 (-68.37%)
Mutual labels:  opencv, ffmpeg
Javacv
Java interface to OpenCV, FFmpeg, and more
Stars: ✭ 5,543 (+5556.12%)
Mutual labels:  opencv, ffmpeg
subtitles-view
基于javaFX的简单字幕处理桌面程序,集成在线翻译及语音转换
Stars: ✭ 368 (+275.51%)
Mutual labels:  javafx, springboot
Ipcamera Cpython Interface
兼容主流海康和雄迈IPC的适用于C++和python的帧数据获取接口
Stars: ✭ 38 (-61.22%)
Mutual labels:  opencv, ffmpeg
Spring Javafx Examples
Example apps for springboot-javafx-support. See
Stars: ✭ 124 (+26.53%)
Mutual labels:  springboot, javafx
Naivechat
🎭 本项目是作者小傅哥使用JavaFx、Netty4.x、SpringBoot、Mysql等技术栈和偏向于DDD领域驱动设计方式,搭建的仿桌面版微信实现通信核心功能。课程文章已发布到GitChat专栏,欢迎购买。如果本项目能为您提供帮助,请给予支持(关注、⭐️Star、分享)!
Stars: ✭ 290 (+195.92%)
Mutual labels:  springboot, javafx
Vidgear
A High-performance cross-platform Video Processing Python framework powerpacked with unique trailblazing features 🔥
Stars: ✭ 2,048 (+1989.8%)
Mutual labels:  opencv, ffmpeg
Delphi Opencv
Project Delphi-OpenCV. Translation of OpenCV library header files in Delphi
Stars: ✭ 354 (+261.22%)
Mutual labels:  opencv, ffmpeg
Qupath
QuPath - Bioimage analysis & digital pathology
Stars: ✭ 503 (+413.27%)
Mutual labels:  javafx, opencv
Pyimagevideo
write animated GIF, multipage append TIFF, AVI OGV video in Python
Stars: ✭ 36 (-63.27%)
Mutual labels:  opencv, ffmpeg
Dokai
Collection of Docker images for ML/DL and video processing projects
Stars: ✭ 58 (-40.82%)
Mutual labels:  opencv, ffmpeg
Cssfx
Allow runtime modification of JavaFX CSS
Stars: ✭ 95 (-3.06%)
Mutual labels:  javafx

Caption OCR Tool (abbr. COCR)

logo

目录

简介

一款 视频硬字幕提取 的工具, 使用 OpenCV 进行视频/图像处理, 再利用 Tesseract-OCR 识别.

COCR 提供 HSV, HLS, 二值形态学的过滤方法, 对于颜色偏暗的场景, 二值形态学比色彩过滤效果更佳.

系统需求

项目 最低配置
操作系统 Windows 7 x64
CPU 2C2T
内存 4 GB
GPU 显存 2 GB
空闲空间 500 MB

基本使用

  1. 打开视频文件, 并点击 滤镜.

  2. 选择一个模块配置, 重点: 调整 "裁剪" 模块中的字幕区域, 不要搞错左上角和右下角的位置!.

    注: 滤镜最后得到的图像应该是白底黑字的!!

    • 如果不是黑白的二值图像, 调整你的滤镜模块和参数;

    • 如果是黑字白底, 需要加一个 "反转" 模块;

  3. 关闭 滤镜 窗口后, 主窗口点击 开始 提取字幕.

  4. 开启 管理模式, 标记无效的字幕, 并点击 删除&合并.

  5. 点击 OCR 识别字符, 或者使用 导出 图像后利用其他软件 OCR.

  6. 对文本进行校准, 点击 另存为 保存字幕文件.

其他

  • 遇到错误提示, 查 模块说明Google, 确保参数是合法的; 提交 Issue 的时候带上具体错误信息, 在 log 中可以找到.

  • 启动闪屏可更换图片, 把 jpg/png 格式的图片放到安装目录下的 splash 文件夹中.

  • 删除&合并操作逻辑

flow

开发

依赖

  • JDK 11+

  • Maven 3.0+

  • Lombok

  • JavaFX jmods 11+ (生成 JRE Runtime 需要)

编译

克隆源码

git clone https://github.com/sum1re/caption_ocr_tool.git

打开 caption_ocr_tool 文件夹, 安装 OpenCv.jar

mvn install:install-file -Dfile=lib/opencv-420.jar -DgroupId=org.opencv -DartifactId=opencv -Dversion=4.2.0 -Dpackaging=jar -DgeneratePom=true

IDEA 或其他软件导入项目, 下载依赖后编译

mvn compile

运行需要指定 JVM 参数

-server -Xmx4g -Dfile.encoding=utf-8 -Dcocr.dir=$ProjectFileDir$/cocr_setup_win/app -Djava.library.path=$ProjectFileDir$/lib -Dprism.targetvram=2G -Dprism.vsync=false -Dprism.scrollcacheopt=true -Djavafx.preloader=com.neo.caption.ocr.AppPreloader

项目使用 Github Actions 打包并发布 Windows 安装程序

其他

  • Tesseract-OCR LSTM 训练, 参考官方手册

  • 关于 Test, 由于项目基于 SpringBoot + JavaFX, 完全不知道如何 Test.

  • 构建 JRE Runtim

    jlink --module-path jmods/path --add-modules MODULE_LIST --compress 2 --strip-debug --output out/path/runtime
    
  • JRE Runtime 需要包含的 Module

    java.base,java.instrument,java.sql,jdk.unsupported,java.compiler,java.logging,java.desktop,java.naming,java.xml,java.prefs,java.management,java.rmi,java.scripting,jdk.httpserver,javafx.base,javafx.controls,javafx.fxml,javafx.graphics
    
Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].