Извлекайте текст из любого изображения - приватно
Нужен текст со скриншота, фото документа, чека или слайда? Этот инструмент прочитает его за вас и выдаст чистый редактируемый текст для копирования или скачивания. В отличие от большинства сайтов «изображение в текст», ваше изображение никогда не загружается - оптическое распознавание символов (OCR) выполняется полностью в вашем браузере, поэтому даже конфиденциальные сканы и документы остаются на вашем устройстве.
Как работает OCR в браузере
OpenConvert использует Tesseract - зрелый OCR-движок с открытым кодом, скомпилированный в WebAssembly. При первом выборе языка небольшая модель распознавания загружается в ваш браузер и кэшируется на будущее - так же, как Удаление фона загружает свою модель. Далее изображения обрабатываются локально, без обращения к серверу.
Советы для лучшей точности
- Используйте чёткое контрастное изображение - тёмный текст на светлом фоне читается лучше всего.
- Сначала выровняйте - сильно наклонённый или повёрнутый текст снижает точность.
- Выберите нужный язык перед извлечением, особенно для диакритики или нелатинских письменностей.
- Обрежьте лишнее, чтобы движок сосредоточился на нужном тексте.
FAQ
Загружаются ли мои изображения на сервер?
- Нет - OCR работает локально в вашем браузере через WebAssembly. Ваше изображение никогда не покидает устройство; в браузер загружается только языковая модель.
Какие языки он распознаёт?
- Более 15, включая английский, французский, немецкий, испанский, португальский, итальянский, румынский, русский, китайский, японский и арабский. Выберите язык перед извлечением для лучшей точности.
Почему первое сканирование медленное?
- При первом использовании языка его модель распознавания (несколько мегабайт) загружается в браузер и кэшируется. После этого сканирование намного быстрее.
Насколько точен OCR?
- Очень точен на чётком контрастном печатном тексте. Рукописный текст, низкое разрешение, блики и наклон снижают точность - используйте чёткое, хорошо освещённое и ровное изображение.