?

Log in

No account? Create an account
 
 
02 February 2016 @ 06:28 pm
Screenshot OCR from clipboard  
http://structurise.com/screenshot-ocr/

Discussion on HN: https://news.ycombinator.com/item?id=11023217
Tags: , ,
 
 
 
журнал закрытjuan_gandhi on February 3rd, 2016 12:27 am (UTC)
Впечатляет.
Dennis Gorelikdennisgorelik on February 3rd, 2016 05:28 am (UTC)
Осталось только научиться это продавать или как-то популяризировать.
spectatspectat on February 3rd, 2016 06:01 am (UTC)
Здорово, хорошо работает.
Dennis Gorelikdennisgorelik on February 3rd, 2016 06:06 am (UTC)
Вот как бы это ещё превратить в бизнес...
spectatspectat on February 3rd, 2016 06:41 am (UTC)
На телефонах что-то такое есть уже? Люди часто фотки документов друг-другу шлют.
Dennis Gorelikdennisgorelik on February 3rd, 2016 10:46 am (UTC)
1) На мобильниках фотка вряд ли вставляется через clipboard. Там, наверное, сразу вставляется в приложение, которое инициировало фотографию.

2) Я обнаружил, что на Google Docs можно в документ вставить картинку.
Также у Google Docs вроде есть API, который позволяет делать OCR.
То есть, теоретически, технологии есть. Но вот чтобы они были так собраны вместе - я не видел.
occam_agaoccam_aga on February 3rd, 2016 05:29 pm (UTC)
В виде одной самостоятельной фичи, наверное никак. Надо смотреть в сторону большего продукта, куда оно войдет составляющей. С.м. Evernote, OneNote и т.п.
Dennis Gorelikdennisgorelik on February 4th, 2016 05:12 am (UTC)
How to turn it into business
То есть надо проадавать productized consulting?
Как раз тем самым Evernote, OneNote, Asana etc.?
occam_agaoccam_aga on February 4th, 2016 06:03 pm (UTC)
Re: How to turn it into business
Дяденька, ну я же не настоящий сварщик :) сколько чего пытался продавать, кроме сигарет, жвачек и помидоров ничего не пошло.

Не очень понятно в чем техническая новизна. OCR давно есть, драг-дропать файлы на вебстраницу тоже уже давно можно. Идею слишком легко украсть.

К тому что есть, можно прикрутить хранилище с поиском, типа пикаса-веб, только для скриншотов.

Можно плагин к браузеру сделать.

Можно сделать javascript библиотеку, чтобы автоматически сохранять скриншоты с любой вебстраницы или даже всего экрана. Для того же тестирования. Вставляешь код в тестовый билд и тестировщикам не придется копипастить багрепорт. Можно с Селениум-ом заинтегрироваться.

Можно выйти из box-а тестирования и еще чего понапридумывать. Прикрутить это к google street view или к паблик вебкамерам.

В любом случае, усилий придется приложить еще х10. И деньги брать уже за эту самую дополнительную работу.

MS или Evernote врядли купят OCR обернутый в веб, у них свое OCR есть. А вот какой ни-будь онлайн магазин или craigslist, у которого есть фотки чужих тoваров... или, еще лучше, агрегатор чужих вебстраниц.
Dennis Gorelikdennisgorelik on February 4th, 2016 07:20 pm (UTC)
Re: How to turn it into business
> кроме сигарет, жвачек и помидоров ничего не пошло

Это тоже хороший результат.
Кроме того, свой собственный труд тоже ведь удалось продать?

> Идею слишком легко украсть

Для этого надо быть готовым бросить заниматься тем, чем-то другим, чем занимаешься на данный момент. А это - большой opportunity cost.

> javascript библиотеку, чтобы автоматически сохранять скриншоты с любой вебстраницы или даже всего экрана.

Интересная идея.

> тестировщикам не придется копипастить багрепорт.

Тестировщикам ведь всё равно нужно как-то обозначить, что именно нужно копипастить. Иначе в багрепорт попадёт темплейт багрепорта.
occam_agaoccam_aga on February 4th, 2016 08:05 pm (UTC)
Re: How to turn it into business
> Для этого надо быть готовым бросить заниматься тем, чем-то другим, чем занимаешься на данный момент. А это - большой opportunity cost.

Я не знаю как оно внутри устроено, но мне кажется, студент может такое повторить за выходные.

Вот попробовал :) Windows 10, копи паст
> TECTMDOBLLMKBM He aDETCQ Konmnacm Sarpenopr.
TECTMDOBLLIMKBM Benb Bcé paBHo Hym-io KaK-TO 0603Haum'b, un’o MMEHHO HY)KHO KOI'IMI'IBCTMTb. MHaue B 6arpenopT nonanéT Tet-Inne?'r 6arpenopTa.

а вот латиница, скриншот текста из заголовка этого комента, в который попала иконка с жж человечком

expected result:
occam_aga on February 4th, 2016 12:05 pm (local)
Re: How to turn it into business

actual result:
g. iiii?iggo on February 4th, 2016 12:05 pm (local)
Re: How to turn it into business

Edited at 2016-02-04 08:36 pm (UTC)
Dennis Gorelikdennisgorelik on February 4th, 2016 09:18 pm (UTC)
Re: How to turn it into business
Не может.
Вот когда будет Javascript OCR framework - тогда можно будет что-то подобное сделать и за выходные.
occam_agaoccam_aga on February 4th, 2016 09:35 pm (UTC)
Re: How to turn it into business
http://antimatter15.com/ocrad.js/demo.html

https://www.google.com/search?q=Javascript+OCR

Tesseract.js is a pure javascript version of the Tesseract OCR Engine that can recognize English, Chinese, Russian, Meme, and 60 other languages.

Да и зачем обязательно Javascript, можно ведь на сервер сайд реализовать?
Dennis Gorelikdennisgorelik on February 4th, 2016 11:55 pm (UTC)
Re: How to turn it into business
Hmm... значит конкуренты уже есть.
Это одновременно хорошо (есть рынок сбыта) и плохо (за рынок придётся бороться).