Jak zeskrobać tekst z obrazu w przeglądarce Chrome

Do wyodrębniania tekstu z obrazu zazwyczaj wykorzystuje się oprogramowanie do optycznego rozpoznawania znaków (OCR). Od wersji Google Chrome 76 istnieje jednak możliwość użycia eksperymentalnej funkcji, która pozwala na pobieranie tekstu z obrazów bez potrzeby stosowania dodatkowego oprogramowania.

Korzystanie z OCR do wykrywania tekstu jest procesem wymagającym dużej mocy obliczeniowej. Na szczęście producenci sprzętu od dłuższego czasu wspierają wykrywanie kształtów.

Shape Detection API

W tym kontekście warto wspomnieć o Shape Detection API. Interfejs ten opiera się na akceleracji sprzętowej urządzenia, na którym działa, i umożliwia wykrywanie kodów kreskowych, takich jak kody QR, a także wykrywanie twarzy i tekstu. Więcej informacji na temat działania API można znaleźć na stronie dewelopera. Dodatkowe szczegóły dotyczące wykrywania tekstu znajdują się na stronie grupy społeczności Web Incubator.

Jak włączyć funkcję

Aby skorzystać z tej funkcji, należy włączyć eksperymentalną flagę w Chrome. Warto jednak pamiętać, że korzystając z opcji chrome://flags, używasz funkcji, które nie zostały w pełni przetestowane i mogą działać nieprawidłowo. Możliwe, że napotkasz pewne błędy, dlatego zaleca się ostrożność przy eksperymentowaniu z dostępnymi flagami.

W tym przewodniku używamy komputera z systemem Windows, ale proces powinien być podobny na innych platformach, w tym na urządzeniach mobilnych.

Kroki do włączenia funkcji

Aby rozpocząć, uruchom Chrome, wpisz chrome://flags w omniboksie, naciśnij Enter, a następnie wpisz „Eksperymentalna platforma internetowa” w pasku wyszukiwania.

Możesz także wkleić chrome://flags/#enable-experimental-web-platform-features do omniboksu i nacisnąć Enter, aby przejść bezpośrednio do flagi.

Następnie kliknij menu rozwijane obok flagi „Eksperymentalna platforma internetowa” i wybierz „Włączone”.

Aby zmiany odniosły skutek, musisz ponownie uruchomić Chrome. Kliknij niebieski przycisk „Uruchom ponownie teraz” u dołu strony.

Gdy Chrome zostanie ponownie uruchomiony, przejdź do https://copy-image-text.glitch.me/, aby przesłać obraz z tekstem, który chcesz wyodrębnić. Kliknij „Wybierz plik”.

Wybierz plik obrazu z komputera i kliknij „Otwórz”.

Pomimo tego, że „przesyłasz” obraz do serwisu, możesz używać tego narzędzia również w trybie offline. Po wejściu na stronę, wszystkie zasoby zostaną zapisane w pamięci podręcznej.

Po przesłaniu pliku kliknij „Prześlij”.

Strona zostanie ponownie załadowana z wyodrębnionym tekstem. Możesz teraz skopiować tekst ze strony i wkleić go do dowolnego edytora tekstu lub procesora tekstu.

Należy jednak zauważyć, że ta funkcja może być nieco błędna. Jak pokazuje powyższy obrazek, tylko około połowa dokumentu została przesłana i zeskanowana. Problemy te powinny zostać rozwiązane w przyszłych aktualizacjach.