Do wyodrębniania tekstu z obrazu zazwyczaj wykorzystuje się oprogramowanie do optycznego rozpoznawania znaków (OCR). Od wersji Google Chrome 76 istnieje jednak możliwość użycia eksperymentalnej funkcji, która pozwala na pobieranie tekstu z obrazów bez potrzeby stosowania dodatkowego oprogramowania.
Korzystanie z OCR do wykrywania tekstu jest procesem wymagającym dużej mocy obliczeniowej. Na szczęście producenci sprzętu od dłuższego czasu wspierają wykrywanie kształtów.
Shape Detection API
W tym kontekście warto wspomnieć o Shape Detection API. Interfejs ten opiera się na akceleracji sprzętowej urządzenia, na którym działa, i umożliwia wykrywanie kodów kreskowych, takich jak kody QR, a także wykrywanie twarzy i tekstu. Więcej informacji na temat działania API można znaleźć na stronie dewelopera. Dodatkowe szczegóły dotyczące wykrywania tekstu znajdują się na stronie grupy społeczności Web Incubator.
Jak włączyć funkcję
Aby skorzystać z tej funkcji, należy włączyć eksperymentalną flagę w Chrome. Warto jednak pamiętać, że korzystając z opcji chrome://flags, używasz funkcji, które nie zostały w pełni przetestowane i mogą działać nieprawidłowo. Możliwe, że napotkasz pewne błędy, dlatego zaleca się ostrożność przy eksperymentowaniu z dostępnymi flagami.
W tym przewodniku używamy komputera z systemem Windows, ale proces powinien być podobny na innych platformach, w tym na urządzeniach mobilnych.
Kroki do włączenia funkcji
Aby rozpocząć, uruchom Chrome, wpisz chrome://flags w omniboksie, naciśnij Enter, a następnie wpisz „Eksperymentalna platforma internetowa” w pasku wyszukiwania.
Możesz także wkleić chrome://flags/#enable-experimental-web-platform-features do omniboksu i nacisnąć Enter, aby przejść bezpośrednio do flagi.
Następnie kliknij menu rozwijane obok flagi „Eksperymentalna platforma internetowa” i wybierz „Włączone”.
Aby zmiany odniosły skutek, musisz ponownie uruchomić Chrome. Kliknij niebieski przycisk „Uruchom ponownie teraz” u dołu strony.
Gdy Chrome zostanie ponownie uruchomiony, przejdź do https://copy-image-text.glitch.me/, aby przesłać obraz z tekstem, który chcesz wyodrębnić. Kliknij „Wybierz plik”.
Wybierz plik obrazu z komputera i kliknij „Otwórz”.
Pomimo tego, że „przesyłasz” obraz do serwisu, możesz używać tego narzędzia również w trybie offline. Po wejściu na stronę, wszystkie zasoby zostaną zapisane w pamięci podręcznej.
Po przesłaniu pliku kliknij „Prześlij”.
Strona zostanie ponownie załadowana z wyodrębnionym tekstem. Możesz teraz skopiować tekst ze strony i wkleić go do dowolnego edytora tekstu lub procesora tekstu.
Należy jednak zauważyć, że ta funkcja może być nieco błędna. Jak pokazuje powyższy obrazek, tylko około połowa dokumentu została przesłana i zeskanowana. Problemy te powinny zostać rozwiązane w przyszłych aktualizacjach.