Biegowelove.pl

informacje o Polsce. Wybierz tematy, o których chcesz dowiedzieć się więcej

Nowe wyszukiwanie AI umożliwia klikanie i przeciąganie obrazów w celu manipulowania nimi w ciągu kilku sekund

Nowe wyszukiwanie AI umożliwia klikanie i przeciąganie obrazów w celu manipulowania nimi w ciągu kilku sekund

Nie, to jeszcze nie koniec: możliwości narzędzi AI do przetwarzania obrazów wciąż rosną. Najnowszy przykład to na razie tylko praca naukowa, ale jest bardzo imponujący, ponieważ pozwala użytkownikom po prostu przeciągnąć elementy z obrazu, aby zmienić ich wygląd.

Na pierwszy rzut oka nie brzmi to zbyt ekscytująco, ale spójrz na poniższe przykłady, aby zorientować się, co potrafi ten system.

Nie tylko możesz zmienić wymiary samochodu lub zamienić uśmiech w zmarszczkę jednym dotknięciem i przeciągnięciem, ale możesz także obrócić fotografowany obiekt tak, jakby był modelem 3D — na przykład zmieniając kierunek, w którym patrzy osoba. Jedna demonstracja pokazuje użytkownikowi, jak za pomocą kilku kliknięć dostosować odbicia na jeziorze i wysokość pasma górskiego.

Oto przegląd różnych tematów:

Oto bliższe spojrzenie na przetwarzanie krajobrazu:

I dla zabawy, majstruj przy czerni:

Te filmy pochodzą z Strona główna zespołu badawczegochociaż może to zostać zakłócone przez ilość ruchu wysyłanego do witryny przez Twittera (Głównie przez user_akhaliq, który wykonuje świetną robotę, podkreślając interesujące dokumenty AI i jest wart kontynuacji, jeśli Cię to interesuje). Możesz także przeczytać artykuł na arXiv Tutaj.

Jak zauważył odpowiedzialny zespół, naprawdę interesującą rzeczą w tej pracy niekoniecznie jest manipulacja obrazem W sobie, ale interfejs użytkownika. Od jakiegoś czasu możemy używać narzędzi sztucznej inteligencji, takich jak sieci GAN, do tworzenia fotorealistycznych obrazów, ale większości metod brakuje elastyczności i precyzji. Możesz poprosić generator obrazów AI, aby „zrobił zdjęcie lwa prześladującego sawannę”, a on go otrzyma, ale może nie być Dokładnie Wymyśl to, czego chcesz lub potrzebujesz.

Ten model, nazwany DragGAN, oferuje oczywiste rozwiązanie tego problemu. Interfejs jest dokładnie taki sam, jak tradycyjne wypaczanie obrazu, ale zamiast rozmazywania i pikselizowania istniejących pikseli, model tworzy motyw od nowa. Jak napisali badacze:[O]Twoje podejście może prowadzić do halucynacji zamkniętej zawartości, jak zęby w paszczy lwa, i może się zdeformować po zestaleniu obiektu, jak zgięcie nogi konia.

READ  Microsoft twierdzi, że w marcu zakończy aktualizacje OneDrive dla Windows 7 i 8

Oczywiście w tej chwili jest to tylko demonstracja i nie można w pełni ocenić technologii. (Na przykład, jak realistyczne są końcowe obrazy? Trudno to stwierdzić na podstawie dostępnych filmów w niskiej rozdzielczości). Ale to kolejny przykład ułatwienia manipulacji obrazami.