Nowe wyszukiwanie AI umożliwia klikanie i przeciąganie obrazów w celu manipulowania nimi w ciągu kilku sekund

Nie, to jeszcze nie koniec: możliwości narzędzi AI do przetwarzania obrazów wciąż rosną. Najnowszy przykład to na razie tylko praca naukowa, ale jest bardzo imponujący, ponieważ pozwala użytkownikom po prostu przeciągnąć elementy z obrazu, aby zmienić ich wygląd.

Na pierwszy rzut oka nie brzmi to zbyt ekscytująco, ale spójrz na poniższe przykłady, aby zorientować się, co potrafi ten system.

Nie tylko możesz zmienić wymiary samochodu lub zamienić uśmiech w zmarszczkę jednym dotknięciem i przeciągnięciem, ale możesz także obrócić fotografowany obiekt tak, jakby był modelem 3D — na przykład zmieniając kierunek, w którym patrzy osoba. Jedna demonstracja pokazuje użytkownikowi, jak za pomocą kilku kliknięć dostosować odbicia na jeziorze i wysokość pasma górskiego.

Oto przegląd różnych tematów:

Oto bliższe spojrzenie na przetwarzanie krajobrazu:

I dla zabawy, majstruj przy czerni:

Te filmy pochodzą z Strona główna zespołu badawczegochociaż może to zostać zakłócone przez ilość ruchu wysyłanego do witryny przez Twittera (Głównie przez user_akhaliq, który wykonuje świetną robotę, podkreślając interesujące dokumenty AI i jest wart kontynuacji, jeśli Cię to interesuje). Możesz także przeczytać artykuł na arXiv Tutaj.

Jak zauważył odpowiedzialny zespół, naprawdę interesującą rzeczą w tej pracy niekoniecznie jest manipulacja obrazem W sobie, ale interfejs użytkownika. Od jakiegoś czasu możemy używać narzędzi sztucznej inteligencji, takich jak sieci GAN, do tworzenia fotorealistycznych obrazów, ale większości metod brakuje elastyczności i precyzji. Możesz poprosić generator obrazów AI, aby „zrobił zdjęcie lwa prześladującego sawannę”, a on go otrzyma, ale może nie być Dokładnie Wymyśl to, czego chcesz lub potrzebujesz.

Ten model, nazwany DragGAN, oferuje oczywiste rozwiązanie tego problemu. Interfejs jest dokładnie taki sam, jak tradycyjne wypaczanie obrazu, ale zamiast rozmazywania i pikselizowania istniejących pikseli, model tworzy motyw od nowa. Jak napisali badacze:[O]Twoje podejście może prowadzić do halucynacji zamkniętej zawartości, jak zęby w paszczy lwa, i może się zdeformować po zestaleniu obiektu, jak zgięcie nogi konia.

READ Microsoft twierdzi, że w marcu zakończy aktualizacje OneDrive dla Windows 7 i 8

Oczywiście w tej chwili jest to tylko demonstracja i nie można w pełni ocenić technologii. (Na przykład, jak realistyczne są końcowe obrazy? Trudno to stwierdzić na podstawie dostępnych filmów w niskiej rozdzielczości). Ale to kolejny przykład ułatwienia manipulacji obrazami.

Vasya Lebedev

„Nieuleczalny myśliciel. Miłośnik jedzenia. Subtelnie czarujący badacz alkoholu. Zwolennik popkultury”.

Nowe wyszukiwanie AI umożliwia klikanie i przeciąganie obrazów w celu manipulowania nimi w ciągu kilku sekund

Emdoor przygotowuje się do zaprezentowania swoich osiągnięć w zakresie nowej technologii sztucznej inteligencji podczas targów Global Sources Mobile Electronics Show 2024.

LinkedIn wykorzystuje Twoje dane do szkolenia Microsoft, OpenAI i jego modeli AI – oto jak to wyłączyć

Zapomnij o Apple Watch Series 10 — Apple Watch Ultra 2 w kolorze Satin Black to smartwatch, który warto mieć

W Polsce odkryto setki artefaktów, w tym hełm celtycki z brązu

Stopy procentowe w Wielkiej Brytanii: Bank Anglii wkrótce ujawni swoją kolejną decyzję

Zdjęcia do „Pasji” rozpoczną się na początku 2025 roku

Bardziej ekologiczne wybory, bystrzejsze umysły: badania łączą zrównoważony rozwój i zdrowie mózgu

Dodaj komentarz Anuluj pisanie odpowiedzi

More Stories