Nowy sposób interakcji z Midjourney

Midjourney v7 wprowadza przełomową funkcję umożliwiającą użytkownikom tworzenie obrazów za pomocą poleceń głosowych. Dotychczasowa metoda opierała się na wpisywaniu tekstu i dołączaniu obrazów jako inspiracji. Teraz wystarczy mikrofon i dostęp do platformy alpha.midjourney.com, by wypowiadać komendy, które są przekształcane w prompt i natychmiast generują nowe obrazy.

Integracja głosu z Draft Mode

Funkcja Draft Mode przyspiesza generowanie obrazów kosztem początkowej jakości. Obrazy można potem poprawić za pomocą przycisków „enhance” lub „vary”. Włączenie trybu szkicowego umożliwia jednoczesne użycie poleceń głosowych, co wspiera bardziej płynny proces twórczy i ułatwia spontaniczne reagowanie na efekty pracy modelu.

Naturalna interakcja z modelem

Użytkownik może wydawać polecenia głosowe typu „bardziej realistyczne”, „ciemniejsze”, „żywsze”, co eliminuje konieczność ciągłego modyfikowania tekstowych promptów. Funkcja ta wspiera dynamiczną komunikację z modelem i skraca czas potrzebny na uzyskanie pożądanego rezultatu.

Personalizacja jako warunek korzystania

Aby uzyskać dostęp do nowych funkcji v7, konieczne jest wykonanie personalizacji. Proces ten polega na ocenianiu 200 par obrazów i określaniu indywidualnych preferencji stylu. To rozwiązanie było opcjonalne w v6, lecz teraz stało się obowiązkowe, umożliwiając lepsze dopasowanie wyników do preferencji użytkownika.

Nowy interfejs i funkcje aktywacyjne

Po zakończeniu personalizacji użytkownik może przejść do zakładki „Create” na stronie alpha i aktywować tryb personalizacji oraz Draft Mode. Obok nich znajduje się ikona mikrofonu, której włączenie umożliwia rozpoczęcie pracy głosowej. Interfejs sygnalizuje aktywność mikrofonu poprzez zmianę koloru i falujący wykres dźwięku.

Reakcja systemu na mowę użytkownika

Po zakończeniu wypowiedzi, model automatycznie generuje zestaw słów kluczowych oraz pełen prompt. Na ich podstawie tworzone są cztery obrazy, które można modyfikować kolejnymi komendami głosowymi. Pomimo sporadycznych błędów, np. „Realtime API disconnected”, tryb głosowy działa stabilnie po odświeżeniu strony.

Nowe tryby pracy i koszty

Midjourney v7 oferuje dwa tryby operacyjne: Turbo Mode, dwukrotnie droższy niż standard v6, oraz Draft Mode, który zużywa tylko połowę zasobów. Trwa praca nad standardowym trybem prędkości, który ma zbalansować jakość i koszt.

Przejściowe zależności od poprzednich wersji

Funkcje takie jak upscaling, inpainting i retexturing są tymczasowo obsługiwane przez model v6. Docelowo mają zostać przeniesione do v7 wraz z nowymi systemami referencji postaci i obiektów, które nie wymagają już manualnych sufiksów –cref i –sref.

Zaangażowanie społeczności i dalszy rozwój

Zespół Midjourney deklaruje aktualizacje co 1–2 tygodnie oraz wprowadzenie systemu oceniania planu rozwoju. Społeczność ma aktywnie wpływać na kierunek zmian poprzez publiczne kanały dzielenia się opinią oraz przestrzenie feedbackowe.

Różnorodne reakcje użytkowników

Choć v7 nazywane jest wersją „alpha”, wielu użytkowników oczekiwało bardziej wyraźnej poprawy jakości i zgodności z promptem. Krytyka dotyczy m.in. problematycznej anatomii postaci, błędów w generowaniu tekstu i nieobecności niektórych funkcji znanych z v6. Jednocześnie niektórzy testerzy docenili artystyczne możliwości i większą szczegółowość generowanych obrazów.

Midjourney v7 to krok w stronę bardziej interaktywnego i naturalnego tworzenia obrazów, lecz jego ocena zależy od indywidualnych oczekiwań i stylu pracy użytkownika. Z czasem i kolejnymi aktualizacjami może stać się bardziej dojrzałym narzędziem, łączącym szybkość, kontrolę i kreatywną swobodę.

Tags:ai, generowanie obrazów, midjourney, modele, openai, sztuczna inteligencja

Modele o3 i o4 przed GPT-5 od OpenAI

Vibe coding czyli programowanie językiem naturalnym dzięki AI

Nowe możliwości Midjourney v7