
Nowy sposób interakcji z Midjourney
Midjourney v7 wprowadza przełomową funkcję umożliwiającą użytkownikom tworzenie obrazów za pomocą poleceń głosowych. Dotychczasowa metoda opierała się na wpisywaniu tekstu i dołączaniu obrazów jako inspiracji. Teraz wystarczy mikrofon i dostęp do platformy alpha.midjourney.com, by wypowiadać komendy, które są przekształcane w prompt i natychmiast generują nowe obrazy.
Integracja głosu z Draft Mode
Funkcja Draft Mode przyspiesza generowanie obrazów kosztem początkowej jakości. Obrazy można potem poprawić za pomocą przycisków „enhance” lub „vary”. Włączenie trybu szkicowego umożliwia jednoczesne użycie poleceń głosowych, co wspiera bardziej płynny proces twórczy i ułatwia spontaniczne reagowanie na efekty pracy modelu.
Naturalna interakcja z modelem
Użytkownik może wydawać polecenia głosowe typu „bardziej realistyczne”, „ciemniejsze”, „żywsze”, co eliminuje konieczność ciągłego modyfikowania tekstowych promptów. Funkcja ta wspiera dynamiczną komunikację z modelem i skraca czas potrzebny na uzyskanie pożądanego rezultatu.
Personalizacja jako warunek korzystania
Aby uzyskać dostęp do nowych funkcji v7, konieczne jest wykonanie personalizacji. Proces ten polega na ocenianiu 200 par obrazów i określaniu indywidualnych preferencji stylu. To rozwiązanie było opcjonalne w v6, lecz teraz stało się obowiązkowe, umożliwiając lepsze dopasowanie wyników do preferencji użytkownika.
Nowy interfejs i funkcje aktywacyjne
Po zakończeniu personalizacji użytkownik może przejść do zakładki „Create” na stronie alpha i aktywować tryb personalizacji oraz Draft Mode. Obok nich znajduje się ikona mikrofonu, której włączenie umożliwia rozpoczęcie pracy głosowej. Interfejs sygnalizuje aktywność mikrofonu poprzez zmianę koloru i falujący wykres dźwięku.
Reakcja systemu na mowę użytkownika
Po zakończeniu wypowiedzi, model automatycznie generuje zestaw słów kluczowych oraz pełen prompt. Na ich podstawie tworzone są cztery obrazy, które można modyfikować kolejnymi komendami głosowymi. Pomimo sporadycznych błędów, np. „Realtime API disconnected”, tryb głosowy działa stabilnie po odświeżeniu strony.
Nowe tryby pracy i koszty
Midjourney v7 oferuje dwa tryby operacyjne: Turbo Mode, dwukrotnie droższy niż standard v6, oraz Draft Mode, który zużywa tylko połowę zasobów. Trwa praca nad standardowym trybem prędkości, który ma zbalansować jakość i koszt.
Przejściowe zależności od poprzednich wersji
Funkcje takie jak upscaling, inpainting i retexturing są tymczasowo obsługiwane przez model v6. Docelowo mają zostać przeniesione do v7 wraz z nowymi systemami referencji postaci i obiektów, które nie wymagają już manualnych sufiksów –cref i –sref.
Zaangażowanie społeczności i dalszy rozwój
Zespół Midjourney deklaruje aktualizacje co 1–2 tygodnie oraz wprowadzenie systemu oceniania planu rozwoju. Społeczność ma aktywnie wpływać na kierunek zmian poprzez publiczne kanały dzielenia się opinią oraz przestrzenie feedbackowe.
Różnorodne reakcje użytkowników
Choć v7 nazywane jest wersją „alpha”, wielu użytkowników oczekiwało bardziej wyraźnej poprawy jakości i zgodności z promptem. Krytyka dotyczy m.in. problematycznej anatomii postaci, błędów w generowaniu tekstu i nieobecności niektórych funkcji znanych z v6. Jednocześnie niektórzy testerzy docenili artystyczne możliwości i większą szczegółowość generowanych obrazów.