2025年3月5日に開催されたMidjourneyの最新オフィスアワーでは、同社の今後の展望や新機能に関する重要な発表が行われました。
本記事では、その主要なポイントをまとめて解説します。
バージョン7(V7)のリリース予定
Midjourneyは現在、次期バージョンであるV7の内部テストを進めており、ガイドやモデレーター向けのテストも開始しています。順調に進めば、2週間以内に一般公開される見込みです。
ただし、内部統合の未検証部分やコードのリファクタリングにより、遅延の可能性もあります。V7はアルファ版としてリリースされ、予告なしに更新や変更が行われる可能性があります。
パフォーマンスと最適化
V7は従来のバージョンよりも2倍の速度向上が期待されています。リリース後には、速度と品質のバランスを調整できるスライダーやコントロールの導入が検討されています。
さらに、モデルの再トレーニングや新しいデータセットの統合による品質向上も計画されています。
アップスケーラーの改善
より高速で高解像度のアップスケーラーの開発が進行中で、4倍のアップスケーラーの再導入も目指しています。ただし、動作が大きく異なる可能性があり、具体的な結果はまだ不明です。
オムニリファレンスとパーソナライゼーションコード
オムニリファレンス機能は、最終的なディスティレーションフェーズで統合され、V6よりも大幅な改善が期待されています。
既存のパーソナライゼーションコードとの互換性を維持するかどうかについては議論が続いており、現時点では後方互換性を維持する方針ですが、絶対的な保証はできません。
ビデオ機能の開発
Midjourneyは、1~2週間以内に大規模なビデオトレーニングを開始する予定です。初期のモデルリリースでは、コストと品質のバランス最適化に焦点を当て、その後のバージョン2では大幅な改善が計画されています。
テキストからビデオ、イメージからビデオ、バリエーションからビデオの3つのワークフローが検討されており、それぞれに独自の課題と可能性があります。
ビデオモデルは、現在の画像モデルと同等の速度を目指しており、コスト削減も積極的に進められています。今後6ヶ月間で、ビデオの品質とコスト削減において大幅な改善が期待されています。
クラウドインフラとサーバーの再構築
Midjourneyは、サービス性能向上のため、大規模なクラウド再構築を進めています。今後6ヶ月間でのサーバー移行により、プラットフォームの速度向上やコスト削減が期待されています。
これらのインフラ変更は、物流的に複雑でリソース集約的な作業となります。
エディターとバッチモードの改善
エディターの強化、大規模なバッチモードやワークフローの改善が進行中です。
コミュニティの参加とフィードバック
Midjourneyは、コミュニティとの透明性を重視しています。V7リリース後には、美的評価や機能評価のための評価イベントが計画されており、特にビデオモデルに関しては大規模な評価イベントが予定されています。
チームはコミュニティからのフィードバックを重視し、ユーザーに内部プロセスや機能の進捗状況を共有することを目指しています。
これらの発表は、Midjourneyが今後もユーザーエクスペリエンスの向上と新機能の開発に注力していることを示しています。
コメント