Tạo nhân vật đồng nhất bằng AI (consistent character)

Việc tạo ra một nhân vật đồng nhất (consistent character) — tức là giữ nguyên khuôn mặt, trang phục và phong cách qua nhiều hình ảnh khác nhau — là một trong những thử thách lớn nhất của AI tạo sinh (Generative AI), bao gồm cả Gemini.

Vì Gemini tạo ra hình ảnh mới từ “nhiễu” (noise) mỗi lần bạn ra lệnh, nên không có nút bấm “giữ nguyên nhân vật”. Tuy nhiên, bạn có thể sử dụng các kỹ thuật “Prompt Engineering” (kỹ thuật viết câu lệnh) để đạt độ chính xác lên đến 80-90%.

Dưới đây là hướng dẫn từng bước để làm chủ kỹ năng này trên Gemini:


Bước 1: Tạo “Hồ sơ DNA” cho nhân vật (Character Base)

Sai lầm phổ biến là mô tả nhân vật quá chung chung (ví dụ: “một cô gái xinh đẹp”). Để AI nhớ nhân vật, bạn cần một đoạn mô tả cực kỳ chi tiết và cố định.

Hãy xác định các yếu tố sau và không bao giờ thay đổi chúng trong các câu lệnh tiếp theo:

  1. Đặc điểm khuôn mặt: Màu mắt, kiểu tóc, màu tóc, hình dáng khuôn mặt, đặc điểm riêng (tàn nhang, nốt ruồi, kính).
  2. Trang phục cố định: Cụ thể về màu sắc, loại quần áo, phụ kiện.
  3. Phong cách nghệ thuật (Art Style): Photorealistic (ảnh thật), Anime, 3D Pixar, Oil painting (sơn dầu)…

Ví dụ đoạn “DNA” cố định:

“Một người đàn ông trẻ tên Kien, 25 tuổi, tóc đen vuốt ngược, mắt nâu, có vết sẹo nhỏ trên lông mày trái. Mặc áo khoác da màu nâu sẫm bên ngoài áo thun trắng, đeo dây chuyền bạc. Phong cách điện ảnh chân thực, ánh sáng studio, độ phân giải 8k.”


Bước 2: Áp dụng công thức “Bánh kẹp” (The Sandwich Method)

Khi bạn muốn nhân vật làm các hành động khác nhau, hãy sử dụng cấu trúc câu lệnh (prompt) theo công thức này:

$$\text{[Phong cách]} + \text{[Mô tả DNA nhân vật]} + \text{[Hành động/Bối cảnh]} + \text{[Thông số kỹ thuật]}$$

  • Giữ nguyên phần đầu: Luôn bắt đầu bằng mô tả DNA y hệt nhau.
  • Chỉ thay đổi phần giữa: Thay đổi hành động hoặc địa điểm.

Ví dụ thực tế:

  • Lần 1 (Chân dung):“Tạo ảnh [DNA Nhân vật Kien] đang đứng nhìn thẳng vào ống kính, vẻ mặt nghiêm nghị.”
  • Lần 2 (Uống cà phê):“Tạo ảnh [DNA Nhân vật Kien] đang ngồi trong quán cà phê, cầm một tách latte nóng, ánh nắng chiếu qua cửa sổ.”
  • Lần 3 (Chạy bộ):“Tạo ảnh [DNA Nhân vật Kien] đang chạy bộ trong công viên, mồ hôi trên trán, hành động năng động.”

Bước 3: Tận dụng khả năng “Hiểu ảnh” (Multimodal) của Gemini

Đây là thế mạnh của Gemini so với một số AI khác. Nếu Gemini tạo ra một hình ảnh nhân vật mà bạn cực kỳ ưng ý (gọi là Ảnh Gốc), hãy làm như sau:

  1. Tải ảnh đó về máy.
  2. Upload (Tải lên) ảnh đó lại vào khung chat của Gemini.
  3. Ra lệnh dựa trên ảnh:“Dựa trên thiết kế nhân vật trong bức ảnh này, hãy tạo một hình ảnh mới vẫn là nhân vật đó nhưng đang [làm hành động khác]. Giữ nguyên các đặc điểm khuôn mặt và trang phục.”

Lưu ý: Gemini có thể từ chối tạo ảnh người thật nếu vi phạm chính sách an toàn, nhưng với nhân vật hư cấu/hoạt hình/3D thì thường hoạt động tốt.


Bước 4: Mẹo nâng cao để tăng độ đồng nhất

  • Đặt tên riêng (Unique Name): Đôi khi việc gán một cái tên hiếm gặp giúp AI “gom” các đặc điểm lại tốt hơn. Ví dụ: “Nhân vật chiến binh tên là Zyloth…”.
  • Cụ thể hóa màu sắc: Đừng nói “quần áo xanh”, hãy nói “áo len màu xanh navy (#000080)”. Sự cụ thể giúp giảm biến số ngẫu nhiên.
  • Seed (Hạt giống): Hiện tại Gemini bản web chưa cho phép nhập mã Seed thủ công (như Midjourney hay Stable Diffusion), nên việc dùng kỹ thuật lặp lại từ ngữ (Bước 2) là quan trọng nhất.

Ví dụ quy trình mẫu (Bạn có thể sao chép thử ngay)

Hãy thử copy quy trình này vào Gemini:

Bước 1: Tạo nhân vật gốc

“Tạo hình ảnh phong cách 3D hoạt hình Pixar. Một cô bé tên Mía, 6 tuổi, có mái tóc xoăn màu cam xù xì, đeo kính gọng tròn to màu xanh lá cây. Mặc bộ yếm jean màu xanh dương và áo thun kẻ sọc vàng. Khuôn mặt bầu bĩnh, dễ thương.”

(Sau khi Gemini tạo ảnh xong, nếu bạn thích thiết kế đó, hãy dùng đúng đoạn văn trên cho bước 2)

Bước 2: Thay đổi hành động (Copy lại đoạn trên và thêm hành động)

“Tạo hình ảnh phong cách 3D hoạt hình Pixar. Một cô bé tên Mía, 6 tuổi, có mái tóc xoăn màu cam xù xì, đeo kính gọng tròn to màu xanh lá cây. Mặc bộ yếm jean màu xanh dương và áo thun kẻ sọc vàng. Cô bé đang cầm một cây kem ốc quế khổng lồ và cười toe toét. Bối cảnh công viên giải trí.


Tóm tắt

Để giữ nhân vật đồng nhất trên Gemini:

  1. Viết một đoạn mô tả chi tiết (DNA).
  2. Lưu đoạn mô tả đó vào file nháp.
  3. Copy-paste lại 100% đoạn mô tả đó cho mỗi lần tạo ảnh mới.
  4. Chỉ thay đổi phần cuối câu lệnh mô tả hành động.

Leave a Reply

Your email address will not be published. Required fields are marked *