API: Higgsfield · Ariel Shemesh

מה זה

Higgsfield CLI הוא כלי שורת-פקודה שלפי ה-README הרשמי "מייצר תמונות, סרטונים, נכסי 3D, אודיו וניתוח של סרטון מוגמר מהטרמינל באמצעות 30+ מודלי Higgsfield AI." מאחוריו עומדת Higgsfield, חברת מדיה גנרטיבית שנוסדה ב-2023 בראשות Alex Mashrabov (לשעבר ראש דור ה-AI ב-Snap), שמתפעלת פלטפורמת יצירת תמונה ווידאו ענפה. ה-CLI הוא חזית הטרמינל של אותה פלטפורמה: הוא מורשה ב-MIT, מופץ דרך npm כחבילה @higgsfield/cli, וגרסתו האחרונה נכון לכתיבה (יוני 2026) היא v0.2.2 (16 ביוני 2026) — קצב שחרור צפוף עם ריבוי גרסאות בפרק זמן קצר.

הרעיון המרכזי אינו מודל בודד אלא האבסטרקציה: כל מודל, ללא קשר לספק שמאחוריו — Google‏ (Veo), Kuaishou‏ (Kling), ByteDance‏ (Seedance/Seedream), Black Forest Labs‏ (FLUX), xAI‏ (Grok), OpenAI ומודלי Soul ו-Cinematic Studio הפנימיים — מקבל בדיוק את אותו ממשק: higgsfield generate create <model> --prompt "…" --wait. מעבר מ-Veo 3.1 ל-Kling 3.0 הוא החלפת מחרוזת אחת. ה-CLI מטפל ב-auth, ב-polling ובהחזרת תוצאת ה-job; ממך נדרש רק לבחור slug של מודל ולנסח prompt.

איך זה עובד — ארכיטקטורה

ה-CLI הוא client דק מעל ה-API של Higgsfield. כל קריאה ל-generate create פותחת job ומחזירה מזהה; עם הדגל --wait הפקודה נחסמת עד שה-job מסתיים ומדפיסה את ה-URL של התוצאה, ובלעדיו מקבלים את ה-job מיד וניתן לאסוף אותו מאוחר יותר. את קצב ה-polling וזמן ההמתנה שולטים שני דגלים מתועדים: --wait-interval (ברירת מחדל 3s) ו---wait-timeout (ברירת מחדל 10m). זה בדיוק מה שהופך את ה-CLI למתאים ל-fan-out: driver אחד מפעיל עשרות יצירות בלי --wait, וריצה שנייה אוספת את התוצאות שהושלמו.

קלטי מדיה מטופלים בנוחות: לפי התיעוד כל קלט קובץ מקבל או מזהה UUID של העלאה/‏job קודם, או נתיב מקומי שה-CLI מעלה אוטומטית לפני הפעלת ה-job. כך אפשר לשרשר תוצאה של job אחד כקלט לבא אחריו בלי לטפל ידנית בהעלאות. מתחת לממשק המאוחד לכל ספק מאפיינים משלו — Veo ו-Kling הם וידאו בלבד, FLUX.2 ו-Nano Banana תמונה בלבד, ו-Soul נושא את ה-pipeline הפנימי לעקביות דמות — אבל גבול הספק מוסתר: כל job עובר דרך אותו auth, אותו polling ואותו חוזה --json.

התקנה והגדרה

שלושה ערוצי התקנה רשמיים: סקריפט curl, ‏Homebrew tap וחבילת npm גלובלית. האימות הוא device-login מבוסס-דפדפן — פקודה אחת פותחת לשונית, מסיימת את ההתחברות ושומרת את הטוקן. אין במסמכים הרשמיים מפתח API סטטי דרך משתנה סביבה; auth login הוא הזרימה המתועדת.

# macOS / Linux — one-line installer
curl -fsSL https://raw.githubusercontent.com/higgsfield-ai/cli/main/install.sh | sh

# Or Homebrew
brew install higgsfield-ai/tap/higgsfield

# Or npm
npm install -g @higgsfield/cli

# Browser device-login (opens a tab, drops a token)
higgsfield auth login

# The authoritative live model catalog
higgsfield model list

שתי הערות חשובות לפני שמעתיקים פקודות מהאינטרנט: הראשונה היא ש-pipe ישיר מ-curl אל sh מריץ סקריפט מרוחק ללא ביקורת — בסביבת production עדיף להוריד את install.sh, לקרוא אותו, ורק אז להריץ. השנייה היא שהפקודה לצפייה ברשימת המודלים היא model list (יחיד), והיא הרשימה הסמכותית: כל slug, ברירת מחדל ופרמטר נכון לחשבון שלך מודפסים משם, ולא מ-blog post כלשהו.

קטלוג המודלים

קובץ MODELS.md ברפו מתעד 21 מודלי תמונה ו-20 מודלי וידאו, ובנוסף מודל 3D ושני מודלי אודיו. הזיהוי הוא לפי slug, לא שם תצוגה, וזו נקודה שקל לטעות בה — שמות התצוגה מבלבלים בכוונה. למשל nano_banana_2 הוא דווקא "Nano Banana Pro", בעוד "Nano Banana 2" מתאחד מאחורי ה-slug ‏nano_banana_flash. דוגמאות מתוך הקטלוג הרשמי:

# Image (21): slug -> display name
flux_2              FLUX.2
flux_kontext        Flux Kontext
nano_banana_2       Nano Banana Pro
gpt_image_2         GPT Image 2
seedream_v4_5       Seedream 4.5
text2image_soul_v2  Higgsfield Soul V2
grok_image          Grok Image
z_image             Z Image

# Video (20): slug -> display name
veo3_1              Google Veo 3.1
kling3_0            Kling v3.0
seedance_2_0        Seedance 2.0
seedance1_5         Seedance 1.5 Pro
wan2_7              Wan 2.7
brain_activity      Virality Predictor

שימו לב ל-slug של ה-Virality Predictor: ‏brain_activity. אינטואיציה לא תנחש אותו, וזו בדיוק הסיבה ש-model list ו-MODELS.md הם מקור האמת ולא ניחוש.

יכולות מרכזיות

הדגל --prompt נדרש בכל מודל; שאר הפרמטרים נקבעים לפי המודל. לפי MODELS.md אלה כוללים aspect_ratio, ‏duration, ‏resolution, ‏quality, ‏batch_size ואופציות מתמחות כמו ז'אנר, מצב ופס-קול — כל מודל חושף תת-קבוצה משלו, ולכן כדאי לקרוא את הערך שלו ב-MODELS.md לפני שמניחים שדגל קיים. מעבר ל-generate הרגיל, שתי יכולות בולטות:

# Image: Nano Banana Pro, block until done, print result URL
higgsfield generate create nano_banana_2 \
  --prompt "a quiet beach at sunrise, soft fog, 35mm film" \
  --wait

# Video: Kling v3.0 with a longer timeout for heavy renders
higgsfield generate create kling3_0 \
  --prompt "forest clearing at dawn, slow dolly-in" \
  --wait --wait-timeout 15m

# Train a reusable character (Soul ID) from several photos
higgsfield soul-id create --name me --soul-2 \
  --image ./me1.jpg --image ./me2.jpg --image ./me3.jpg
higgsfield soul-id wait <soul_id>

# Score a video before posting (Virality Predictor)
higgsfield generate create brain_activity --prompt "..." --wait

# Programmatic: pull completed result URLs as JSON
higgsfield generate list --json \
  | jq -r '.[] | select(.status=="completed") | .result_url'

שתי היכולות שאני מוצא בלעדיות כאן ברמת ה-CLI הן Soul ID — אימון דמות עקבית מכמה תמונות שאפשר לעשות בה שימוש חוזר — וה-Virality Predictor (‏brain_activity), שנותן ציון לסרטון לפני פרסום. רוב הכלים הסגורים לא חושפים שום אחת מהשתיים כפקודת טרמינל.

אוטומציה ו-JSON

הדגל --json הופך כל פקודה למקור נתונים מובנה ל-stdout במקום פס התקדמות, ויחד עם --no-color הוא מה שהופך את ה-CLI לראוי לסקריפטים. הדפוס שמופיע ב-README הוא בדיוק זה שצריך — generate list --json מוזרם ל-jq כדי לחלץ את ה-result_url של כל job שהסתיים. סביב זה אפשר לבנות לולאת shell, יעד ב-Makefile, או step ב-CI: ה-CLI נשאר זהה, וה-JSON הוא ממשק ה-API בפועל. מי שמעדיף קוד מטיפוס, הארגון מתחזק גם SDK רשמי ל-Node/TypeScript — החבילה @higgsfield/client (רישיון MIT) — מעל אותו API.

מתי להשתמש

בשימוש יומיומי המנוף הגדול הוא רוחב ומהירות. לעבודת מיתוג ושיווק נדרשים לרוב שלושה-ארבעה מינויים נפרדים — תמונה, וידאו, עקביות דמות, אנליטיקה — ו-Higgsfield מאחד אותם תחת חשבון ו-CLI אחד. מניסיון, היתרון המעשי מורגש בעיקר כשרוצים להשוות מנועים: כשבוחנים איזה מנוע מטפל טוב יותר בתנועת מצלמה מורכבת, מעבר מ-Kling ל-Veo הוא החלפת slug אחד בסקריפט, לא ארכיטקטורה מחדש. ה-pipeline של Soul ID לבדו חוסך את ניהול ה-reference הידני שנהוג לעשות ב-Midjourney או SDXL כדי לשמר פנים לאורך קמפיין שלם.

מגבלות

הגבול ברור: ברגע שצריך שליטת inference מדויקת — samplers מותאמים, ControlNet, IP-Adapter, ערימות LoRA — ה-API המאוחד פשוט לא חושף אותם, ויורדים ל-ComfyUI או ל-SDK הנייטיב של המודל. Higgsfield מייעל לרוחב, לא לכוונון עמוק של מודל בודד. מעבר לכך, שני סייגים מעשיים: הקטלוג זז מהר (ריבוי גרסאות בפרק זמן קצר), כך ש-slug או דגל שעבד אתמול עשוי להשתנות — כדאי לקבע גרסה ולהריץ model list מחדש לפני pipeline ארוך. ושנית, אין מפתח API סטטי מתועד דרך env var, ולכן סביבת CI חסרת-דפדפן דורשת בדיקה איך לשמר את הטוקן של auth login בין ריצות.

מקורות

CLI: github.com/higgsfield-ai/cli (כולל README.md ו-MODELS.md). Node SDK: higgsfield-ai/higgsfield-js (חבילת @higgsfield/client). אתר: higgsfield.ai. רישיון: MIT · גרסה: v0.2.2 (נכון ליוני 2026).

API & MCPHiggsfieldImageVideo