VIT — CLOUD SUMMIT '26 INSIGHTS BRIEF

Google Cloud Summit '26 — תובנות ופעולות לאקוסיסטם

סיכום מצגות וצילומים מסשני הכנס (4.6.2026) — מיפוי לפרויקטים, פתרונות, הגנות, והרחבות. מבוסס על 115 קלאסטרים יחודיים מ-212 צילומים. אודיו (6 קבצים) ממתין לעיבוד NotebookLM.

תוכן עניינים

  1. TL;DR — 5 ההכרעות הכי חשובות
  2. סטטוס עיבוד אודיו (חוסם NotebookLM)
  3. סיכום סשנים
  4. פעולות — VitruAgent
  5. פעולות — VitClip
  6. פעולות — VitVital
  7. פעולות — VitSiteReport
  8. פעולות אופקיות (Claude Code yom-yom)
  9. עדכוני PLAN.md ספציפיים

1 · TL;DR — 5 ההכרעות הכי חשובות

🔥 #1 · Gemini 3.1 Live API — Hebrew-first VitruAgent P0

Google הציגו Gemini 3.1 Live API + Live Avatar — תומך 10 שפות, עברית ראשונה ברשימה. עבור משתמשים ישראלים זה משנה את משוואת VitruAgent: במקום OpenAI Realtime כראשי + Gemini Live כ-fallback, להפוך — Gemini Live ראשי. רץ ב-WebSocket יחיד, מטפל ב-audio + video + tool calls על אותו חיבור.

🔥 #2 · Dual-track + Orchestration Service חובה VitruAgent P0

Gong וגם GenMedia Izumi (Google) שניהם מציגים את אותה ארכיטקטורה: שני מודלים נפרדים — אחד "thinking" (batch, גדול) + אחד realtime + Orchestration Service באמצע שמנהל state, RAG context, וfallback. אסור לבנות הכל ישר על Gemini Live. ה-Orchestration היא 4 רכיבים נפרדים: Routing / Session-affinity / Admission control / Circuit breaker.

🔥 #3 · 10 הכללים לעבודה בטוחה עם Claude Code Cross-project P0

Wiz + Google חשפו 10 כללים שאתה משתמש בכוח-לא מלא מתוכם ב-Claude Code שלך יום-יום על קוד production של 5 פרויקטים. Tenzai דיווחו על 69 חולשות ב-15 אפליקציות שנכתבו ע"י coding agents — כל agent. צריך לאמץ את הכללים היום, לא לחכות ל-incident.

🔥 #4 · State Machine + Human Gates (Stateful Agents) VitruAgent VitSiteReport P1

GenMedia Izumi הציגו state machine מלא של 19 צמתים עם 4 שערי אישור אנושיים (gate 1-4). זה הדפוס שגם VitruAgent וגם VitSiteReport צריכים — לא אוטומציה רצופה אלא pipeline עם נקודות עצירה לאישור משתמש. + הבחנה קריטית: Optimization memory ≠ Orchestration control — שתי מערכות זיכרון שונות.

🔥 #5 · VitClip — נשאר על Cloud Run + Vertex VitClip P0 — סגור

סשן GKE Inference אישר חד-משמעית: Vertex AI managed כבר רץ על GKE Inference Gateway מתחת. אתה מקבל את כל ה-35% TTFT וה-2x cache hit ratio בלי DevOps overhead. ה-cold-start של GKE עצמאי (5 דק') הורג workload bursty כמו VitClip. אל תיגע. החלטה נסגרת.

2 · סטטוס עיבוד אודיו — חוסם NotebookLM

❗ פעולה ידנית שלך נדרשת לפני המשך:

NotebookLM CLI מסרב להתחבר — Authentication expired. צריך 30 שניות אינטראקטיבי בדפדפן:

nlm login

הרץ ב-PowerShell. דפדפן ייפתח, התחבר עם elyash7@gmail.com (אישי — connectors כולם אישי לפי החלטת 0019). לאחר מכן, ב-Claude code session אחר או באותו session, יש לפתוח בקשה חדשה ולומר "תמשיך מאיפה שעצרת ב-NotebookLM" — אטעין את 6 הקבצים, אשאל שאלות source-grounded, ואוסיף את התובנות לקובץ הזה.

קבצי האודיו לעיבוד (170MB):

בנוסף יש 2 קבצי וידאו (20260604_123553.mp4 40MB, 20260604_125135.mp4 96MB) — סביר שבזמן Gong demo או מעבר. גם הם ל-NotebookLM.

3 · סיכום סשנים

3.1 · Opening Keynote (09:30-10:30) ממתין לאודיו

צילומים: 100602, 102803-103108. תוכן ויזואלי דליל; הכרזות עיקריות באודיו.

3.2 · Track 1, 11:15 — Gemini Live: Demo Showcase

הכרזות מודלים חדשים

מודלתיאורהשפעה
Gemini 3.1 TTS Flashטקסט-לדיבור איכותיVitVital weekly summary בקול עברי
Gemini 3.1 Live API + Live Avatarrealtime voice/video + lip-sync avatarהחלפת OpenAI Realtime ל-VitruAgent
Deep Research API + Antigravity Managed AgentGoogle's managed agent infraאופציה עתידית במקום backend עצמי
Gemma 4 26B A4B MaaSGemma 4 כשירות מנוהלפוטנציאל ל-fine-tune עברית (לא לפני 100K calls/חודש)
Gemini 2 Embeddingembeddings חדשRAG ב-VitruAgent

ארכיטקטורת ה-Demo: Browser ⇌ Gemini Live בWebSocket יחיד

Browser React  ────WebSocket────▶  Gemini 3.1 FlashLive API
      │
      ├─ Mic capturePCM 16 kHz ────▶ realtimeInput audio
      ├─ Webcam 1 fps JPEG ───────▶ realtimeInput video
      ├─ Audio playerPCM 24 kHz ◀── voice
      ├─ Live UI orb + transcript ◀── inputTranscription, outputTranscription, tool provide_feedback
      └─ JSON summary ◀── (if tool never called)

Fallback sub-agent: gemini-3.5-flash

נקודה קריטית: "One WebSocket. All audio, video frames, transcripts, and the final provide_feedback tool call ride the same connection. No backend server in the path — the browser talks to Gemini directly."

אבל — לא מתאים ל-VitruAgent: ה-Browser-direct פטטרן מוותר על secrets management, state persistence, ו-tool calls ל-Firestore. VitruAgent חייב Orchestration Service באמצע. הדפוס הזה רק להדגמות.

🔥 ה-system prompt האמיתי של Online Interview (מודל הפעלה לעברית)

STRUCTURE — follow this order:
1. Warm welcome (~10s): greet, state the role, outline
   the next 15-20 minutes. End with "Tell me about yourself."
2. MAIN QUESTIONS (4-6 total) — tailored to role+level.
   ONE question per turn. 1-2 follow-ups when interesting.
3. REVERSE Q&A: "What questions do you have for me?"
4. WRAP-UP: thank, mention next steps, end with a warm
   closing sentence. BEFORE that, call provide_feedback
   exactly once.

HARD RULES:
- ONE question per turn. Never stack two.
- Concise: 1-3 sentences for questions, 2-4 for follow-ups.
- Warm but professional. No filler. No flattery.
- For STAR answers: push gently if they jump to the result.
- For technical: probe trade-offs.
- Silent 5-6s? Ask "would you like a moment to think?"
- Do NOT evaluate during the interview.
- Do NOT mention this is AI / Gemini / a simulation.

אלה HARD RULES פטטרן שצריך לאמץ בכל system prompt של VitruAgent. שים לב: "Silent 5-6s? Ask 'would you like a moment to think?'" — זה בדיוק barge-in handling שדנתי איתך עליו לפני.

Demo suite — 6 תרחישים

googlelive-880601596687.us-central1.run.app — הציג Online Interview, Avatar Interview, Solutions Architect (דמו ויטרו-לייק שיוצר ארכיטקטורה תוך דיבור). שווה לבחון בנפרד.

3.3 · Track 1, 12:00 — Gong: Building & Scaling AI Revenue Coaching with Gemini Live

The Dual-Track Architecture

┌─────────────────────────────────────────────────────────┐
│  Gemini Regular (heavy thinking)                        │
│    ↑ LLM Prompts                                        │
│    Builder (Manager) ─── live simulation tuning         │
│    Practice Env (Sales Rep) ─── live simulation         │
│    Session Feedback ─── live coaching                   │
│      ↑ Written Feedback                                 │
│  Gong Context RAG ────────────────────────────┐         │
└───────────────────────────────────────────────│─────────┘
                                                │
┌───────────────────────────────────────────────▼─────────┐
│  Interactive AI Dialog (= Orchestration Service)        │
│    ↓ Live Stream                                        │
│  Gemini LIVE                                            │
└─────────────────────────────────────────────────────────┘

הבחנות מבניות

תבנית System Prompt רב-תאגידית (Multi-tenant)

Your name is {{agent_name}} ({{agent_gender}}),
the background task agent for {{tenant_name}}.

Core Attributes:
- Identity: Speak fluent {{language}} and only {{language}}.
- Task focus: Ask clarifying questions when information
  is missing or ambiguous before taking action.
- Professional and concise: Provide clear updates,
  decisions, and next steps.

Task Inputs:
- Your input is task events and metadata,
  not transcribed speech.
- Review any task context and attachments before acting.
- Use tools like get_attachment_text to read attachment
  content when available.

זה template עם variables של multi-tenant — מתאים בדיוק ל-VitSiteReport schema של orgs/{orgId}/....

3.4 · Track 1, 12:10 — Beyond the prototype: Multi-agent systems

Synapse case study — 7-Stage Build Timeline

הציגו "AI workforce" שבנה startup מקצה לקצה:

  1. Ideation & Chartering — Synapse מעל Loom, FastAPI + PostgreSQL
  2. Customer Discovery — 30 ראיונות structured, 78% fatigue
  3. Governance & Compliance — DE C-Corp, 15% ESOP, PIIA, tax filings
  4. Product Specifications — Modular Monolith Doctrine
  5. Curation Engineering — Cosine similarity matching
  6. GTM Campaigns — Cyberpunk mascot Nana Banana, audio
  7. Runway Expansion — Secured funding (numbers blurred)

המסר: "Moving from a static script to a dynamic workforce that scales on demand."

Core Insight: Testing live models — Uncharted territory

"Text based evals are not enough."

זו אזהרה לכל מי שבונה voice agent: ה-LLM eval pipelines שאתה רגיל אליהם (golden answers, BLEU, etc.) לא יעבדו ל-VitruAgent. צריך human-in-the-loop evaluation + adversarial barge-in tests + latency p95 tracking. אין framework מוכן.

3.5 · Track 3, 13:30 — The GKE Inference Playbook (סוכם בזמן אמת אתמול) VitClip

סקרנו ביחד בזמן אמת. עיקרי הדברים:

3.6 · Track 4, 14:00 — Code faster, compromise sooner? Securing coding agents in Dev pipelines Cross-project

הדוברים

Hard data על המצב

נתוןמקור
69 חולשות ב-15 אפליקציות נכתבו ע"י coding agentsTenzai "Bad Vibes" report Jan 2026
57% מהארגונים פרסו עצמאית AI agentsWiz survey
80% משתמשים ב-AI IDE extensions; 71% ב-coding assistantsWiz survey
80% מהarchitectures בענן מריצים MCP servers; 5% מהם פגיעיםWiz
Mean-Time-To-Exploit: מחודשים לשעותWiz
Mean-Time-To-Remediate: גדל (פיצול לרעת ההגנה)Wiz

🔥 10 הכללים לניהול בטיחות של Coding Agents

Agent Harness (rules 1-5) — איך מריצים את Claude Code:

  1. No YOLO mode. Allowlist safe commands instead
  2. Sandbox the environment
  3. Add Security Hooks (SAST, Secrets)
  4. Treat MCP servers & Skills as supply chain dependencies
  5. Managed Settings + allowManagedHooksOnly

Code Artifacts (rules 6-10) — מה Claude Code יוצר:

  1. Keep the CI gate, branch protection, human review, MFA on manual deploys
  2. AI Native SAST/DAST in CI (Fight AI volume with AI)
  3. Don't let AI own your security + critical paths (RBAC, AUTH, Payments)
  4. Review the diff not the summary
  5. Guide & Verify generation (rules, hooks)

הארכיטקטורה המומלצת של Google ל-Claude Code

Developer laptop ──▶ Identity-Aware Proxy (IAP)
                                ▼
              Private VPC · ws-net · no public IPs
                                ▼
                  Bastion VM (ws-bastion)
                                ▼
              Cloud Workstation (my-ws · Claude Code)
                                ▼
        Google-managed services
                Vertex AI · global endpoint
                Claude Opus 4.8

במילים אחרות: אסור לרוץ Claude Code עם credentials production ישירות על dev laptop. צריך Bastion + Cloud Workstation, גם אם solo dev. גם אם זה overhead — זה ה-blast radius שאתה רוצה.

Wiz Code — supply chain defense

מציעים scan continuous של:

תקיפה לדוגמה: github-runnernpm installnx@0.30.4 (חבילה זדונית) → trufflehog process exfiltrates AWS credentials.

נקודה למחשבה: ה-MCPs שאתה משתמש בהם (firebase-mcp, notebooklm-mcp, Vitruvius MCPs) הם supply chain. אם אחד מהם נדבק — לכל המפתחות הלכאן יש גישה.

3.7 · Track 1, 15:00 — Build Stateful, long-running AI agents VitruAgent

GenMedia Izumi Architecture (Google's demo)

שמות הסוכנים: visual_artist, audio_artist, editor, critic, gemini_audio_tts, gemini_image_generation, list_gemini_voices, list_skills, load_skill, load_skill_resource, run_skill_script, download_gcs_file. כולם תחת genmedia_agent orchestrator.

4 רכיבים ארכיטקטוניים

🔥 הבחנה קריטית: Optimization memory ≠ Orchestration control

Autonomous Optimization Memory

  • arm pull-counts / rewards
  • warm-start across iterations
  • durable in GCS
  • resumes per-iteration
  • spectator sees the final report

Orchestration Control

  • איפה אני בpipeline?
  • can a human approve / reject?
  • can it resume mid-workflow?
  • validated step transitions?
  • participant steers each stage

למה זה חשוב ל-VitruAgent: יש לך שתי דרישות שונות שעלולות להתערבב. אחת — VitruAgent זוכר מה שהמשתמש אמר אתמול (Optimization memory). שתיים — VitruAgent מנהל workflow רב-שלבי שהמשתמש מאשר כל שלב (Orchestration control). אלה שתי מערכות נפרדות. אל תאחד.

Cloud Architecture: ads_codirector Agent System

Internet ──▶ Identity-Aware Proxy (IAP) ──▶ Cloud Run Service
                                                    │
                                            ┌───────┴────────┐
                                            ▼                ▼
                                    Frontend SPA      Custom REST APIs
                                                            │
                                                    Pipeline Webhooks
                                                            │
                                                            ▼
                                              Agent Runtime
                                              VertexAiSessionService
                                                    │
                              ┌─────────────────────┼───────────────────────┐
                              ▼                     ▼                       ▼
                       Cloud Firestore      Google Cloud Storage    Media Generation Models
                       (Asset Metadata)     (Asset Storage)          (us-central1):
                                                                       · Veo
                                                                       · Nano Banana
                                                                       · Lyria
                                                                     Gemini 2.5 Flash (Global)

תשובה לשאלה הפתוחה שלך: איפה Google שמים session state? VertexAiSessionService — שירות מנוהל של Vertex AI. זה ה-default שלך. אל תכתוב session manager בעצמך.

Video Ad Creation Pipeline State Machine

19 צמתים, 4 שערי אישור אנושיים:

AWAITING_BRIEF
  ▼
INGESTING_ASSETS
  ▼
INITIALIZING_MAB
  ▼
🔒 AWAITING_CREATIVE_APPROVAL (gate 1) ─── revise/present
  ▼
RUNNING_CREATIVE_BRIEF
  ▼
🔒 AWAITING_BRIEF_APPROVAL (gate 2) ─── revise/present
  ▼
RUNNING_STORYLINE_TO_STORYBOARD
  ▼
🔒 AWAITING_KEYFRAME_APPROVAL (gate 3) ─── revise/present
  ▼
RUNNING_KEYFRAMES
  ▼
🔒 AWAITING_VIDEO_APPROVAL (gate 4) ─── revise/present
  ▼
RUNNING_VIDEO_AND_AUDIO
  ▼
RUNNING_POST_PRODUCTION
  ▼
CHECKING_ITERATION (loop state) ─── advance_pipeline (iteration loop)
  ▼
RUNNING_REPORT
  ▼
PIPELINE_COMPLETE

Long-running agents — pause/resume עם webhooks

הציגו flow: START → WELCOME SENT → WAITING (waiting on documents) → EVENT (Webhook) → RESUME (Signature Signal) → IT PROVISIONED → WAITING (waiting on delivery) → RESUME → COMPLETED. דפוס: agent יכול לישון ימים בין שלבים, מתעורר מ-webhook + signature.

Why Stateless Agents Break on Real Workflows

Prompt Context Pollution

Irrelevant chatter & old tool output overloads context.

Token Cost Explosion

Replaying full histories burns token budget fast.

4 · פעולות — VitruAgent ecosystem

M2 בתוכנון. כל ההמלצות מתבססות על Gong + Stateful Agents + Gemini Live Demo.

4.1 · Architecture refresh (P0)

פעולה: עדכן את VitruAgent\PLAN.md M2 לדפוס dual-track + 2 Cloud Functions:

[Flutter Client] ──WebRTC/WebSocket──▶ [Cloud Function: mintRealtimeToken]
                                              │
                                              ▼
                                       [Gemini 3.1 Live API]  ← realtime primary
                                              │
                                              ▼
                                       [Cloud Function: orchestrate]
                                              │
                              ┌───────────────┼─────────────────┐
                              ▼               ▼                 ▼
                    [Vertex Gemini Pro]   [Firestore]   [VertexAiSessionService]
                       (thinking)          (RAG)          (session state)

4.2 · החלף ל-Gemini 3.1 Live כ-primary (P0)

הסיבה: Hebrew-first ב-10 השפות הנתמכות. OpenAI Realtime עברית סבירה אבל לא ראשונה. הכרעה: Gemini 3.1 Live ראשי, OpenAI Realtime fallback. הקטן את ההשקעה בOpenAI tokens קודם.

פעולה:

4.3 · אמץ HARD RULES בsystem prompts (P0)

מתוך Online Interview demo — להוסיף לכל prompt של VitruAgent:

4.4 · Session state via VertexAiSessionService (P1)

השאלה הפתוחה שלך אתמול ("איפה לשמור session state — Firestore? Memorystore?") נענתה: השתמש ב-VertexAiSessionService כמו GenMedia Izumi. זה service מנוהל של Vertex AI שמטפל ב-session lifetime, KV cache locality, ו-recovery. אל תכתוב משלך.

פעולה: עדכן את M2 ב-PLAN — Session state יכנס ל-VertexAiSessionService, לא ל-Firestore או Memorystore. Firestore נשאר ל-RAG ולמטה-דאטה.

4.5 · Multi-tenant Base Prompt template (P1)

גם אם VitruAgent עכשיו רץ רק על vitpmis (= משתמש אחד), כתוב את ה-system prompt מהתחלה עם variables של multi-tenant. ככה בעתיד תוסיף vitvital ו-vitsitereport בלי refactor.

Your name is ויטרו ({{tenant}}), the agent for {{user_name}}.
- Identity: Speak fluent עברית and only עברית.
- Task focus: Ask clarifying questions when information is missing.
- Professional and concise: Provide clear updates, decisions, and next steps.

Task Inputs:
- Your input is task events and metadata, not transcribed speech.
- Review any task context and attachments before acting.
- Use tools like get_project_details / list_tasks before action.

4.6 · Orchestration Service = 4 רכיבים, לא 1 (P0)

מיפוי מ-GKE Inference Gateway:

4.7 · Critic agent — self-review pattern (P1)

GenMedia Izumi הציגו specialists + critic agent שצופה ב-output ונותן feedback. עבור VitruAgent:

4.8 · State machine + human gates (P1)

זה ההבדל בין VitruAgent "אוטומציה" ל-VitruAgent "שותף ארגוני". עבור משימות כמו "צור פרויקט חדש ב-VitPMIS עם 5 tasks":

AWAITING_INTENT
   ▼
COLLECTING_DETAILS (קריאת tools, שאילות הבהרה)
   ▼
🔒 AWAITING_USER_APPROVAL (gate 1: "אישור? פרויקט: X, tasks: [...]")
   ▼
EXECUTING_CREATE
   ▼
🔒 AWAITING_FINAL_REVIEW (gate 2: "נוצר. רוצה לשנות משהו?")
   ▼
COMPLETED

שני שערים בלבד למשימה אחת = הרבה פחות חרטות של "ויטרו עשה לי משהו שלא רציתי". פעולה: הוסף VitruAgent\lib\state\workflow_machine.dart ל-M3.

5 · פעולות — VitClip VitClip

✅ סטטוס: stay-the-course

GKE Inference Playbook אישר ש-Vertex managed (איפה שאתה עכשיו) = הבחירה הנכונה. ה-stack של GKE Inference Gateway רץ מתחת ל-Vertex. אתה מקבל את ה-35% TTFT והכל בלי תחזוקה.

5.1 · אבל — בדוק Antigravity Managed Agent (P1)

Google הציגו Antigravity Managed Agent ב-Gemini Live Demo Showcase. אם זה מטפל ב-video-summary use case של VitClip — אפשר להחליף את ה-Node backend עצמי. שווה ספייק של חצי יום.

פעולה: חיפוש docs ב-cloud.google.com ספטמבר/אוקטובר 2026, החלטה במחצית 2027.

5.2 · הוסף SAST hook (P1)

Wiz הציגו את ה-Dev-to-Agent Flow עם בדיקת secrets + SAST לפני push. עבור VitClip — הקוד הולך ל-GitHub וזה ל-Cloud Build. פעולה: הוסף git-secrets + semgrep ב-pre-commit hook של VitClip.

5.3 · בדוק את MCP-לויאלי (P0)

בעקבות "80% מ-cloud environments מריצים MCP servers, 5% פגיעים" — בדוק את כל ה-MCP servers הפעילים. עבור VitClip, אין MCPs ב-backend, רק האפליקציה הזו.

6 · פעולות — VitVital VitVital

6.1 · AI Coach chat — אמץ dual-track (P0)

ה-AI Coach chat שתכננת ל-v41+ צריך להיות בנוי על Gong dual-track:

פעולה: עדכן את הפרק "AI Coach chat" ב-CLAUDE.md של VitVital עם ההפרדה.

6.2 · Hebrew TTS לסיכום שבועי (P1)

Gemini 3.1 TTS Flash תומך עברית. הסיכום השבועי של VitVital (weekly_summary_service.dart) — להפיק MP3 קצר בעברית טבעית. פעולה: הוסף option ב-weekly_summary_service.dart לכתוב גם summary_audio.mp3 ב-Storage.

6.3 · Long-running agent — daily summary generation (P2)

היום VitVital מחשב summary בריצה. עם דפוס pause/resume אפשר להפעיל async — agent מתחיל כשהמשתמש לוחץ, פותר אחרי שעה, מודיע בpush. שימושי אם הסיכום ירחיב לeval של פוטו-meals יותר ארוך.

6.4 · Vertex AI Memory Bank לקונטקסט בריאות (P2)

פיצ'ר חדש שלא הוצג ספציפית אבל מופיע ב-GenMedia stack. ייתכן שבעתיד יישב טוב לקונטקסט "מה ידוע על המשתמש" שנשמר על פני סשנים בלי לכתוב הכל ב-Firestore.

7 · פעולות — VitSiteReport VitSiteReport

7.1 · אמץ Base Prompt multi-tenant template (P1)

ה-multi-tenant template מ-Gong מתאים בדיוק ל-VitSiteReport's orgs/{orgId}/... schema. עבור AI Rephrase (כשתחזיר אותו ב-M5/M6 עם Blaze):

You are an architect supervisor assistant for {{org_name}}.
- Identity: Speak fluent עברית and only עברית.
- Task focus: Architectural review terminology.
- Professional and concise: Improve readability without
  changing semantic content. Never add facts that
  weren't in the original.

7.2 · Wiz scanning ל-PDF generation (P2)

ה-PDF של VitSiteReport כולל transcripts קוליים. אם משתמש מסיים בטעות לדיקטה sensitive personal data (שם פרטי של דייר, מספר טלפון, וכו') — הוא נכנס ל-PDF. כדאי scan לפני generation. פעולה: ב-M7+ הוסף regex-based PII scan ל-pdf_service.dart שמראה אזהרה לפני export אם זוהו טלפונים/ת.ז.

7.3 · Long-running agent — חודש שלם של ביקורי פיקוח (P2)

בעתיד — agent שעוקב אחרי פרויקט מקצה לקצה, בודק שכל הביקורים החודשיים בוצעו, מסמן כשממצא לא טופל ב-30 יום. דפוס pause/resume של Stateful Agents.

8 · פעולות אופקיות — Claude Code יום-יום Cross-project

10 הכללים של Wiz+Google בהקשר הספציפי שלך:

Agent Harness — איך Claude Code רץ

1 · No YOLO mode. Allowlist safe commands instead P0

סטטוס: חלקית — יש לך allowlist ב-settings.json. פעולה: בדוק שאין "defaultMode": "acceptEdits" או "bypassPermissions" בהגדרות. רוב הפקודות נוספות אד-הוק.

2 · Sandbox the environment P1

סטטוס: רץ על הdev machine הראשי שלך עם credentials production של Firebase. זה blast radius מקסימלי. פעולה: השקעה משמעותית, אבל שווה — מעבר ל-Cloud Workstation דרך IAP, וריצת Claude Code שם. עלות: ~$50/חודש Cloud Workstation. רווח: אם Claude Code מקבל instruction זדוני, לא נוגע ל-laptop שלך.

3 · Add Security Hooks (SAST, Secrets) P0

סטטוס: אין pre-commit hooks ברוב הפרויקטים. פעולה (1 שעה):

cd "D:\Vitruvius Ecosystem\VitVital"
npm install --save-dev husky @secretlint/secretlint-rule-preset-recommend secretlint
npx husky init
echo "npx secretlint '**/*'" > .husky/pre-commit

חזור על זה ל-VitClip, VitruAgent, VitSiteReport. למניעת push של מפתח OpenAI/Firebase Service Account ב-git history.

4 · Treat MCP servers & Skills as supply chain dependencies P0

סטטוס: משתמש ב-firebase-mcp, notebooklm-mcp, ו-MCPs כלליים. הם רצים עם capability רחב (קריאת/כתיבת קבצים, רשת).

פעולה:

5 · Managed Settings + allowManagedHooksOnly P1

פעולה: עבור על C:\Users\elyas\.claude\settings.json ובדוק שאין hook שמריץ קוד שאתה לא יודע מאיפה. אם יש skill חיצוני שמוסיף hooks אוטומטית — בדוק.

Code Artifacts — מה Claude Code יוצר

6 · CI gate, branch protection, human review, MFA on manual deploys P0

סטטוס: שונה בכל פרויקט. אין git לחלק (VitruAgent עצמו!). פעולה:

7 · AI Native SAST/DAST in CI (Fight AI volume with AI) P1

פעולה: ספייק של semgrep-app (חינמי לפרויקטים private עד 10) על VitVital + VitSiteReport. semgrep --config=auto תופס OWASP Top 10 רוב הזמן. אם מוצא חולשה בקוד שClaude כתב — Claude יתקן אותה ב-15 דקות.

8 · Don't let AI own your security + critical paths P0

סטטוס: בסיכון — Claude Code כתב את functions/setOrgClaim של VitSiteReport, את ה-Firebase rules, את ה-SHARED_SECRET handling של VitClip. פעולה: רשימה של "Claude לא נוגע בלי human review":

איך מאכפים: בקוד הוסף comment // SECURITY-CRITICAL: human review required for changes. ב-PR review שלך — בדוק אם Claude נגע באחד מאלו ופסל.

9 · Review the diff not the summary P2 (כבר עושה)

סטטוס: אתה עושה את זה לרוב. תזכורת: ל-PRs שעוברים את ה-100 שורות — אל תסתפק ב"Claude אמר שזה תוקן הבאג". פתח את ה-diff.

10 · Guide & Verify generation (rules, hooks) P1

פעולה: ב-CLAUDE.md של כל פרויקט הוסף "anti-patterns שזיהינו" (יש לך כבר חלקית). הוסף "DO NOT" שורות שClaude יראה כשהוא קורא קונטקסט. דוגמה ל-VitSiteReport:

## CRITICAL — DO NOT
- Never modify firestore.rules without showing the
  full diff and explaining the security implications
- Never log Firebase credentials, tokens, or analytics
  PII to console
- Never use `--no-verify` on git commit

9 · עדכוני PLAN.md ספציפיים

9.1 · VitruAgent\PLAN.md — M2 הרחבה

M2 — מתעדכן בעקבות Cloud Summit 2026-06-04:

ארכיטקטורה:
- 2 Cloud Functions, לא 1:
  * mintRealtimeToken (כפי שתוכנן)
  * orchestrate (חדש — RAG context loader, session router,
    circuit breaker, fallback handler)

Realtime provider:
- ראשי: Gemini 3.1 Live API (Hebrew-first, native)
- Fallback: OpenAI Realtime mini (יישאר ל-failover)
- Secrets: שניהם ב-Secret Manager (vitpmis project)

Session state:
- VertexAiSessionService (managed) במקום כתיבה עצמית
- sessionId יציב לאורך כל השיחה (KV cache locality)
- Firestore נשאר ל-RAG ולמטה-דאטה

System prompt:
- אמץ HARD RULES מ-Online Interview demo:
  * ONE question per turn
  * Concise: 1-3 sentences questions, 2-4 follow-ups
  * Warm but professional. No filler. No flattery
  * Silent 5-6s? Ask "would you like a moment to think?"
  * Do NOT mention this is AI / Gemini
- Multi-tenant template structure (variables: tenant,
  user_name, language) — even though single-tenant now

9 tools של agent_tools.dart:
- חצי דרך orchestrate, לא ישירות מ-Realtime
- כלי כתיבה (create_project, add_task) דרך orchestrate
  עם state machine + human gate

Orchestration Service = 4 רכיבים נפרדים:
- Load-aware routing (provider switching)
- Content-aware routing (session affinity)
- Admission control (rate limit + max duration)
- Circuit breaker (p95 > 800ms → switch)

Critic agent pattern (M3):
- self-review על תשובות decision/action/recommendation
- לא על smalltalk

State machine + human gates:
- אל תאחד Optimization memory עם Orchestration control
- Workflow rb-שלבי = gates + advance/revise
- חדש: VitruAgent\lib\state\workflow_machine.dart

Long-running with pause/resume:
- webhook + signature signal (M4+)

9.2 · VitVital\CLAUDE.md — חלק AI Coach

### VitVital — AI Coach chat (תכנון, סשן 0044+)

Architecture (מבוסס Gong dual-track + GenMedia Izumi):
- Gemini 2.5 Pro: analysis layer (30 days data → insights)
- Gemini 3.1 Live: dialog layer בלבד
- RAG: Firestore queries ב-orchestrate, לא per-turn
- TTS: Gemini 3.1 TTS Flash לאודיו עברי טבעי

Hebrew priority:
- All system prompts בעברית עכשווית
- חוק "סיימת" → "סיימת" (לא "גמרת") — ראה Global Rules

Cost guards (קריטי, ראה lecture v32):
- gemini_usage_service tracking לכל קריאה
- Cache hit על אותו prompt+context (כמו gemini_image_cache)
- max session = 10 דקות / 100 turns

9.3 · VitSiteReport\PLAN.md — M5 הרחבה (AI Rephrase)

### M5 — AI Rephrase (Blaze)

Template (מבוסס Gong multi-tenant):
You are an architect supervisor assistant for {{org_name}}.
- Identity: Speak fluent עברית and only עברית.
- Task focus: Architectural review terminology.
- Professional and concise: Improve readability without
  changing semantic content. Never add facts that
  weren't in the original.
- DO NOT mention this is AI / Claude / Gemini.

Disclaimer trigger (Plan §3.7 שכבה 3):
- first_ai_rephrase modal — חובה לפני שימוש ראשון
- Acknowledged in users.disclaimersAcknowledged.first_ai_rephrase

Security (M5-M6):
- PII scan ב-pdf_service.dart לפני export
- regex: ת.ז 9 ספרות + טלפונים ישראלים
- אזהרה למשתמש אם זוהה — לא חוסם, רק מסמן

9.4 · VitClip\CLAUDE.md — Confirmation

### VitClip — חיזוק החלטה (סשן Cloud Summit 0044)

GKE Inference Playbook session (Cloud Summit 26):
- Vertex AI managed = GKE Inference Gateway underneath
- VitClip Cloud Run + Vertex gemini-2.5-flash = OPTIMAL stack
- אסור לעבור ל-GKE עצמאי לפני 100K calls/חודש
- Cold start על GKE = 5 דק' = הורג bursty workload

Watch list:
- Antigravity Managed Agent (Gemini Live Demo 11:15)
  → potential backend replacement Q2-Q3 2027

9.5 · CLAUDE.md global — הוסף "Coding Agent Security Hygiene"

## Coding Agent Security Hygiene (Cloud Summit 0044)

### Daily — Claude Code workflow
1. No YOLO mode — allowlist ב-settings.json בלבד
2. Sandbox: dev machine = production-credentials environment.
   Treat with care. Cloud Workstation TODO (Q3 2026).
3. Pre-commit hooks: secretlint + semgrep (התקנה: 1 שעה)
4. MCP servers = supply chain. Allow-list per-tool.
5. Managed settings — אין hooks אד-הוק

### Per-PR — code review
6. CI gate חובה. אין push ל-main.
7. semgrep --config=auto לפני merge
8. SECURITY-CRITICAL files (rules, auth, RBAC, OAuth):
   Claude can edit, אבל אני קורא diff מילה במילה
9. Review the diff. אל תאמין לסיכום.
10. CLAUDE.md הוא ה-guardrails — keep DO NOT updated

📋 צ'קליסט ליישום (סדר עבודה מומלץ)

  1. היום (30 דק'): nlm login → אעלה את האודיו ל-NotebookLM ואוסיף לקובץ הזה את התובנות שחבויות באודיו (במיוחד Gong production numbers)
  2. השבוע (2 שעות): 10 כללי Wiz — התקן secretlint, אמת settings.json, סקרן MCP allow-list
  3. הסשן הבא של VitruAgent (M2): עדכן PLAN.md לפי 9.1 לעיל. החלף ל-Gemini 3.1 Live כראשי. כתוב orchestrate Cloud Function עם 4 רכיבים.
  4. הסשן הבא של VitVital (v41 AI Coach): אמץ dual-track ב-spec לפני קוד.
  5. הסשן הבא של VitSiteReport (M5): Multi-tenant template + PII scan ב-PDF.
  6. Q3 2026: בחן Cloud Workstation + IAP setup ל-Claude Code (Sandbox)
  7. Q4 2026 / Q1 2027: Antigravity Managed Agent דוקס + ספייק ל-VitClip