對於需要用最精簡成本製作影片的人而言,Sora 2 就像一隊「隨傳隨到、肯聽指令」的攝製隊,只要落好文字指令,便可以調度鏡頭、燈光、演員同埋情緒。它的強項不在於一次過生成長片,而是把短秒數的可控片段逐段拍好,再拼成你腦海的分鏡。入門的正路是:先掌握一套讓 AI 能穩陣執行的語言——清楚交代「主體是誰、喺邊度、做乜、點樣拍、氛圍與光線」——之後再逐步加上風格設定、動作節拍同對白。把 AI 當成一隊會按章辦事的 crew,你落 order 愈清楚,出片成果就愈穩陣。
*建議使用日本、美國等地應用程式商店下載
iOS App 下載:https://apps.apple.com/app/sora-by-openai/id6744034028

▲Sora 2 的用法跟現時大部份 AI 軟件一樣,只需輸入你的提示詞,AI 即可根據提示詞來製作影片。愈複雜的提示詞,成品愈接近你的理想。而如何構建合格、具體的提示詞,就是本文你將會學習到的東西
課堂 1:把畫面「說清楚」:由白描走到可執行的場景
AI 不會幫你「腦補」,如果主詞、地點、時間同情緒講得含糊,系統就未必捉到你的意圖。先用文字把畫面輪廓講清楚,等模型有個準確落腳點。
建議大家習慣把想像到的情景,「拆件」成可拍攝元素,例如主體、背景、時段、天氣,令生成更準確、不易偏離你想像的影片。
可直接貼用的提示詞(將以下整段複製/貼上到 Sora 2)
- 「一片向日葵花田,金黃色的花在微風中輕輕搖擺;藍天白雲,陽光在花瓣上閃著亮光。」

- 「一隻橘色的貓咪坐在窗台上,看著外面下雨。」

課堂 2:由「似」到「更似」:補足細節與情境
主體特徵、環境描述同光線設定,會直接決定畫面的質感同辨識度,文字描述愈多愈好、愈直接愈好。你的重點要放在能牽動畫面質感的關鍵詞。一旦覺得出片離預期,你會知道應該補「人、景、光」哪一個維度,改動更精準。
提示詞(將以下整段複製/貼上到 Sora 2)
- 「一間咖啡館的角落,溫暖的黃光從落地窗灑下,木質桌面泛著深棕色;窗外是藍灰色的傍晚光線。主要色調:暖黃、深木、藍灰。」

- 「一隻毛茸茸的橘色貓咪坐在木製窗台上,好奇地看著玻璃窗外的雨滴;窗外的街道濕漉漉,屋內是暖黃色光線。」

課堂 3:學會「落命令」:動作一次只做一個,可以連續
AI 模型最擅長係執行單一清晰動作;如果一次過塞太多要求,指令會互相打架,易出現走樣。大家要懂得把動作拆成「四秒一段」的節拍,並以「第一步/第二步」去控時,令每段鏡頭可測可控制。長需求可以切成可管理的分鏡,逐段生成再剪接,成功率會明顯上升。
提示詞(將以下整段複製/貼上到 Sora 2)
範例 1:
- 「一個穿著黃色雨衣的小女孩,在下雨的巷子裡跳水灘。她笑得很開心,水花飛濺;背景是霓虹燈與商店招牌。」

範例 2:
- 「一個人拿起咖啡杯,靠近嘴邊,慢慢喝一口,然後放下杯子,露出滿足的微笑。」

範例 3:
- 「一個女孩走到窗邊,停下來,然後在第 4 秒時拉開窗簾。」

範例 4:
- 「第一個鏡頭(0–2 秒):咖啡杯冒熱氣,蒸氣緩慢上升。第二個鏡頭(2–4 秒):鏡頭拉近,看到杯邊凝結的水珠。」

課堂 4:用鏡頭說話:角度與構圖即是敘事觀點
鏡頭拍攝是很多人忽略的元素,其實拍攝角度本身承載情緒與態度,或親密、或威壓、或孤寂;選取何種角度,等同界定敘事者與被攝主體的關係。掌握角度,可迅速交代觀眾所處位置與視線高度,使場面調度更具目的性。當角度設定明確,轉場與切鏡便更合乎邏輯,畫面不再流於如監察器般的平鋪直敘。
提示詞(將以下整段複製/貼上到 Sora 2)
「【由上往下拍】一個女孩坐在公園的長椅上畫畫,周圍有落葉與陽光灑下的影子。」
「【中景/側拍】在室內咖啡館靠窗座位,一位年輕男子專注看書,背景行人流動成光斑。」

課堂 5:光與色:先定情緒,再定風格
光型與色調是情緒的第一語言,能直接改變觀感取向,例如溫暖、冷靜或戲劇張力。把抽象的氛圍落實為可執行的光線描述(方向、強弱、色溫),可令生成條件更清晰;在同一場景切換色溫與對比,更可迅速完成多版本測試,衡量最合適的表現。
提示詞(將以下整段複製/貼上到Sora 2)
範例 1:
「明亮柔和的日光,從窗邊斜射進來。」

範例 2:
「只有一盞檯燈照亮桌面。」

範例 3:
「傍晚金色的夕陽。」

範例 4:
「藍色調的月光。」

範例 5:
「霓虹燈閃爍的五彩光線。」

課堂 6:風格預設:用一句話鎖定質感(電影/紀錄片/商業)
風格可視為調色、鏡頭語言與材質質感的組合;只要你給予一句準確的風格敘述,便可大幅加強影片輸出的準確度。熟悉「底片(菲林)感、顆粒、畫幅」等關鍵詞,可把質感固定在你的控制範圍內。
提示詞(將以下整段複製/貼上到Sora 2)
示範 1:
「35mm 膠片,變形寬螢幕 2.35:1;淺景深;自然光從窗戶斜射進來;暖色調色,輕微顆粒感。」

示範 2:
「手持 16mm,自然光,無修飾的真實感,輕微膠片顆粒,色調偏冷。」

示範 3:
「高對比度、完美漫射光、深色背景、產品高亮、柔和背景模糊、金色邊緣補光。」

課堂 7:上載圖片或第三方生成圖片,再令其運動
採用同一張靜態圖片作為影片的主軸,可把角色面貌、服裝與場景元素一併鎖定,從源頭確保造型穩定。用家可上載圖片到 Sora 2 要它以此圖片為軸心製作影片。留意目前不可上載人物圖片。
提示詞(將以下整段複製/貼上到Sora 2)
範例 1:
「在 DALL-E 中生成:一個穿著紅色外套的小女孩站在秋天的公園裡,背景是金黃色的樹。」

範例 2:
「小女孩跑向前方的一堆落葉,開心地跳進去,落葉飛散到空中。」

範例 3:
「冰箱門慢慢打開,一隻可愛胖胖的紫色小怪物從裡面探出頭來。」
要更實在地實現這個提示詞,我們先上載一張圖片給 Sora 2,然後再加入提示詞:

▲在輸入提示詞的同時,上載你自己的圖片

▲可令影片出來的效果跟足你的指示
範例 4:
「她轉過身來,對著鏡頭微笑,然後慢慢走出畫面。」

課堂 8:讓角色說話:提示詞要將畫面、台詞與聲場分離
接下來你可為影片中的角色加入對白。在此之前你可想定場景,交代光線、材質與氛圍,繼而獨立列出對白內容;如需音效,則以獨立提示界定音場層次。
提示詞(將以下整段複製/貼上到 Sora 2)
示範 1:
場景段落:「一間昏暗的酒館中,只有一道溫暖檯燈照亮桌子;木頭與金屬質感的裝飾,空氣中有霧霭。」
對白段落:
「傭兵:『等等,我剛回來了。』
旅人:『也許我只是累了。』
傭兵:『今晚結束後請你喝個啤酒。』」
音效提示:
「背景音效:咖啡機的嗡嗡聲、顧客的低語交談、杯盤碰撞的清脆聲。」
或「背景音效:遠處的交通聲,風吹過樹葉的沙沙聲。」
以下是只加入場景段落的效果:

以下是同時加入場景與對白的結果,留意 Sora 2 預設使用普通話輸出中文,暫時廣東話發音未必很純正,請留意使用:

示範 2:
「秋天的公園,陽光透過金黃樹葉灑下;一個小男孩穿著藍色外套向鏡頭揮手。周圍落葉飄落,空氣中有寧靜的氣息。攝影:中景,側面稍高角度;情緒:專注、好奇、童真。動作:男孩伸出手掌,不斷向鏡頭揮手。」
對白段落:
「男孩(輕聲):你好嗎?」

課堂 9:逐步微調--如有出錯先令一切回歸正常,再逐樣加
當生成結果已達八成準確,宜以單一變量作出微調,以維持其餘已正確的構圖與動作。建議使用「只改某項,其餘維持不變」之句式,逐一測試顏色、元素、角度、光線或焦距,既節省算力與時間,亦能快速迭代至你最終需要的影片。若微調未果,應先行簡化鏡頭運動與動作數量,改以純色或簡化背景,令影片都能掌握在你的提示詞下不會亂來,再逐步加回細節。
提示詞(將以下整段複製/貼上到 Sora 2)
原始提示詞:「一隻紫色的小怪物從冰箱裡走出來。」
這是我們最初的提示詞,只有一句:

接著,你可按「編輯視訊」按鈕,從已有的基礎上再加入附加的提示詞:
改顏色:「把怪物改成橘色。」
加元素:「緊接著第二隻怪物也跑出來。」
改燈光:「保持所有內容,但把光線從溫暖改成冷色調。」

▲我們加入新內容後,原本怪物的顏色變成了橘色,之後有另一隻怪獸跑出來
如果我們不滿意結果,可以再加入以下提示詞:
失敗時簡化:
改焦距:「同樣的鏡頭,改用 85mm 鏡頭(產生更多背景模糊、主體更突出)。」
改角度:「保持一樣的場景和動作,但把mk鏡頭改成從上往下拍。」
「保持鏡頭固定不動(不要移動或旋轉)。」
「只保留一個主要動作,刪除其他次要動作。」
「把背景改成純色或簡單環境。」

▲左圖是指令 Sora 鏡頭從上往下拍的效果;而右圖則建議 Sora 改用 85mm 鏡頭,可令整體效果更加簡潔
課堂 10:實戰骨架:先以「可執行格式」立框,再填敘事內容
以標準化模板固定欄位(風格、場景、人物、動作、氣氛),即可把需求轉化為可直接執行之生成指令,實現穩定複製。此等骨架有利跨團隊協作與版本管理,亦方便於審稿與比對時精準指出需調整之欄位。先立框架,再填敘事,能確保每次輸出均沿同一規格演進。
示範 1:日常生活場景
- 「【風格】真實自然的生活風格」
- 「【場景】地點+時間+天氣/光線」
- 「【人物】年齡/外貌/穿著」
- 「【動作】動作 1 → 動作 2 → 動作 3」
- 「【氣氛】溫暖/輕鬆/愉快等」
提示詞(將以下整段複製/貼上到Sora 2) - 「【場景】一間小廚房,早晨的陽光從窗戶照進來。【人物】一位 30 多歲的媽媽,穿著居家服。【動作】她打開冰箱,拿出牛奶,倒進杯子裡。【氣氛】平靜、溫馨的早晨時光。」

示範 2:商品展示
- 「【風格】簡潔專業的商業影片」
- 「【主體】商品名稱和外觀特色」
- 「【背景】簡單乾淨的背景」
- 「【動作】商品如何呈現或使用」
- 「【重點】要突出的賣點」
提示詞(將以下整段複製/貼上到Sora 2) - 「【風格】簡潔專業的商業影片;【主體】一個銀色的人像擺設,邊緣散出柔和的光;【背景】純白色背景,沒有其他體物;【動作】手機緩慢旋轉 360 度,展示各個角度;【重點】突出邊緣的清晰度和機身的光澤質感。」

示範 3:故事場景
- 「【風格】想要的影片風格(電影感/卡通/復古等)」
- 「【時間地點】何時何地」
- 「【主角】角色描述」
- 「【情節】發生了什麼事?(開始 → 發展 → 結束)」
- 「【情緒】這一幕要傳達什麼感覺」
提示詞(將以下整段複製/貼上到Sora 2) - 「【風格】溫暖的童話故事風格;【時間地點】秋天的公園,傍晚時分;【主角】一個 7 歲的小女孩,綁著雙馬尾,穿紅色外套;【情節】她跑向一堆落葉,開心地跳進去,落葉飛散到空中;她拾起顏色鮮豔的楓葉,笑得很燦爛;【情緒】童真、快樂、無憂無慮。」

示範 4:
「風格:溫暖的生活感;
場景:小型咖啡館靠窗位置,木質裝潢,暖黃色逆光;
人物:20 多歲女子,米色毛衣,坐在窗邊;
動作:她拿著咖啡杯,看看窗外,臉上帶著放鬆的微笑;
氣氛:溫暖、平靜、舒適的午後時光。」

課堂 11:進階範例:以導演思維下達複合指令
當鏡頭語言、光線設計、動作節拍、對白與音效能夠在同一指令中協同,便可直接輸出具備分鏡層次的樣片。此模式既可用於前期提案與視覺預覽,亦便於拆段生成後在剪接軟件合成;有助商務匯報、導演溝通與後期排程統籌,整體製作流程更為順暢。
範例 A|溫馨手繪動畫風格(將以下整段複製/貼上到Sora 2)
「架子上滿是齒輪、螺栓與滲黃設計圖;中央木頭長凳上,坐著一個圓滾滾的小機器人,身上有凹痕、補了不同顏色的補丁;它的大藍眼睛散出淡藍色光,正專注地握著一顆嗡嗡作響的燈泡;空氣中瀰漫著發動機機械運轉聲,窗外的雨打著玻璃,牆上的時鐘滴答作響。」
攝影:
「鏡頭:中特寫,緩慢推進(吊掛的小工具隨著鏡頭移動產生視差)。鏡頭類型:35mm。景深:淺(主角清晰,背景稍柔和模糊)。」
燈光/情緒:
「燈光:頭頂吊燈提供溫暖光,窗邊透入冷色調自然光做對比。情緒:溫柔、充滿童趣、帶一絲緊張。」
動作節拍(4 秒):
「1s 機器人輕輕敲打燈泡,嗶一聲作響 → 2s 它歪頭看了一下,燈泡抖動,眼睛睜大 → 2–3s 燈泡以慢動作翻滾下墜 → 3–4s 它及時接住!一股蒸氣從胸口冒出。」
對白:
「機器人(輕聲自語):『差點掉了……但我接住了!』」
音效(文字提示):
「背景音效:雨聲、時鐘滴答、柔和的機械嗡鳴、燈泡微弱的啪嗒聲。」

範例 B|復古浪漫電影風格(將以下整段複製/貼上到Sora 2)
「1970 年代浪漫劇調;35mm 膠片拍攝,天然鏡頭光暈、柔焦與暖光;輕微手持與輕搖,營造親密感;Kodak 風格調色;燈泡光暈柔和;膠片顆粒與邊緣暈影增添年代感。」
場景:
「黃昏時分,老舊公寓的屋頂被佈置成小舞台;晾衣繩上掛著白床單在風中搖曳,捕捉金色的夕陽;頭頂燈泡串發出微弱嗡鳴;一位年輕女子穿著復古紅色襯洋裝、赤腳起舞,卷髮在夕陽餘暉中閃亮;她的舞伴穿著卡其外套、吊帶長褲,臉上掛著燦爛真誠的笑容;樓下遠處傳來汽車喇叭與地鐵震動聲。」
攝影:
「鏡頭:中廣角,從水平視角慢推軌進;鏡頭類型:40mm 球面鏡頭;景深:淺(前景清晰,背景柔焦)。」
燈光/情緒:
「金色自然天光+燈泡暖色反光;地面提供絲絲冷色;情緒:懷舊、溫柔、電影感。」
動作節拍(4 秒):
「1s 她旋轉,裙擺飛揚,捕捉到陽光 → 2s 她停下來並轉向他 → 3s 他走上前,抓住她的手,兩人傾斜進入陰影 → 4s 床單飄過鏡頭,短暫遮住天際線後再次分開。」
對白:
「女:『看吧?這座城市今晚也跟我們一起跳舞。』
男(溫柔地微笑):『只因為你在帶領。』」
音效(文字提示):
「只留自然環境音:微弱的風聲、布料飄動聲、街道噪音、遠處地鐵的震動(不加配樂)。」

▲可實現一張床單漂過鏡頭的效果
課堂 12:製作影片最後檢查清單:設計一條可觀賞影片
比較大規模的 AI 短片,可能你需要在 Sora 2 生成2~10條或更多素材短片製成。在多條素材影片裡面,最重要的是畫面設計、動作節拍與風格取向一致。首先檢查主體是否明確、場景是否清晰可辨、光型與色溫是否支撐情緒;其次核對鏡頭角度、運動幅度與節拍標註是否與敘述吻合;再者確認對白區塊與畫面區塊分離,音效指引是否簡潔。最後評估素材可否被重複使用,是否便於在剪接軟件內疊加字幕與音樂。此類流程化檢查,有助把生成樣片提升至一段有條理、可敍述一個小故事的短影片作品。
提示詞(將以下整段複製/貼上到Sora 2)
「一間堆滿工具的工作室,一個圓圓的小機器人坐在木頭長凳上,它的大大的藍色眼睛很緊張,正在修理一個會冒泡的燈泡。窗外在下雨。動作:它試著接泡泡 → 燈泡掉下來 → 它接住了!然後鬆口氣地說:『差點掉了,但我接住了!』氛圍:溫暖可愛,有點緊張但最後成功。」

鏡頭運動與節拍:以節奏控敘事
鏡頭運動屬結構性語言,負責導引觀眾視線與情緒;節拍則決定資訊投放速率。建議先以短段落定義起承轉合,利用 2–4 秒節拍呈現單一動作,避免在同一段落同時要求平移、變焦與主體快速位移。當鏡頭設計自律,畫面節奏會更利於配樂與音效疊合,亦能在剪接階段維持整體穩定。
由短段到成片
實務上宜以若干 2–4 秒鏡頭作測試池,確認主體、光線與風格後,再擴充至 8–12 秒片段;各段落以一致風格語句與光型參數貫穿,最後於剪接軟件內合成,並以字幕、音樂與擬音統一節奏。此由短至長之方法,能降低重算風險,亦利於多版本 A/B 測試。
總結
以上 12 堂節課堂,大家學到從第一步開始,然後加入動作、風格、鏡頭等元素,初步了解如何製作一條具有質素的影片,期望這篇文章能為大家邁向製作專業級影片做好準備。
分享到 :
最新影片