Shotcut 25.10 arriba amb IA local, HTML i captura nativa

  • Text a veu en local amb KokoroDoki i suport per a CPU/GPU mitjançant Docker.
  • Generador HTML i filtre "Typewriter" amb presets, transparència i límit a 15 FPS.
  • Enregistrament de pantalla nativa per entorn (FFmpeg, GNOME, Spectacle o OBS).
  • Actualització a FFmpeg 8, llibreries renovades i diverses correccions clau.

Shotcut 25.10

L'editor de vídeo de codi obert més conegut a l'escriptori Linux torna a moure fitxa. Shotcut 25.10 ja està entre nosaltres i arriba carregat de funcions que apunten directament a la productivitat: intel·ligència artificial que s'executa a local, generadors HTML per a títols amb estil i un enregistrament de pantalla nativa que evita dependre d'utilitats externes.

Després d'un període de proves en beta, la publicació com a versió estable confirma que el projecte segueix el full de ruta amb pas ferm. La novetat estrella és el text a veu (TTS) per a notes i subtítols, acompanyada d'un filtre de màquina d'escriure, un generador d'imatge/vídeo des d'HTML i actualització a FFmpeg 8, sense oblidar un bon paquet de correccions i millores de compatibilitat.

Panorama general: què canvia a Shotcut 25.10

L'equip ha anat incorporant funcions amb IA en els darrers temps: primer va arribar la transcripció amb Whisper (veu a text) i ara es completa el cercle amb text a veu integrat i en local. Aquesta combinació obre fluxos de treball molt potents per narrar, subtitular i fer continguts accessibles sense sortir de l'editor.

Al costat de la IA, aquest lliurament introdueix eines creatives recolzades en HTML i funcionalitats demanades per la comunitat, com ara l'enregistrament de pantalla multiplataforma. El llançament també eleva la base tècnica amb FFmpeg 8 i biblioteques clau actualitzades.

Shotcut 25.10 introdueix text a veu local per a notes i subtítols

La implementació de TTS a Shotcut es recolza en KokoroDoki i el model Kokoro 82M, un motor de síntesi de veu obert que pot treballar en temps real. Cal recordar que la versió 25.07 va incorporar un model de de veu a text. El més destacable és que tot passa al teu equip: no hi ha enviament al núvol, de manera que la privadesa i el control del projecte queden garantits.

Per accelerar el processament, KokoroDoki pot utilitzar CPU o GPU NVIDIA amb CUDA. A màquines amb gràfica compatible notaràs temps de generació substancialment menors, cosa que s'agraeix quan cal iterar sobre moltes línies de subtítols o quan es preparen locucions llargues.

Pel que fa a les veus, el paquet actual és més complet en anglès. L'anglès americà compta amb més de vint veus, el britànic ofereix al voltant de vuit, i per a altres idiomes la cobertura és més limitada per ara. Cal esperar que el ventall es vagi ampliant en futures revisions, però d'entrada ja hi ha prou material per a maquetes, prototips i projectes finals en anglès.

Hi ha un detall tècnic a tenir en compte: la integració s'executa mitjançant Docker. Això afegeix un pas extra de configuració respecte a altres funcions, especialment si mai no has treballat amb contenidors. No és un mur infranquejable, però cal reservar uns minuts per deixar-lo fi.

Shotcut 25.10, la generació des d'HTML i efecte de màquina d'escriure

La creativitat s'expandeix amb dues aportacions que van de la mà: una nova generador «Imatge/Vídeo des d'HTML» i un efecte de text que simula una màquina descriure. L'enfocament és clar: portar les capacitats del navegador a la línia de temps per produir títols, cartells i animacions amb fons transparent i sense connectors rars.

El generador HTML crea imatges o clips amb transparència per defecte. Per mantenir l'estabilitat, els vídeos generats es limiten a 15 fotogrames per segon, un valor suficient per a grafismes i superposicions que eviten colls d'ampolla. Només acabar, el resultat s'obre automàticament al visor Origen juntament amb el vostre HTML, de manera que pots revisar o retocar el codi sobre la marxa.

L'efecte «Text: Typewriter» porta presets preparats per utilitzar i altres pensats per personalitzar. Entre els perfils inclosos hi ha 3D image, elastic stroke, folded, gold metall o Hora de festa, que cobreixen des d'acabats sòlids per a imatges fins a animacions més juganeres per a vídeo. Si et maneges amb CSS i JS, la porta queda oberta a fer coses molt serioses.

  • compatibilitat amb codi compilat des de CodePen, ideal per reutilitzar snippets i dissenys que ja tinguis a la recambra.
  • Render amb límit de 15 FPS per a estabilitat a la generació basada en navegador.
  • Possibilitats creatives amb fons transparents sense composicions complicades.

Enregistrament de pantalla nativa i multiplataforma

Una altra petició clàssica de la comunitat per fi aterra: enregistrament de pantalla integrada. La implementació varia segons l'entorn, però en tots els casos s'ha cercat el backend nadiu més fiable per reduir friccions.

  • X11: ús de FFmpeg com a backend principal.
  • Wayland (GNOME): integració amb l'eina nativa de captura/screencast.
  • Plasma KDE: suport a Spectacle per a la captura.
  • alternativa: si cap dels anteriors és present, es recorre a OBS Studio com a comodí.

Amb això s'evita instal·lar utilitats addicionals en la majoria de casos i es unifica el flux de treball: graves, edites i exportes des de la mateixa aplicació. Per a creadors de tutorials, ressenyes de programari o sessions formatives, és una millora que es nota des del primer dia.

Shotcut 25.10 posa el motor multimèdia al dia: FFmpeg 8 i llibreries

Sota el capó també hi ha moviment. L'aplicació passa a FFmpeg 8, el que significa millores en codificació/decodificació, nous filtres i una compatibilitat més àmplia amb formats moderns. A nivell pràctic, exportacions més consistents i reproducció més suau en projectes complexos.

S'actualitzen a més components essencials com SVT-AV1, libaom, dav1d, libvpx, libwebp y xiuxiuejar.cpp. Aquestes peces afecten còdecs AV1, VP9, ​​WebP o la pròpia transcripció per IA, tancant el cercle per a workflows més robustos.

Millores a la interfície de Shotcut 25.10 i flux de treball

Petits detalls que sumen: al panell de Propietats ara estan disponibles les opcions «Obrir amb» i «Recarregar». Són canvis modestos però pràctics quan cal refrescar mitjans editats externament o llençar-los ràpid amb una app del sistema.

El nou generador «Imatge/Vídeo des d'HTML» conviu amb el filtre «Text: Typewriter», per la qual cosa podeu combinar la generació HTML fora de la línia de temps (com a actiu de mitjans) amb l'animació de màquina d'escriure aplicada a un clip ja inserit. Flexibilitat total segons el cas dús.

Correccions d'errors i estabilitat de Shotcut 25/10

El llançament corregeix diversos problemes molestos que s'havien reportat, semblant a la actualització 25.08. Per exemple, errors en exportar quan el nom o la ruta contenien el caràcter &, un inconvenient més habitual del que sembla en projectes compartits.

Es resol també un problema en iniciar l'AppImage a Linux quan estava instal·lat AppImageLauncher, i s'arreglen keyframes avançats a «Text: Rich» que no es comportaven com devien. Finalment, es corregeix un error al canal alfa en descodificar Ut Video, clau per als qui treballen amb transparència en pipelins professionals.

Instal·lació i compatibilitat

Per facilitar la vida a Linux, el projecte distribueix una AppImage universal que pots descarregar i executar sense instal·lar dependències. A la pràctica, és donar-li permisos dexecució i llest.

Al front de compatibilitat, es confirma suport per a glibc 2.35 a Ubuntu 22.04 LTS, de manera que aquesta LTS està coberta. Qualsevol distribució moderna amb nucli superior a 5.10 hauria d'anar sense sorpreses, mentre que en sistemes més antics potser necessites ajustar llibreries.

Casos d'ús: de creadors a educadors i devs

Per als que fan contingut a xarxes o YouTube, el pack és rodó. Graves la pantalla sense sortir de l'editor, apliques efectes de text amb estil i generes veus sintètiques per a intros, explicacions o crides a l'acció sense haver de locutar cada canvi.

  • Tutorials en vídeo: enregistrament integrat + anotacions amb TTS per a ritmes dinàmics.
  • Presentacions: títols animats professionals sense plugins de pagament.
  • Accessibilitat: combinant Whisper (veu a text) i TTS pots millorar subtitulat i narració.

En educació i formació, el valor és clar: classes gravades, videotutorials i material de suport amb rètols i veus generades en local. Diversos perfils de veu en anglès permeten diversificar el to segons l'audiència.

  • Donem de programari: captura nativa d'aplicacions sense dependre d'eines externes.
  • Documentació visual: vídeos amb anotacions tècniques i ràfegues de text llegibles.
  • Test d'interfície: gravar i revisar fluxos per a retroalimentació ràpida.

Comparativa ràpida davant de la versió anterior

Pel que fa al lliurament previ, les millores són substancials. L'enregistrament nadiu elimina la necessitat de solucions addicionals a la majoria d'escriptoris i el tàndem HTML+Typewriter multiplica les opcions de títols i lower thirds.

  • ✅ Enregistrament integrat sense passar per OBS (excepte escenari alternatiu).
  • ✅ Efectes de text avançats amb suport HTML/CSS i presets de qualitat.
  • ✅ Text a veu per a notes i subtítols dins del propi Shotcut.
  • ✅ FFmpeg 8 per a millor rendiment i formats actuals.
  • ✅ Estabilitat reforçada amb arranjaments en casos edge habituals.

Requisits i configuració recomanada

Perquè tot flueixi, convé apuntar un equip equilibrat. Amb 8 GB de RAM pots treballar, però si et mous amb projectes mitjans/grans agrairàs tenir 16 GB.

  • CPU: almenys 4 nuclis per a efectes i codificacions folgades.
  • RAM: 8 GB mínim, 16 GB recomanats.
  • GPU: compatible amb OpenGL 3.3+; si uses CUDA, accelerarà TTS amb KokoroDoki.
  • Emmagatzematge: SSD per a mitjans i memòria cau, especialment en projectes amb còdecs pesants.

En ajustaments de projecte, és bona idea igualar FPS i resolució a la teva destinació final per evitar reescalats innecessaris. Mantenir proxies i previsualització optimitzada t'estalviarà estrebades en sumar filtres i diverses pistes.

Fluxos de treball amb HTML, CodePen i Typewriter

Si esprés el generador HTML, treballa el disseny al teu editor oa CodePen, compila/empaca els recursos i enganxa'ls a la plantilla de Shotcut. Així t'assegures que fonts, estils i scripts es resolen sense trucades externes.

Per a animacions de text, alterna el filtre «Text: Typewriter» i la generació externa: quan vulguis rapidesa i una mica lleuger, el filtre et treu de l'angoixa; si necessites acabats complexos, el flux amb HTML et donarà més control (i transparència nativa).

Notes sobre rendiment, privadesa i límits

L'enfocament local del TTS té dos grans avantatges: protegeix els teus continguts i evita latències o quotes de serveis en línia. A canvi, exigeix ​​configurar Docker i, si vols velocitat màxima, comptar amb una GPU NVIDIA per a CUDA.

El límit de 15 FPS a la generació HTML no és un caprici: estabilitza el render quan el motor del navegador genera vídeo o imatges amb transparències i capes. A la pràctica, per a rètols, transicions i overlays és més que suficient.

Petits detalls que marquen diferència

L'opció «Obrir amb» a Propietats agilitza retocar un clip en una eina externa i tornar sense perdre el fil, mentre que «Recarregar» permet forçar l'actualització d'un mitjà si el fitxer ha canviat en disc. Aquestes dues tecles, més el visor Origen obrint en automàtic el generat per HTML, fan el dia a dia més rodó.

La suma FFmpeg 8 i les biblioteques renovades també es nota en tranquil·litat: menys sorpreses en importar/exportar i millor maneig de formats recents com AV1, juntament amb una descodificació més fina.

Qui vingui de versions anteriors es trobarà amb un editor que ha madurat sense perdre la seva essència: gratuït, multiplataforma i amb decisions tècniques que afavoreixen treballar en local. La sensació és que el projecte trepitja l'accelerador on toca: rendiment, IA pràctica i eines creatives amb corbes d'aprenentatge suaus.

Shotcut 25.05
Article relacionat:
Shotcut 25.05 incorpora avenços en HDR mentre puja Qt a la versió 6.8.3