ਇਕ ਨਿਊਜ਼ ਪੋਸਟ 'ਚ ਟੈੱਕ ਕੰਪਨੀ ਨੇ ਤਿੰਨ ਨਵੇਂ ਵੱਡੇ ਲੈਂਗੂਏਜ ਮਾਡਲ (LLMs) ਪੇਸ਼ ਕੀਤੇ ਹਨ। ਇਹ ਸਾਰੇ ਮਾਡਲ Microsoft Foundry ਅਤੇ MAI Playground ਰਾਹੀਂ ਉਪਲਬਧ ਹਨ।

ਟੈਕਨਾਲੋਜੀ ਡੈਸਕ, ਨਵੀਂ ਦਿੱਲੀ: Microsoft ਨੇ ਬੀਤੇ ਵੀਰਵਾਰ ਨੂੰ ਤਿੰਨ ਖ਼ਾਸ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ (AI) ਮਾਡਲ ਲਾਂਚ ਕੀਤੇ ਹਨ, ਜਿਨ੍ਹਾਂ ਦਾ ਮੁੱਖ ਫੋਕਸ ਇਮੇਜ ਬਣਾਉਣ, ਆਵਾਜ਼ ਜਨਰੇਟ ਕਰਨ ਅਤੇ ਸਪੀਚ-ਟੂ-ਟੈਕਸਟ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ 'ਤੇ ਹੈ। ਰੈੱਡਮੰਡ ਸਥਿਤ ਟੈਕ ਕੰਪਨੀ ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ ਇਹ ਮਾਡਲ Google, OpenAI ਅਤੇ ਹੋਰ ਕੰਪਨੀਆਂ ਦੇ ਮਾਡਲਾਂ ਨਾਲੋਂ ਬਿਹਤਰ ਕੰਮ ਕਰਦੇ ਹਨ।
ਇਨ੍ਹਾਂ ਮਾਡਲਾਂ— MAI-Transcribe-1, MAI-Voice-1 ਅਤੇ MAI-Image ਬਾਰੇ ਇਹ ਵੀ ਕਿਹਾ ਜਾ ਰਿਹਾ ਹੈ ਕਿ ਇਨ੍ਹਾਂ ਦਾ ਫੋਕਸ ਤੇਜ਼ੀ ਨਾਲ ਕੰਟੈਂਟ ਬਣਾਉਣ ਅਤੇ ਕਿਫਾਇਤੀ ਕੀਮਤਾਂ 'ਤੇ ਉਪਲਬਧ ਹੋਣ 'ਤੇ ਹੈ। ਇਹ ਮਾਡਲ ਇਸ ਵੇਲੇ 'Microsoft Foundry' ਰਾਹੀਂ ਉਪਲਬਧ ਹਨ ਅਤੇ ਇਨ੍ਹਾਂ ਨੂੰ ਵੱਖ-ਵੱਖ ਕੰਜ਼ਿਊਮਰ ਪ੍ਰੋਡਕਟਸ ਵਿੱਚ ਵੀ ਸ਼ਾਮਲ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ।
ਇਕ ਨਿਊਜ਼ਪੋਸਟ 'ਚ ਇਸ ਟੈੱਕ ਕੰਪਨੀ ਨੇ ਤਿੰਨ ਨਵੇਂ ਵੱਡੇ ਲੈਂਗਵੇਜ ਮਾਡਲ (LLMs) ਪੇਸ਼ ਕੀਤੇ ਹਨ। ਇਹ ਸਾਰੇ ਇਸ ਵੇਲੇ Microsoft Foundry ਅਤੇ MAI Playground ਰਾਹੀਂ ਉਪਲਬਧ ਹਨ।
ਇਨ੍ਹਾਂ ਵਿੱਚੋਂ ਸਭ ਤੋਂ ਖ਼ਾਸ ਮਾਡਲ MAI-Transcribe-1 ਹੈ। ਕੰਪਨੀ ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ ਇਹ ਸਭ ਤੋਂ ਵੱਧ ਵਰਤੀਆਂ ਜਾਣ ਵਾਲੀਆਂ 25 ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਬਿਹਤਰੀਨ (SOTA) ਸਪੀਚ-ਟੂ-ਟੈਕਸਟ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਦੀ ਸਹੂਲਤ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
ਇਹ ਦਾਅਵੇ Microsoft ਦੇ 'FLEURS' ਬੈਂਚਮਾਰਕ 'ਤੇ ਕੀਤੇ ਗਏ ਅੰਦਰੂਨੀ ਟੈਸਟਾਂ 'ਤੇ ਅਧਾਰਤ ਹਨ। ਕਿਹਾ ਜਾ ਰਿਹਾ ਹੈ ਕਿ ਇਹ ਗਲਤੀਆਂ ਦੀ ਦਰ (error rate) ਦੇ ਮਾਮਲੇ 'ਚ Gemini 3.1 Flash ਅਤੇ GPT-Transcribe ਨਾਲੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਕੰਪਨੀ ਦਾ ਕਹਿਣਾ ਹੈ ਕਿ Foundry ਯੂਜ਼ਰਜ਼ ਲਈ ਇਹ ਕਿਸੇ ਵੀ ਵੱਡੇ ਕਲਾਉਡ ਪ੍ਰੋਵਾਈਡਰ ਦੇ ਮੁਕਾਬਲੇ 'ਸਭ ਤੋਂ ਵਧੀਆ ਕੀਮਤ ਅਤੇ ਕਾਰਗੁਜ਼ਾਰੀ' (best-price performance) ਵਾਲਾ ਮਾਡਲ ਸਾਬਿਤ ਹੋਵੇਗਾ।
MAI-Voice-1 ਦੀ ਗੱਲ ਕਰੀਏ ਤਾਂ ਇਸ ਮਾਡਲ ਬਾਰੇ ਕਿਹਾ ਜਾ ਰਿਹਾ ਹੈ ਕਿ ਇਹ ਬਿਲਕੁਲ 'ਕੁਦਰਤੀ ਅਤੇ ਅਸਲੀ ਵਰਗੀ ਆਵਾਜ਼' ਤਿਆਰ ਕਰਦਾ ਹੈ, ਜਿਸ ਵਿਚ ਆਵਾਜ਼ ਦੀਆਂ ਬਾਰੀਕੀਆਂ, ਭਾਵਨਾਵਾਂ ਦੀ ਪੂਰੀ ਰੇਂਜ ਅਤੇ ਹਾਵ-ਭਾਵ ਸਾਫ਼ ਝਲਕਦੇ ਹਨ। ਇਹ ਮਾਡਲ ਲੰਬੇ ਕੰਟੈਂਟ ਨੂੰ ਤਿਆਰ ਕਰਦੇ ਸਮੇਂ ਵੀ ਆਵਾਜ਼ ਤੇ ਬੋਲਣ ਦੇ ਅੰਦਾਜ਼ 'ਚ ਇਕਸਾਰਤਾ ਬਣਾਈ ਰੱਖਣ 'ਚ ਸਮਰੱਥ ਹੈ। Foundry ਦੇ ਅੰਦਰ, ਇਹ ਮਾਡਲ ਵਰਤੋਂਕਾਰਾਂ ਨੂੰ ਕੁਝ ਹੀ ਸੈਕੰਡ ਦੀ ਆਡੀਓ ਕਲਿੱਪ ਦੀ ਮਦਦ ਨਾਲ ਆਪਣੀ ਖੁਦ ਦੀ ਆਵਾਜ਼ ਬਣਾਉਣ ਦੀ ਸਹੂਲਤ ਵੀ ਦੇਵੇਗਾ।
Microsoft ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ ਇਹ ਪ੍ਰਕਿਰਿਆ ਪੂਰੀ ਤਰ੍ਹਾਂ ਸੁਰੱਖਿਅਤ ਹੈ। ਮਿਲੀ ਜਾਣਕਾਰੀ ਮੁਤਾਬਕ, ਇਹ ਸਿਰਫ਼ ਇਕ ਸੈਕੰਡ 'ਚ 60 ਸੈਕੰਡ ਦੀ ਆਡੀਓ ਕਲਿੱਪ ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ। ਖ਼ਾਸ ਗੱਲ ਇਹ ਹੈ ਕਿ ਇਹ AI ਮਾਡਲ 'Copilot Audio Expressions' ਅਤੇ 'Copilot Podcasts' ਨੂੰ ਵੀ ਪਾਵਰ ਦੇਵੇਗਾ।
ਅਖੀਰ 'ਚ, MAI-Image-2 ਮਾਡਲ ਆਪਣੇ ਪਿਛਲੇ ਵਰਜ਼ਨ ਦੀਆਂ ਖੂਬੀਆਂ ਨੂੰ ਹੋਰ ਬਿਹਤਰ ਬਣਾਉਂਦਾ ਹੈ। ਇਸ ਬਾਰੇ ਕਿਹਾ ਜਾ ਰਿਹਾ ਹੈ ਕਿ ਇਹ ਪਹਿਲਾਂ ਨਾਲੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਤੇਜ਼ੀ ਨਾਲ ਬਿਹਤਰ ਕੁਆਲਿਟੀ ਵਾਲਾ ਆਊਟਪੁੱਟ ਦਿੰਦਾ ਹੈ। Microsoft ਨੇ ਦੱਸਿਆ ਕਿ ਇਸ ਮਾਡਲ ਨੂੰ ਫੋਟੋਗ੍ਰਾਫਰਾਂ, ਡਿਜ਼ਾਈਨਰਾਂ ਅਤੇ ਵਿਜ਼ੂਅਲ ਸਟੋਰੀਟੇਲਰਾਂ ਨਾਲ ਮਿਲ ਕੇ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਸ ਦਾ ਮੁੱਖ ਫੋਕਸ ਕੁਦਰਤੀ ਲਾਈਟਿੰਗ, ਸਹੀ ਟੈਕਸਟਚਰ ਅਤੇ ਤਸਵੀਰ ਦੇ ਅੰਦਰ ਸਾਫ਼ ਲਿਖੇ ਟੈਕਸਟ (clear in-image text) 'ਤੇ ਹੈ।
ਵਿਸ਼ਵ ਦੀ ਵੱਡੀ ਐਡਵਰਟਾਈਜ਼ਿੰਗ ਕੰਪਨੀ WPP ਉਨ੍ਹਾਂ ਸ਼ੁਰੂਆਤੀ ਪਾਰਟਨਰਾਂ 'ਚੋਂ ਇਕ ਹੈ ਜਿਨ੍ਹਾਂ ਨੇ ਇਸ AI ਮਾਡਲ ਨੂੰ ਅਪਣਾਇਆ ਹੈ। ਇਹ ਮਾਡਲ ਵੀ Microsoft Foundry ਤੇ MAI Playground ਰਾਹੀਂ ਉਪਲਬਧ ਹੋਵੇਗਾ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇਸ ਨੂੰ Copilot, Bing ਅਤੇ PowerPoint 'ਤੇ ਵੀ ਰੋਲ ਆਊਟ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ।