ਪਿਛਲੀ ਜਨਰੇਸ਼ਨ ਦੇ ਮੁਕਾਬਲੇ ਵੱਡਾ ਬਦਲਾਅ ਇਹ ਹੈ ਕਿ Gemma 4 ਹੁਣ ਪਰਮਿਸੀਬਲ Apache 2.0 ਲਾਇਸੈਂਸ ਤਹਿਤ ਉਪਲਬਧ ਹੈ ਜੋ ਇਸਨੂੰ ਅਕਾਦਮਿਕ ਤੇ ਕਮਰਸ਼ੀਅਲ (ਵਪਾਰਕ), ਦੋਵਾਂ ਉਦੇਸ਼ਾਂ ਲਈ ਵਰਤਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। ਇਸ LLM ਦੀ ਸਿੱਧੀ ਵਰਤੋਂ Google AI Studio ਅਤੇ Vertex AI ਰਾਹੀਂ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ ਜਾਂ ਇਸਨੂੰ ਕੰਪਨੀ ਦੀ Hugging Face, Kaggle ਅਤੇ Ollama ਲਿਸਟਿੰਗ ਤੋਂ ਡਾਊਨਲੋਡ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।

ਟੈਕਨਾਲੋਜੀ ਡੈਸਕ, ਨਵੀਂ ਦਿੱਲੀ : Google ਨੇ ਬੀਤੇ ਵੀਰਵਾਰ ਨੂੰ Gemma 4 ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ (AI) ਮਾਡਲ ਪੇਸ਼ ਕੀਤਾ। Gemma 4 ਫੈਮਿਲੀ ਦਾ ਇਹ ਪਹਿਲਾ ਮਾਡਲ ਆਪਣੇ ਪਿਛਲੇ ਮਾਡਲਾਂ ਦੇ ਮੁਕਾਬਲੇ ਕਈ ਇੰਪਰੂਵਮੈਂਟਸ (ਸੁਧਾਰਾਂ) ਦੇ ਨਾਲ ਆਇਆ ਹੈ। ਜਿੱਥੇ Gemma 3 ਦਾ ਫੋਕਸ ਟੈਕਸਟ ਤੇ ਵਿਜ਼ੂਅਲ ਰੀਜ਼ਨਿੰਗ ਕੈਪੇਬਿਲਿਟੀਜ਼ (ਸਮਰੱਥਾਵਾਂ) 'ਤੇ ਸੀ, ਉੱਥੇ ਹੀ ਮਾਊਂਟੇਨ ਵਿਊ ਸਥਿਤ ਇਸ ਟੈੱਕ ਦਿੱਗਜ ਦਾ ਕਹਿਣਾ ਹੈ ਕਿ ਇਹ ਨਵਾਂ ਵਰਜ਼ਨ ਓਪਨ-ਸੋਰਸ ਮਾਡਲ 'ਚ ਏਜੰਟਿਕ ਕੈਪੇਬਿਲਿਟੀਜ਼ ਤੇ ਐਡਵਾਂਸਡ ਰੀਜ਼ਨਿੰਗ ਲੈ ਕੇ ਆਇਆ ਹੈ। ਚਾਰ ਵੱਖ-ਵੱਖ ਸਾਈਜ਼ 'ਚ ਉਪਲਬਧ, ਇਹ ਨਵਾਂ ਲਾਰਜ ਲੈਂਗਵੇਜ ਮਾਡਲ (LLM) Google ਦੇ ਡਿਵੈਲਪਰ ਪਲੇਟਫਾਰਮ 'ਤੇ ਉਪਲਬਧ ਹੋਵੇਗਾ ਅਤੇ ਇਸਨੂੰ ਥਰਡ-ਪਾਰਟੀ ਰਿਪੋਜ਼ਟਰੀ ਰਾਹੀਂ ਡਾਊਨਲੋਡ ਕਰ ਕੇ ਲੋਕਲ ਤੌਰ 'ਤੇ ਚਲਾਇਆ ਜਾ ਸਕਦਾ ਹੈ।
ਇਕ ਬਲੌਗ ਪੋਸਟ 'ਚ ਟੈੱਕ ਦਿੱਗਜ ਨੇ Gemma 4 AI ਮਾਡਲ ਦਾ ਐਲਾਨ ਕੀਤਾ ਤੇ ਉਸ ਬਾਰੇ ਵਿਸਤਾਰ 'ਚ ਦੱਸਿਆ। ਇਹ ਮਾਡਲ ਚਾਰ ਵੱਖ-ਵੱਖ ਸਾਈਜ਼ ਤੇ ਕੌਨਫਿਗਰੇਸ਼ਨਾਂ 'ਚ ਉਪਲਬਧ ਹੈ, ਜਿਨ੍ਹਾਂ ਵਿੱਚ Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) ਤੇ 31B Dense ਸ਼ਾਮਲ ਹਨ। ਇਸਦੀ ਕੰਟੈਕਸਟ ਵਿੰਡੋ ਵੀ ਵਧਾ ਕੇ 256K ਟੋਕਨ ਕਰ ਦਿੱਤੀ ਗਈ ਹੈ ਜੋ Gemma 3 'ਚ 128K ਟੋਕਨ ਸੀ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇਸਨੂੰ 140 ਤੋਂ ਜ਼ਿਆਦਾ ਭਾਸ਼ਾਵਾਂ 'ਤੇ ਨੈਟਿਵਲੀ ਟ੍ਰੇਨ ਕੀਤਾ ਗਿਆ ਹੈ।
ਪਿਛਲੀ ਜਨਰੇਸ਼ਨ ਦੇ ਮੁਕਾਬਲੇ ਵੱਡਾ ਬਦਲਾਅ ਇਹ ਹੈ ਕਿ Gemma 4 ਹੁਣ ਪਰਮਿਸੀਬਲ Apache 2.0 ਲਾਇਸੈਂਸ ਤਹਿਤ ਉਪਲਬਧ ਹੈ ਜੋ ਇਸਨੂੰ ਅਕਾਦਮਿਕ ਤੇ ਕਮਰਸ਼ੀਅਲ (ਵਪਾਰਕ), ਦੋਵਾਂ ਉਦੇਸ਼ਾਂ ਲਈ ਵਰਤਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। ਇਸ LLM ਦੀ ਸਿੱਧੀ ਵਰਤੋਂ Google AI Studio ਅਤੇ Vertex AI ਰਾਹੀਂ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ ਜਾਂ ਇਸਨੂੰ ਕੰਪਨੀ ਦੀ Hugging Face, Kaggle ਅਤੇ Ollama ਲਿਸਟਿੰਗ ਤੋਂ ਡਾਊਨਲੋਡ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।
ਐਡਵਾਂਸਡ ਰੀਜ਼ਨਿੰਗ, ਏਜੰਟਿਕ ਵਰਕਫਲੋ ਅਤੇ ਕੋਡ ਜਨਰੇਸ਼ਨ ਲਈ ਸਪੋਰਟ। ਐਡਵਾਂਸਡ ਰੀਜ਼ਨਿੰਗ ਦੇ ਨਾਲ, ਇਹ ਹੁਣ ਮਲਟੀ-ਸਟੈਪ ਪਲਾਨਿੰਗ ਤੇ ਡੀਪ ਲੋਜਿਕ 'ਚ ਸਮਰੱਥ ਹੈ ਅਤੇ ਮਿਲੀ ਜਾਣਕਾਰੀ ਮੁਤਾਬਕ ਇਹ ਮੈਥਸ (ਗਣਿਤ) ਅਤੇ ਇੰਸਟ੍ਰਕਸ਼ਨ ਫੋਲੋ ਕਰਨ ਦੇ ਮਾਮਲੇ 'ਚ ਬਿਹਤਰ ਪਰਫਾਰਮ ਕਰਦਾ ਹੈ। ਇਹ ਮਾਡਲ ਫੰਕਸ਼ਨ ਕਾਲਿੰਗ ਅਤੇ ਸਟ੍ਰਕਚਰਡ JSON ਆਉਟਪੁੱਟ ਦੇਣ 'ਚ ਵੀ ਸਮਰੱਥ ਹੈ, ਜਿਸ ਨਾਲ ਯੂਜ਼ਰਜ਼ ਇਸ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰ ਕੇ ਆਪਣੇ AI ਏਜੰਟਾਂ ਨੂੰ ਹੋਰ ਵੀ ਪਾਵਰਫੁੱਲ ਬਣਾ ਸਕਦੇ ਹਨ।
ਇਸ ਤੋਂ ਇਲਾਵਾ Google ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ ਇਹ LLM ਹਾਈ-ਕੁਆਲਿਟੀ ਆਫਲਾਈਨ ਕੋਡ ਨੂੰ ਸਪੋਰਟ ਕਰਦਾ ਹੈ। ਹਾਲਾਂਕਿ, ਇਹ ਸਾਫ਼ ਨਹੀਂ ਹੈ ਕਿ Claude Code ਤੇ Codex ਵਰਗੇ ਪ੍ਰੋਪ੍ਰਾਇਟਰੀ (ਮਾਲਕਾਨਾ) ਟੂਲਸ ਦੀ ਤੁਲਨਾ 'ਚ ਇਹ ਕਿੱਥੇ ਟਿਕਦਾ ਹੈ। ਫਿਰ ਵੀ, ਇੱਥੇ ਇਸਦਾ ਇਕ ਸਾਫ਼ ਫਾਇਦਾ ਇਹ ਹੈ ਕਿ ਇਸਦੀ ਵਰਤੋਂ ਫ੍ਰੀ ਵਿਚ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ ਅਤੇ ਇਸ ਵਿਚ ਡਿਵਾਈਸ 'ਤੇ ਹੀ ਪ੍ਰਾਈਵੇਸੀ ਅਤੇ ਸਕਿਓਰਿਟੀ ਬਣੀ ਰਹਿੰਦੀ ਹੈ।
ਇਸਦਾ ਇਕ ਹੋਰ ਨੋਟੇਬਲ ਫੀਚਰ ਇਹ ਹੈ ਕਿ ਇਹ ਵੀਡੀਓ ਅਤੇ ਇਮੇਜ (ਚਿੱਤਰ) ਨੂੰ ਨੈਟਿਵਲੀ ਪ੍ਰੋਸੈਸ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ ਇਸ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਰੈਜ਼ੋਲਿਊਸ਼ਨ ਲਈ ਵੀ ਸਪੋਰਟ ਉਪਲਬਧ ਹੈ। Google ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ ਇਹ ਮਾਡਲ OCR ਅਤੇ ਚਾਰਟ ਨੂੰ ਸਮਝਣ ਵਰਗੇ ਵਿਜ਼ੂਅਲ ਟਾਸਕਸ ਵਿੱਚ ਵੀ ਮਦਦ ਕਰਦਾ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, E2B ਅਤੇ E4B ਮਾਡਲ ਸਪੀਚ ਰਿਕਗਨੀਸ਼ਨ ਅਤੇ ਅੰਡਰਸਟੈਂਡਿੰਗ ਲਈ ਨੈਟਿਵ ਆਡੀਓ ਇਨਪੁੱਟ ਨੂੰ ਵੀ ਸਪੋਰਟ ਕਰਦੇ ਹਨ।