ਨਵੀਂ ਦਿੱਲੀ, ਟੈੱਕ ਡੈਸਕ:ਪਿਛਲੇ ਕੁਝ ਮਹੀਨਿਆਂ 'ਚ AI ਨੂੰ ਲੈ ਕੇ ਕਈ ਵੱਡੀਆਂ ਚਰਚਾਵਾਂ ਦੇਖਣ ਨੂੰ ਮਿਲੀਆਂ ਹਨ। ਲਗਪਗ ਸਾਰੀਆਂ ਵੱਡੀਆਂ ਕੰਪਨੀਆਂ ਨੇ ਇਸ ਨੂੰ ਆਪਣੇ ਵੱਖ-ਵੱਖ ਪ੍ਰੋਗਰਾਮਾਂ ਵਿੱਚ ਜੋੜਨਾ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤਾ ਹੈ। ਇਸ ਰੁਝਾਨ ਨੂੰ ਜਾਰੀ ਰੱਖਦੇ ਹੋਏ, ਮੈਟਾ ਨੇ ਇੱਕ ਨਵਾਂ ਮਾਡਲ ਵੀ ਪੇਸ਼ ਕੀਤਾ ਹੈ।
ਮੈਟਾ 1,100 ਤੋਂ ਵੱਧ ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਪੀਚ-ਟੂ-ਟੈਕਸਟ, ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ AI ਮਾਡਲਾਂ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ, ਓਪਨ ਸੋਰਸ ਡਾਟਾ ਵੀ ਸਾਂਝਾ ਕਰਦਾ ਹੈ। ਹਾਂ, ਹੋਰ ਵੱਡੀਆਂ ਤਕਨੀਕੀ ਕੰਪਨੀਆਂ ਵਾਂਗ, ਮੈਟਾ ਵੀ ਆਰਟੀਫਿਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ (AI) 'ਤੇ ਵੱਡੀ ਸੱਟਾ ਲਗਾ ਰਹੀ ਹੈ। AI ਪ੍ਰਤੀ ਕੰਪਨੀ ਦਾ ਪਹੁੰਚ ਗੂਗਲ ਅਤੇ ਮਾਈਕ੍ਰੋਸਾਫਟ ਤੋਂ ਥੋੜ੍ਹਾ ਵੱਖਰਾ ਹੈ। ਆਓ, ਇਸ ਬਾਰੇ ਜਾਣੀਏ।
ਮਾਡਲ ਕਿਸ ਮਕਸਦ ਲਈ ਬਣਾਇਆ ਗਿਆ ਹੈ?
META ਨੇ ਦੁਨੀਆ ਭਰ ਦੀਆਂ ਭਾਸ਼ਾਵਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਰੱਖਣ ਦੇ ਉਦੇਸ਼ ਨਾਲ ਇੱਕ ਨਵੇਂ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲ (LLM) ਦਾ ਪਰਦਾਫਾਸ਼ ਕੀਤਾ। ਇਸਨੂੰ ਮੈਸਿਵਲੀ ਮਲਟੀਲਿੰਗੁਅਲ ਸਪੀਚ (MMS) ਕਿਹਾ ਜਾਂਦਾ ਹੈ। ਮਾਡਲ ਨੇ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ ਅਤੇ ਸਪੀਚ-ਟੂ-ਟੈਕਸਟ ਤਕਨਾਲੋਜੀ ਨੂੰ ਲਗਪਗ 100 ਭਾਸ਼ਾਵਾਂ ਤੋਂ ਵਧਾ ਕੇ 1,100 ਤੋਂ ਵੱਧ ਕਰ ਦਿੱਤਾ ਹੈ, ਜੋ ਕਿ ਪਹਿਲਾਂ ਨਾਲੋਂ 10 ਗੁਣਾ ਜ਼ਿਆਦਾ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇਹ 4,000 ਤੋਂ ਵੱਧ ਬੋਲੀਆਂ ਜਾਣ ਵਾਲੀਆਂ ਭਾਸ਼ਾਵਾਂ ਨੂੰ ਵੀ ਪਛਾਣ ਸਕਦਾ ਹੈ, ਜੋ ਕਿ ਪਹਿਲਾਂ ਨਾਲੋਂ 40 ਗੁਣਾ ਵੱਧ ਹੈ।
ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਿਵੇਂ ਕੀਤੀ ਜਾਵੇਗੀ?
ਆਪਣੇ ਬਲੌਗ ਪੋਸਟ ਵਿੱਚ, ਮੈਟਾ ਨੇ ਇਸ਼ਾਰਾ ਕੀਤਾ ਕਿ ਦੁਨੀਆ ਦੀਆਂ ਬਹੁਤ ਸਾਰੀਆਂ ਭਾਸ਼ਾਵਾਂ ਦੇ ਵਿਨਾਸ਼ ਦੇ ਖਤਰੇ ਵਿੱਚ ਹਨ, ਅਤੇ ਮੌਜੂਦਾ ਬੋਲੀ ਪਛਾਣ ਅਤੇ ਪੀੜ੍ਹੀ ਤਕਨਾਲੋਜੀ ਦੀਆਂ ਸੀਮਾਵਾਂ ਇਸ ਰੁਝਾਨ ਨੂੰ ਹੋਰ ਤੇਜ਼ ਕਰਨਗੀਆਂ। ਕੰਪਨੀ ਨੇ ਬਲਾਗ 'ਚ ਕਿਹਾ ਕਿ ਅਸੀਂ ਲੋਕਾਂ ਲਈ ਜਾਣਕਾਰੀ ਤੱਕ ਪਹੁੰਚ ਅਤੇ ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਉਨ੍ਹਾਂ ਦੀ ਪਸੰਦੀਦਾ ਭਾਸ਼ਾ 'ਚ ਆਸਾਨ ਬਣਾਉਣਾ ਚਾਹੁੰਦੇ ਹਾਂ।ਅੱਜ ਅਸੀਂ ਆਰਟੀਫਿਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ (AI) ਮਾਡਲਾਂ ਦੀ ਲੜੀ ਦਾ ਐਲਾਨ ਕਰ ਰਹੇ ਹਾਂ ਜੋ ਉਨ੍ਹਾਂ ਨੂੰ ਅਜਿਹਾ ਕਰਨ 'ਚ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ।
ਨਵਾਂ ਮਾਡਲ ਕਿਵੇਂ ਕੰਮ ਕਰੇਗਾ?
ਮੈਟਾ ਨੇ ਕਿਹਾ ਕਿ ਸਭ ਤੋਂ ਵੱਡੀ ਚੁਣੌਤੀ ਹਜ਼ਾਰਾਂ ਭਾਸ਼ਾਵਾਂ ਲਈ ਆਡੀਓ ਡਾਟਾ ਇਕੱਠਾ ਕਰਨਾ ਸੀ। ਸਭ ਤੋਂ ਵੱਡਾ ਮੌਜੂਦਾ ਭਾਸ਼ਣ ਡੇਟਾਸੈਟ 100 ਤੋਂ ਵੱਧ ਭਾਸ਼ਾਵਾਂ ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ। ਉਦਾਹਰਨ ਲਈ, ਧਾਰਮਿਕ ਗ੍ਰੰਥ, ਜਿਵੇਂ ਕਿ ਬਾਈਬਲ, ਦਾ ਕਈ ਵੱਖ-ਵੱਖ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ ਜਿਨ੍ਹਾਂ ਦੇ ਅਨੁਵਾਦਾਂ ਦਾ ਪਾਠ-ਆਧਾਰਿਤ ਭਾਸ਼ਾ ਅਨੁਵਾਦ ਖੋਜ ਵਿੱਚ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਅਧਿਐਨ ਕੀਤਾ ਗਿਆ ਹੈ।
ਮੈਟਾ 'ਤੇ ਇਹਨਾਂ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਇਹਨਾਂ ਲਿਖਤਾਂ ਨੂੰ ਪੜ੍ਹਨ ਵਾਲੇ ਲੋਕਾਂ ਦੀਆਂ ਆਡੀਓ ਰਿਕਾਰਡਿੰਗਾਂ ਜਨਤਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਹਨ। ਕੰਪਨੀ ਨੇ ਕਿਹਾ ਕਿ MMS ਪ੍ਰੋਜੈਕਟ ਦੇ ਤਹਿਤ, ਅਸੀਂ 1,100 ਤੋਂ ਵੱਧ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਨਿਊ ਟੈਸਟਾਮੈਂਟ ਰੀਡਿੰਗ ਦਾ ਇੱਕ ਡੇਟਾਸੈਟ ਬਣਾਇਆ ਹੈ, ਜੋ ਪ੍ਰਤੀ ਭਾਸ਼ਾ ਵਿੱਚ ਔਸਤਨ 32 ਘੰਟੇ ਦਾ ਡੇਟਾ ਦਿੰਦਾ ਹੈ।
Posted By: Sandip Kaur