expand/contract ਪੈਟਰਨ ਨਾਲ ਬਿਨਾਂ ਡਾਊਨਟਾਈਮ ਵਾਲੇ ਸਕੀਮਾ-ਬਦਲਾਅ

expand/contract ਪੈਟਰਨ ਨਾਲ ਬਿਨਾਂ ਡਾਊਨਟਾਈਮ ਵਾਲੇ ਸਕੀਮਾ-ਬਦਲਾਅ | Koder.ai

ਕਿਉਂ ਸਕੀਮਾ-ਬਦਲਾਅ ਆਉਟੇਜ ਦਾ ਕਾਰਨ ਬਣਦੇ ਹਨ

ਡਾਟਾਬੇਸ-ਬਦਲਾਅ ਤੋਂ ਹੋਣ ਵਾਲਾ ਡਾਊਨਟਾਈਮ ਹਮੇਸ਼ਾਂ ਸਾਫ਼ ਤੇ ਜ਼ਾਹਿਰ ਨਹੀਂ ਹੁੰਦਾ। ਯੂਜ਼ਰਾਂ ਲਈ ਇਹ ਇੱਕ ਐਸੀ ਪੇਜ ਹੋ ਸਕਦੀ ਹੈ ਜੋ ਲੰਮੇ ਸਮੇਂ ਤੱਕ ਲੋਡ ਹੋ ਰਹੀ ਹੋਵੇ, ਇੱਕ ਚੈਕਆਊਟ ਫੇਲ ਹੋ ਜਾਵੇ, ਜਾਂ ਐਪ ਅਚਾਨਕ "ਕੁਝ ਗਲਤ ਹੋ ਗਿਆ" ਦਿਖਾਏ। ਟੀਮਾਂ ਲਈ ਇਹ alerts, ਵੱਧ ਰਹੀ error rates, ਅਤੇ ਫੇਲ੍ਹ ਹੋਈਆਂ ਰਾਈਟਸ ਦਾ ਬੈਕਲੌਗ ਵਗੈਰਾ ਵਜੋਂ ਨज़र ਆਉਂਦਾ ਹੈ।

ਸਕੀਮਾ-ਬਦਲਾਅ ਖਤਰਨਾਕ ਹੁੰਦੇ ਹਨ ਕਿਉਂਕਿ ਡਾਟਾਬੇਸ ਤੁਹਾਡੇ ਐਪ ਦੇ ਹਰ ਚੱਲ ਰਹੇ ਵਰਜ਼ਨ ਵੱਲੋਂ ਸਾਂਝਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਰਿਲੀਜ਼ ਦੌਰਾਨ ਅਕਸਰ ਪੁਰਾਣੀ ਅਤੇ ਨਵੀਂ ਕੋਡ ਇਕੱਠੇ ਹੀ ਚੱਲ ਰਹੀ ਹੁੰਦੀ ਹੈ (rolling deploys, ਬਹੁਤ ਸਾਰੇ ਇੰਸਟੈਂਸ, background jobs)। ਇੱਕ ਮਾਈਗ੍ਰੇਸ਼ਨ ਜੋ ਦਿਖਣ ਵਿੱਚ ਸਹੀ ਲੱਗਦੀ ਹੈ, ਫਿਰ ਵੀ ਕਿਸੇ ਇਕ ਵਰਜ਼ਨ ਨੂੰ ਤੋੜ ਸਕਦੀ ਹੈ।

ਆਮ ਫੇਲ ਹੋਣ ਦੇ ਤਰੀਕੇ ਸ਼ਾਮਲ ਹਨ:

ਨਵੀਂ ਕੋਡ ਉਸ ਕਾਲਮ ਵਿੱਚ ਲਿਖਦੀ ਹੈ ਜੋ ਹੁਣੇ ਤੱਕ ਮੌਜੂਦ ਨਹੀਂ ਹੈ, ਜਿਸ ਨਾਲ ਤੁਰੰਤ errors ਆ ਜਾਂਦੇ ਹਨ।
ਪੁਰਾਣਾ ਕੋਡ ਕਿਸੇ ਕਾਲਮ ਜਾਂ ਟੇਬਲ ਨੂੰ ਪੜ੍ਹਦਾ ਹੈ ਜੋ ਮਾਈਗ੍ਰੇਸ਼ਨ ਨੇ rename ਜਾਂ drop ਕਰ ਦਿੱਤਾ ਹੋਵੇ, ਜਿਸ ਨਾਲ deploy ਦੇ ਬਾਅਦ crash ਹੋ ਸਕਦੇ ਹਨ।
ਇੱਕ backfill ਜਾਂ index build CPU spike ਕਰਦਾ ਹੈ ਜਾਂ rows 'ਤੇ lock ਪਾਉਂਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਨਾਰਮਲ ਰਿਕਵੇਸਟ ਸਲੋ ਹੋ ਜਾਂਦੀਆਂ ਹਨ ਜਾਂ timeout ਹੋ ਜਾਂਦੇ ਹਨ।
ਇੱਕ "ਤੇਜ਼" constraint ਬਦਲਾਅ (ਜਿਵੇਂ NOT NULL) ਲਿਖਤਾਂ ਨੂੰ ਬਲੌਕ ਕਰ ਸਕਦਾ ਹੈ ਜਦੋਂ ਟੇਬਲ ਚੈਕ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।

ਭਾਵੇਂ ਕੋਡ ਠੀਕ ਹੋਵੇ, ਰਿਲੀਜ਼ timing ਅਤੇ ਵਰਜ਼ਨਾਂ ਦਰਮਿਆਨ compatibility ਦੀ ਸਮੱਸਿਆ ਕਾਰਨ ਰੁਕ ਜਾਂਦੇ ਹਨ।

ਬਿਨਾਂ-ਡਾਊਨਟਾਈਮ ਸਕੀਮਾ-ਬਦਲਾਅ ਦਾ ਮੁੱਖ ਨਿਯਮ ਇਹ ਹੈ: ਹਰ ਵਿਚਕਾਰਲਾ ਸਟੇਟ ਪੁਰਾਣੀ ਅਤੇ ਨਵੀਂ ਕੋਡ ਲਈ ਸੁਰੱਖਿਅਤ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਤੁਸੀਂ ਡਾਟਾਬੇਸ ਨੂੰ ਇਸ ਤਰ੍ਹਾਂ ਬਦਲਦੇ ਹੋ ਕਿ ਮੌਜੂਦਾ reads ਅਤੇ writes ਨਾ ਟੁੱਟਣ, ਐਸਾ ਕੋਡ ਸ਼ਿਪ ਕਰੋ ਜੋ ਦੋਹਾਂ ਸ਼ੇਪਾਂ ਨੂੰ ਸੰਭਾਲ ਸਕੇ, ਅਤੇ ਸਿਰਫ਼ ਉਸ وقت ਪੁਰਾਣੇ ਰਸਤੇ ਹਟਾਓ ਜਦੋਂ ਕਿਸੇ ਨੂੰ ਉਨ੍ਹਾਂ ਦੀ ਲੋੜ ਨਾ ਰਹੇ।

ਜਦੋਂ ਤੁਹਾਡੇ ਕੋਲ ਅਸਲ ਟਰੈਫਿਕ, ਕਾਫੀ ਸਖ਼ਤ SLAs, ਜਾਂ ਬਹੁਤ ਸਾਰੇ app instances ਅਤੇ workers ਹੁੰਦੇ ਹਨ ਤਾਂ ਇਹ ਵਾਧੂ ਕਦਮ ਕਰਨਾ ਲਾਭਦਾਇਕ ਹੁੰਦਾ ਹੈ। ਇਕ ਛੋਟੀ ਅੰਦਰੂਨੀ ਟੂਲ ਲਈ ਜਿਸਦਾ ਡਾਟਾਬੇਸ ਸ਼ਾਂਤ ਹੈ, ਇੱਕ ਨਿਯਤ maintenance window ਸਧਾਰਨ ਹੋ ਸਕਦਾ ਹੈ।

expand/contract ਨੂੰ ਆਮ ਭਾਸ਼ਾ ਵਿੱਚ

ਜ਼ਿਆਦਾਤਰ ਡਾਟਾਬੇਸ-ਕਾਮ ਤੋਂ ਹੋਣ ਵਾਲੀਆਂ ਘਟਨਾਵਾਂ ਇਸ ਕਰਕੇ ਹੁੰਦੀਆਂ ਹਨ ਕਿ ਐਪ ਸੋਚਦੀ ਹੈ ਕਿ ਡਾਟਾਬੇਸ ਤੁਰੰਤ ਬਦਲ ਜਾਵੇਗਾ, ਪਰ ਡਾਟਾਬੇਸ ਬਦਲਾਉਣ ਵਿੱਚ ਸਮਾਂ ਲਗਦਾ ਹੈ। expand/contract ਪੈਟਰਨ ਇਸ ਨੂੰ ਛੋਟੇ, ਸੁਰੱਖਿਅਤ ਕਦਮਾਂ ਵਿੱਚ ਵੰਡ ਕੇ ਇਸ ਤੋਂ ਬਚਦਾ ਹੈ।

ਇਕ ਛੋਟੇ ਸਮੇਂ ਲਈ ਤੁਹਾਡੀ ਸਿਸਟਮ ਦੋ "dialects" ਇਕੱਠੇ ਸਮਰਥਨ ਕਰਦੀ ਹੈ। ਤੁਸੀਂ ਪਹਿਲਾਂ ਨਵੀਂ ਸਟ੍ਰਕਚਰ ਲਿਆਉਂਦੇ ਹੋ, ਪੁਰਾਣੀ ਨੂੰ ਚਲਦਾ ਰੱਖਦੇ ਹੋ, ਡਾਟਾ gradually ਲਿਜਾ ਰਹੇ ਹੋ, ਫਿਰ ਸਾਫ਼ ਕਰਦੇ ਹੋ।

ਪੈਟਰਨ ਸਰਲ ਹੈ:

Expand: ਜੋ ਚਾਹੀਦਾ ਹੈ ਉਹ ਜੋੜੋ (ਕਾਲਮ, ਟੇਬਲ, ਇੰਡੈਕਸ) ਬਿਨਾਂ ਮੌਜੂਦਾ ਐਪ ਨੂੰ ਤੋਡ਼ੇ।
ਦੋ ਰਸਤੇ ਚਲਾਓ: ਐਸਾ ਕੋਡ ਡਿਪਲੌਇ ਕਰੋ ਜੋ ਪੁਰਾਣੀ ਅਤੇ ਨਵੀਂ ਸਟ੍ਰਕਚਰ ਦੋਹਾਂ ਨਾਲ ਕੰਮ ਕਰਦਾ ਹੈ ਤਾਂ ਜੋ ਮਿਕਸਡ ਵਰਜ਼ਨ ਵੀ ਠੀਕ ਕੰਮ ਕਰਨ।
Contract: ਜਦੋਂ ਸਭ ਕੁਝ ਨਵੇਂ ਰਸਤੇ ਵਰਤੇ ਜਾਂ, ਤਾਂ ਪੁਰਾਣੇ ਸਕੀਮਾ ਅਤੇ ਪੁਰਾਣੇ ਕੋਡ ਨੂੰ ਹਟਾਓ।

ਇਹ rolling deploys ਨਾਲ ਚੰਗਾ ਕੰਮ ਕਰਦਾ ਹੈ। ਜਦੋਂ ਤੁਸੀਂ 10 ਸਰਵਰ ਇੱਕ-ਇੱਕ ਕਰਕੇ ਅਪਡੇਟ ਕਰਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਥੋੜ੍ਹੇ ਸਮੇਂ ਲਈ ਪੁਰਾਣੇ ਅਤੇ ਨਵੇਂ ਵਰਜ਼ਨ ਇਕੱਠੇ ਚਲਾ ਰਹੇ ਹੋਂਗੇ। expand/contract ਦੌਰਾਨ ਦੋਹਾਂ ਨੂੰ ਇੱਕੋ ਹੀ ਡਾਟਾਬੇਸ ਨਾਲ ਦਰਮਿਆਨੀ ਸਟੇਟ ਵਿੱਚ ਸੁਰੱਖਿਅਤ ਰੱਖਦਾ ਹੈ।

ਇਹ rollbacks ਨੂੰ ਵੀ ਘੱਟ ਡਰਾਉਣਾ ਬਣਾਉਂਦਾ ਹੈ। ਜੇ ਨਵਾਂ ਰਿਲੀਜ਼ ਬੱਗ ਨਾਲ ਆਵੇ, ਤਾਂ ਤੁਸੀਂ ਐਪ ਨੂੰ rollback ਕਰ ਸਕਦੇ ਹੋ ਬਿਨਾਂ ਡਾਟਾਬੇਸ rollback ਕੀਤੇ, ਕਿਉਂਕਿ expand ਵਿੰਡੋ ਦੌਰਾਨ ਪੁਰਾਣੀਆਂ ਸਟ੍ਰਕਚਰਾਂ ਮੌਜੂਦ ਰਹਿੰਦੀਆਂ ਹਨ।

ਉਦਾਹਰਣ: ਤੁਸੀਂ PostgreSQL ਵਿੱਚ ਇੱਕ full_name ਕਾਲਮ ਨੂੰ first_name ਅਤੇ last_name ਵਿੱਚ ਵੰਡਣਾ ਚਾਹੁੰਦੇ ਹੋ। ਪਹਿਲਾਂ ਨਵੀਂ ਕਾਲਮਾਂ ਜੋੜੋ (expand), ਐਸਾ ਕੋਡ ਸ਼ਿਪ ਕਰੋ ਜੋ ਦੋਹਾਂ ਸਟਾਈਲਾਂ ਨੂੰ ਲਿਖ ਅਤੇ ਪੜ੍ਹ ਸਕੇ, ਪੁਰਾਣੇ ਰਿਕਾਰਡਾਂ ਨੂੰ backfill ਕਰੋ, ਫਿਰ full_name ਨੂੰ drop ਕਰੋ ਜਦੋਂ ਤੁਸੀਂ ਨिश्चਿੰਤ ਹੋ ਜਾਓ ਕਿ ਕੋਈ ਵੀ ਉਹਦੀ ਵਰਤੋਂ ਨਹੀਂ ਕਰ ਰਿਹਾ।

"Expand" ਆਮ ਤੌਰ 'ਤੇ ਕੀ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ

Expand ਫੇਜ਼ ਇਸ ਬਾਰੇ ਹੁੰਦਾ ਹੈ ਕਿ ਨਵੀਆੰ ਚੀਜ਼ਾਂ ਜੋੜੀਆਂ ਜਾਣ, ਨਾ ਕਿ ਪੁਰਾਣੀਆਂ ਹਟਾਈਆਂ ਜਾਣ।

ਆਮ ਪਹਿਲਾ ਕਦਮ ਨਵੀਂ ਕਾਲਮ ਜੋੜਨਾ ਹੁੰਦਾ ਹੈ। PostgreSQL ਵਿੱਚ ਆਮ ਤੌਰ 'ਤੇ ਇਹ safest ਹੁੰਦਾ ਹੈ ਕਿ ਕਾਲਮ nullable ਹੋਵੇ ਅਤੇ ਕੋਈ default ਨਾ ਰੱਖਿਆ ਜਾਵੇ। NOT NULL ਨਾਲ default ਜੋੜਨਾ ਟੇਬਲ rewrite ਜਾਂ ਭਾਰੀ locks ਕਰ ਸਕਦਾ ਹੈ, ਇਸ ਲਈ ਇੱਕ ਸੁਰੱਖਿਅਤ ਕ੍ਰਮ ਹੈ: nullable ਜੋੜੋ, tolerant ਕੋਡ ਡਿਪਲੌਇ ਕਰੋ, backfill ਕਰੋ, ਫਿਰ ਬਾਅਦ ਵਿੱਚ NOT NULL ਲਗਾਓ।

ਇੰਡੈਕਸਾਂ ਨੂੰ ਵੀ ਧਿਆਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਆਮ ਇੰਡੈਕਸ ਬਣਾਉਣਾ ਲਿਖਤਾਂ ਨੂੰ ਉਮੀਦ ਤੋਂ ਵੱਧ ਸਮੇਂ ਲਈ بلاک ਕਰ ਸਕਦਾ ਹੈ। ਜਦੋਂ ਸਕੇ, concurrent index creation ਵਰਤੋਂ ਤਾਂ ਕਿ reads ਅਤੇ writes ਚਲਦੇ ਰਹਿਣ। ਇਹ ਲੰਬਾ ਲੈਂਦਾ ਹੈ, ਪਰ release-ਰੋਕਣ ਵਾਲੇ lock ਤੋਂ ਬਚਾਉਂਦਾ ਹੈ।

Expand ਦਾ ਮਤਲਬ ਨਵੀਆਂ ਟੇਬਲਾਂ ਜੋੜਨਾ ਵੀ ਹੋ ਸਕਦਾ ਹੈ। ਜੇ ਤੁਸੀਂ ਇੱਕ single column ਤੋਂ many-to-many ਰਿਸ਼ਤਾ ਵੱਲ ਜਾ ਰਹੇ ਹੋ ਤਾਂ join table ਜੋੜੋ ਅਤੇ ਪੁਰਾਣਾ ਕਾਲਮ ਜਗ੍ਹਾ ਤੇ ਰੱਖੋ। ਪੁਰਾਣਾ ਰਸਤਾ ਚਲਦਾ ਰਹੇਗਾ ਅਤੇ ਨਵਾਂ ਰਚਨਾ ਡਾਟਾ ਇਕੱਠਾ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰੇਗੀ।

ਅਮਲ ਵਿੱਚ, expand ਅਕਸਰ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ:

ਨਵੀਆਂ nullable ਕਾਲਮਾਂ ਜਾਂ ਨਵੀਆਂ ਟੇਬਲਾਂ ਨੂੰ ਮੌਜੂਦਾ ਨਾਲ ਨਾਲ ਜੋੜਨਾ
ਜਦੋਂ ਸੰਭਵ ਹੋ concurrent ਜਾਂ non-blocking ਤਰੀਕੇ ਨਾਲ ਇੰਡੈਕਸ ਜੋੜਨਾ
ਨਵੀਂ ਪੜ੍ਹਾਈ ਜਾਂ ਲਿਖਾਈ ਕਦੋਂ ਚਾਲੂ ਹੋਵੇ ਇਹ ਨਿਯੰਤ੍ਰਿਤ ਕਰਨ ਲਈ feature flags ਵਰਤਣਾ
ਜਰੂਰਤ ਪੈਣ 'ਤੇ ਦੋਨਾਂ ਥਾਂ ਲਿਖਣਾ (dual-write)
ਪੜ੍ਹਾਈ ਨੂੰ backward compatible ਰੱਖਣਾ (ਪੁਰਾਣਾ, ਨਵਾਂ, ਜਾਂ fallback)

Expand ਤੋਂ ਬਾਅਦ, ਪੁਰਾਣੇ ਅਤੇ ਨਵੇਂ ਐਪ ਵਰਜ਼ਨ ਇਕੱਠੇ ਚੱਲ ਸਕਣੇ ਚਾਹੀਦੇ ਹਨ ਬਿਨਾਂ ਅਚਾਨਕ ਸਮੱਸਿਆਵਾਂ ਦੇ।

ਐਸਾ ਕੋਡ ਡਿਪਲੌਇ ਕਰਨਾ ਜੋ compatible ਰਹੇ

ਜਿਆਦਾਤਰ ਰਿਲੀਜ਼ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਮੱਧ ਵਿੱਚ ਹੁੰਦੀਆਂ ਹਨ: ਕੁਝ ਸਰਵਰ ਨਵਾਂ ਕੋਡ ਚਲਾ ਰਹੇ ਹੁੰਦੇ ਹਨ, ਹੋਰ ਪੁਰਾਣਾ, ਤੇ ਡਾਟਾਬੇਸ ਪਹਿਲਾਂ ਹੀ ਬਦਲ ਰਿਹਾ ਹੁੰਦਾ ਹੈ। ਤੁਹਾਡਾ ਲਕਸ਼ ਸਿੱਧਾ ਹੈ: ਰੋਲਆਊਟ ਵਿੱਚ ਕੋਈ ਵੀ ਵਰਜ਼ਨ ਦੋਹਾਂ—ਪੁਰਾਣੇ ਅਤੇ expanded—ਸਕੀਮਾ ਨਾਲ ਕੰਮ ਕਰ ਸਕੇ।

ਆਮ ਤਰੀਕਾ dual-write ਹੈ। ਜੇ ਤੁਸੀਂ ਨਵੀਂ ਕਾਲਮ ਜੋੜਦੇ ਹੋ, ਨਵੀਂ ਐਪ ਦੋਨਾਂ ਕਾਲਮਾਂ ਵਿੱਚ ਲਿਖਦੀ ਹੈ। ਪੁਰਾਣੇ ਐਪ ਵਰਜ਼ਨ ਸਿਰਫ ਪੁਰਾਣੇ ਵਿੱਚ ਹੀ ਲਿਖਦੇ ਰਹਿੰਦੇ ਹਨ, ਜੋ ਠੀਕ ਹੈ ਕਿਉਂਕਿ ਉਹ ਕਾਲਮ ਮੌਜੂਦ ਹੈ। ਪਹਿਲਾਂ ਨਵੀਂ ਕਾਲਮ optional ਰੱਖੋ, ਅਤੇ ਸਖ਼ਤ constraints ਨੂੰ ਦੇਰ ਨਾਲ ਲਗਾਓ ਜਦੋਂ ਤੱਕ ਸਾਰੇ writers ਅਪਗਰੇਡ ਨਾ ਹੋ ਜਾਣ।

ਪੜ੍ਹਾਈ ਆਮ ਤੌਰ 'ਤੇ ਲਿਖਾਈ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਹੌਲੇ ਸਵਿੱਚ ਹੁੰਦੀ ਹੈ। ਇਕ ਸਮੇਂ ਲਈ ਪੁਰਾਣੀ ਕਾਲਮ 'ਤੇ ਪੜ੍ਹਾਈ ਰਹੇ (ਜੋ ਪੂਰੀ ਤਰ੍ਹਾਂ ਭਰੀ ਹੋਈ ਹੋਵੇ)। backfill ਅਤੇ ਵੈਰੀਫਿਕੇਸ਼ਨ ਤੋਂ ਬਾਅਦ, ਪੜ੍ਹਾਈ ਨੂੰ ਨਵੀਂ ਕਾਲਮ ਨੂੰ ਪ੍ਰਾਥਮਿਕਤਾ ਦਿਓ ਪਰ fallback ਰੱਖੋ ਜੇ ਨਵੀਂ ਮੁਕੰਮਲ ਨਹੀਂ।

ਆਪਣੇ API ਆਊਟਪੁੱਟ ਨੂੰ ਵੀ ਸਥਿਰ ਰੱਖੋ ਜਦੋਂ ਡਾਟਾਬੇਸ ਅਧੀਨ ਬਦਲ ਰਿਹਾ ਹੋਵੇ। ਭਾਵੇਂ ਤੁਸੀਂ ਅੰਦਰੂਨੀ ਤੌਰ 'ਤੇ ਨਵਾਂ ਫੀਲਡ ਜੋੜੋ, ਪਰ ਰਿਸਪਾਂਸ ਸ਼ੇਪਾਂ ਨੂੰ ਬਦਲਣ ਤੋਂ ਬਚੋ ਜਦ ਤੱਕ ਸਾਰੇ consumers ਤਿਆਰ ਨਾ ਹੋਣ (web, mobile, integrations)।

Rollback-friendly rollout ਇੱਕ ਆਮ ਰੂਪ ਵਿੱਚ ਅਜਿਹਾ ਹੁੰਦਾ ਹੈ:

Release 1: ਨਵੀਂ ਕਾਲਮ ਜੋੜੋ ਅਤੇ ਐਸਾ ਕੋਡ ਸ਼ਿਪ ਕਰੋ ਜੋ ਪੁਰਾਣੇ ਡਾਟਾ ਨੂੰ ਪੜ੍ਹ ਸਕੇ ਅਤੇ ਦੋਨਾਂ ਕਾਲਮਾਂ ਵਿੱਚ ਲਿਖ ਸਕੇ।
Release 2: ਮੌਜੂਦਾ rows ਨੂੰ backfill ਕਰੋ, ਫਿਰ ਐਸਾ ਕੋਡ ਸ਼ਿਪ ਕਰੋ ਜੋ ਨਵੀਂ ਕਾਲਮ ਨੂੰ ਤਰਜੀਹ ਦੇਵੇ ਪਰ fallback ਕਰ ਸਕੇ।
Release 3: ਪੁਰਾਣੇ ਕਾਲਮ ਵਿੱਚ ਲਿਖਣਾ ਰੋਕੋ (ਪਰ ਉਹ ਮੌਜੂਦ ਰਹੇ)।
Release 4: ਪੁਰਾਣੀਆਂ ਪੜ੍ਹਾਈਆਂ ਹਟਾਓ, ਫਿਰ ਪੁਰਾਣਾ ਕਾਲਮ drop ਕਰੋ।

ਮੁੱਖ ਵਿਚਾਰ ਇਹ ਹੈ ਕਿ ਪਹਿਲਾ irreversible ਕਦਮ ਪੁਰਾਣੇ ਸਟ੍ਰਕਚਰ ਨੂੰ drop ਕਰਨਾ ਹੈ, ਇਸ ਲਈ ਤੁਸੀਂ ਇਹ ਅੰਤ ਤੱਕ ਮੁਲਤਵੀ ਰੱਖਦੇ ਹੋ।

DB ਨੂੰ ਬਿਨਾ ਓਵਰਲੋਡ ਕੀਤੇ backfill ਕਰਨਾ

Snapshot before schema work

Capture a snapshot before risky changes so you can revert quickly if needed.

Use Snapshots

Backfilling ਉਹ ਥਾਂ ਹੈ ਜਿੱਥੇ ਬਹੁਤ ਸਾਰੇ "ਬਿਨਾਂ-ਡਾਊਨਟਾਈਮ" ਸਕੀਮਾ-ਬਦਲਾਅ ਗਲਤ ਹੋ ਜਾਂਦੇ ਹਨ। ਤੁਸੀਂ ਮੌਜੂਦਾ rows ਲਈ ਨਵੀਂ ਕਾਲਮ ਭਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਬਿਨਾਂ ਲੰਬੇ locks, ਸਲੋ ਕੁਇਰੀਆਂ, ਜਾਂ ਅਚਾਨਕ ਲੋਡ spikes ਦੇ।

Batching ਮਹੱਤਵਪੂਰਨ ਹੈ। ਐਸੇ batches ਲਛੋ ਜੋ ਛੇਤੀ ਖਤਮ ਹੋਣ (ਸੈਕਿੰਡਾਂ, ਮਿੰਟਾਂ ਨਹੀਂ)। ਜੇ ਹਰ batch ਛੋਟਾ ਹੈ ਤਾਂ ਤੁਸੀਂ ਜੌਬ ਨੂੰ ਰੋਕ ਸਕਦੇ ਹੋ, ਮੁੜ ਚਲਾ ਸਕਦੇ ਹੋ, ਅਤੇ ਬਿਨਾਂ ਰਿਲੀਜ਼ ਰੋਕਣ tune ਕਰ ਸਕਦੇ ਹੋ।

ਪ੍ਰਗਤੀ ਟਰੈਕ ਕਰਨ ਲਈ stable cursor ਵਰਤੋਂ। PostgreSQL ਵਿੱਚ ਇਹ ਆਮ ਤੌਰ 'ਤੇ primary key ਹੁੰਦੀ ਹੈ। rows ਨੂੰ order ਵਿੱਚ process ਕਰੋ ਅਤੇ ਆਖਰੀ id ਜੋ ਤੁਸੀਂ ਮੁਕੰਮਲ ਕੀਤਾ ਉਹ ਸਟੋਰ ਕਰੋ, ਜਾਂ id ranges ਵਿੱਚ ਕੰਮ ਕਰੋ। ਇਸ ਨਾਲ ਜੌਬ ਦੁਬਾਰਾ ਸ਼ੁਰੂ ਹੋਣ 'ਤੇ ਮਹਿੰਗੀਆਂ full-table scans ਤੋਂ ਬਚਿਆ ਜਾ ਸਕਦਾ ਹੈ।

ਇੱਥੇ ਇੱਕ ਸਧਾਰਣ ਪੈਟਰਨ ਹੈ:

UPDATE my_table
SET new_col = ...
WHERE new_col IS NULL
  AND id > $last_id
ORDER BY id
LIMIT 1000;

ਅਪਡੇਟ ਨੂੰ conditional ਬਣਾਓ (ਉਦਾਹਰਨ ਵਜੋਂ, WHERE new_col IS NULL) ਤਾਂ ਕਿ ਜੌਬ idempotent ਹੋਵੇ। ਰੀਰਨਾਂ ਸਿਰਫ ਉਹੀ rows ਛੁਹਣ ਜੋ ਅਜੇ ਵੀ ਕੰਮ ਦੀ ਲੋੜ ਹਨ, ਜਿਸ ਨਾਲ ਫਜੂਲ ਲਿਖਤ ਘੱਟ ਹੁੰਦੀ ਹੈ।

ਨਵਾਂ ਡਾਟਾ backfill ਦੌਰਾਨ ਆ ਰਿਹਾ ਹੋਵੇ ਇਹ ਮੰਨ ਕੇ ਚਲੋ। ਆਮ ਕ੍ਰਮ ਇਹ ਹੈ:

ਪਹਿਲਾਂ application code update ਕਰੋ ਤਾਂ ਕਿ ਨਵੀਆਂ ਲਿਖਤਾਂ ਵੀ ਨਵੀਂ ਫੀਲਡ ਨੂੰ populate ਕਰਨ।
ਪੁਰਾਣੇ rows ਨੂੰ batches ਵਿੱਚ backfill ਕਰੋ।
ਇੱਕ ਛੋਟਾ catch-up loop ਚਲਾਓ ਜੋ ਹਾਲੀਆ rows ਨੂੰ ਦੁਬਾਰਾ ਚੈੱਕ ਕਰੇ।
ਜੇ ਜ਼ਰੂਰੀ ਹੋਵੇ ਤਾਂ guardrail (ਜਿਵੇਂ trigger ਜਾਂ default) ਜੋ NULLs ਨੂੰ ਰੋਕੇ, ਜੋੜੋ।

ਇੱਕ ਵਧੀਆ backfill ਨਿਵੜਿਆ ਹੋਇਆ ਹੁੰਦਾ ਹੈ: ਸਥਿਰ, ਮਾਪਯੋਗ, ਅਤੇ ਢੰਗ ਨਾਲ ਰੋਕਣ ਯੋਗ ਜੇ DB ਗਰਮ ਹੋਵੇ।

ਯਕੀਨੀ ਬਣਾਉਣਾ ਕਿ ਮਾਈਗ੍ਰੇਸ਼ਨ ਵਾਕਈ ਮੁਕੰਮਲ ਹੈ

ਸਭ ਤੋਂ ਖਤਰਨਾਕ ਮੋਹੜਾ ਨਵੀਂ ਕਾਲਮ ਜੋੜਣਾ ਨਹੀਂ, ਸਗੋਂ ਇਹ ਫੈਸਲਾ ਕਰਨਾ ਹੈ ਕਿ ਹੁਣ ਤੁਸੀਂ ਉਸ 'ਤੇ ਨਿਰਭਰ ਹੋ ਸਕਦੇ ਹੋ।

Contract ਵੱਲ ਜਾਣ ਤੋਂ ਪਹਿਲਾਂ ਦੋ ਗੱਲਾਂ ਸਾਬਤ ਕਰੋ: ਨਵਾਂ ਡਾਟਾ ਮੁਕੰਮਲ ਹੈ, ਅਤੇ ਪ੍ਰੋਡਕਸ਼ਨ ਨੇ ਉਸ ਨੂੰ ਸੁਰੱਖਿਅਤ ਤਰੀਕੇ ਨਾਲ ਪੜ੍ਹਿਆ ਹੈ।

ਸ਼ੁਰੂਆਤ ਕਰੋ completeness checks ਨਾਲ ਜੋ ਤੇਜ਼ ਅਤੇ ਦੁਹਰਾਏ ਜਾ ਸਕਣ:

ਯਕੀਨੀ ਕਰੋ ਨਵੀਂ ਕਾਲਮ ਵਿੱਚ ਅਣਉਮੀਦਤ NULLs ਨਾ ਹੋਣ।
ਜਿੰਨੀਆਂ rows eligible ਸਨ ਉਹਨਾਂ ਦੀ ਗਿਣਤੀ ਬਨਾਮ ਭਰੀਆਂ ਕਿਤ ਛੋਣੀ ਹੋਈ।
ਕੁਝ IDs ਦੀ spot-check ਕਰੋ ਅਤੇ old vs new values ਤੁਲਨਾ ਕਰੋ।
edge cases ਟੈਸਟ ਕਰੋ (empty strings, zero, ਬਹੁਤ ਪੁਰਾਣੇ ਰਿਕਾਰਡ)।
ਇੱਕ ਵਾਰ ਫੇਰ checks ਚਲਾਓ ਤਾਂ ਕਿ ਕੁਝ drift ਨਾ ਹੋਵੇ।

ਜੇ ਤੁਸੀਂ dual-writing ਕਰ ਰਹੇ ਹੋ ਤਾਂ silent bugs ਪਕੜਨ ਲਈ ਇਕ consistency check ਜੋੜੋ। ਉਦਾਹਰਨ ਵਜੋਂ, ਘੰਟਾਵਾਰ ਇੱਕ query ਚਲਾਓ ਜੋ ਉਹ rows ਲੱਭੇ ਜਿਨ੍ਹਾਂ old_value <> new_value ਹਨ ਅਤੇ alert ਕਰੋ ਜੇ ਇਹ ਜ਼ੀਰੋ ਨਾ ਹੋਵੇ। ਇਹ ਆਮ ਤੌਰ 'ਤੇ ਤੁਰੰਤ ਖ਼ਬਰ ਪਾਉਣ ਦਾ ਤਰੀਕਾ ਹੈ ਕਿ ਕੋਈ writer ਸਿਰਫ ਪੁਰਾਣੇ ਕਾਲਮ ਨੂੰ ਅਪਡੇਟ ਕਰ ਰਿਹਾ ਹੈ।

ਜਿਨ੍ਹਾਂ ਕੋਡ ਪਾਥਾਂ ਨੇ ਨਵੀਂ ਕਾਲਮ ਪੜ੍ਹਨੀ ਸ਼ੁਰੂ ਕੀਤੀ ਹੈ ਉਹਨਾਂ ਦੇ error rates ਅਤੇ query time ਵੇਖੋ, ਖ਼ਾਸ ਕਰਕੇ deploy ਦੇ ਬਾਅਦ।

ਦੋ ਰਸਤੇ ਕਿੰਨੇ ਸਮੇਂ ਰੱਖਣੇ? ਘੱਟੋ-ਘੱਟ ਇੱਕ ਪੂਰਾ release cycle ਅਤੇ ਇੱਕ backfill rerun ਬਚਾਉਣ ਲਈ ਕਾਫੀ। ਕਈ ਟੀਮਾਂ 1-2 ਹਫ਼ਤੇ ਜਾਂ ਤੱਕ ਰੱਖਦੀਆਂ ਹਨ, ਜਾਂ ਜਦ ਤੱਕ ਉਹ ਯਕੀਨ ਨਾ ਕਰ ਲੈਣ ਕਿ ਕੋਈ ਪੁਰਾਣਾ app ਵਰਜ਼ਨ ਦੌੜ ਰਿਹਾ ਨਹੀਂ।

Contract ਫੇਜ਼: ਪੁਰਾਣੇ ਰਸਤੇ ਨੂੰ ਹਟਾਉਣਾ

Contract ਉਹ ਥਾਂ ਹੈ ਜਿੱਥੇ ਟੀਮਾਂ ਨਰਭੇਗੀ ਮਹਿਸੂਸ ਕਰਦੀਆਂ ਹਨ ਕਿਉਂਕਿ ਇਹ point-of-no-return ਵਾਂਗ ਲੱਗਦਾ ਹੈ। ਜੇ expand ਠੀਕ ਕੀਤਾ ਗਿਆ ਹੋਇਆ ਤਾਂ contract ਜ਼ਿਆਦातर ਸਾਫ਼-ਸਫ਼ਾਈ ਹੁੰਦੀ ਹੈ, ਅਤੇ ਤੁਸੀਂ ਇਸਨੂੰ ਵੀ ਛੋਟੇ, ਘੱਟ-ਜੋਖਮ ਵਾਲੇ ਕਦਮਾਂ ਵਿੱਚ ਕਰ ਸਕਦੇ ਹੋ।

ਮੋਮੈਂਟ ਚੁਣੋ ਧਿਆਨ ਨਾਲ। backfill ਖਤਮ ਹੋਣ ਤੁਰੰਤ ਬਾਅਦ ਕੁਝ ਵੀ drop ਨਾ ਕਰੋ। ਘੱਟੋ-ਘੱਟ ਇੱਕ ਪੂਰਾ release cycle ਰੁਕੋ ਤਾਂ ਕਿ delayed jobs ਅਤੇ edge cases ਆ ਸਕਣ।

ਇੱਕ ਸੁਰੱਖਿਅਤ contract ਕ੍ਰਮ ਆਮ ਤੌਰ 'ਤੇ ਇਹ ਹੁੰਦਾ ਹੈ:

Dual-write ਰੋਕੋ ਅਤੇ ਯਕੀਨ ਕਰੋ ਨਵੀਂ ਲਿਖਤਾਂ ਸਿਰਫ ਨਵੀਂ ਕਾਲਮ(ਾਂ) ਵਿੱਚ ਆ ਰਹੀਆਂ ਹਨ।
ਐਪから old reads ਹਟਾਓ ਤਾਂ ਕਿ fallback ਖਤਮ ਹੋ ਜਾਵੇ।
dead code paths, feature flags, ਅਤੇ background jobs ਜੋ ਪੁਰਾਣੇ ਸਕੀਮਾ ਨੂੰ refer ਕਰਦੀਆਂ ਨੇ, ਹਟਾਓ।
ਅਸਥਾਈ triggers, sync jobs, ਜਾਂ compatibility views ਹਟਾਓ।
ਪੁਰਾਣੇ ਇੰਡੈਕਸਾਂ ਅਤੇ constraints ਨੂੰ drop ਕਰੋ, ਫਿਰ ਪੁਰਾਣਾ ਕਾਲਮ drop ਕਰੋ।

ਜੇ ਸੰਭਵ ਹੋਵੇ ਤਾਂ contract ਨੂੰ ਦੋ releases ਵਿੱਚ ਵੰਡੋ: ਇੱਕ ਜੋ ਕੋਡ reference ਹਟਾਏ (ਨਾਲ extra logging), ਅਤੇ ਦੂਜਾ ਜਿਸ ਵਿੱਚ ਡਾਟਾਬੇਸ objects ਹਟਾਏ ਜਾਣ। ਇਹ ਵੰਡ rollback ਅਤੇ troubleshooting ਨੂੰ ਬਹੁਤ ਆਸਾਨ ਬਣਾਉਂਦੀ ਹੈ।

PostgreSQL ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਇੱਥੇ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਕਾਲਮ ਡ੍ਰੌਪ ਕਰਨਾ ਆਮ ਤੌਰ 'ਤੇ metadata change ਹੁੰਦੀ ਹੈ, ਪਰ ਇਹ ਵੀ ACCESS EXCLUSIVE lock ਲਈ ਸਕਦੀ ਹੈ ਥੋੜ੍ਹੇ ਸਮੇਂ ਲਈ। ਇੱਕ ਸ਼ਾਂਤ ਵਿੰਡੋ ਦੀ ਯੋਜਨਾ ਬਣਾਓ ਅਤੇ ਮਾਈਗ੍ਰੇਸ਼ਨ ਨੂੰ ਤੇਜ਼ ਰੱਖੋ। ਜੇ ਤੁਸੀਂ extra indexes ਬਣਾਏ ਸਨ ਤਾਂ ਉਹਨਾਂ ਨੂੰ DROP INDEX CONCURRENTLY ਨਾਲ ਹਟਾਉਣਾ ਪਸੰਦ ਕਰੋ ਤਾਂ ਕਿ writes ਨੂੰ block ਨਾ ਕਰੇ (ਇਹ transaction block ਵਿੱਚ ਨਹੀਂ ਚੱਲ ਸਕਦਾ, ਇਸ ਲਈ ਤੁਹਾਡੀ migration tooling ਨੂੰ ਇਸਨੂੰ support ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ)।

ਆਮ ਗਲਤੀਆਂ ਅਤੇ ਜ਼ਾਲ

Export the generated source

Keep full ownership by exporting the source code after your migration workflow is set.

Export Code

Zero-downtime migrations ਫੇਲ ਹੁੰਦੇ ਹਨ ਜਦੋਂ ਡਾਟਾਬੇਸ ਅਤੇ ਐਪ ਇਸ ਗੱਲ 'ਤੇ ਸਹਿਮਤ ਨਹੀਂ ਰਹਿ ਜਾਂਦੇ ਕਿ ਕੀ ਮਨਜ਼ੂਰ ਹੈ। ਇਹ ਪੈਟਰਨ तभी ਕੰਮ ਕਰਦਾ ਹੈ ਜਦੋਂ ਹਰ ਵਿਚਕਾਰਲਾ ਸਟੇਟ ਦੋਹਾਂ—ਪੁਰਾਣੀ ਅਤੇ ਨਵੀਂ—ਕੋਡ ਲਈ ਸੁਰੱਖਿਅਤ ਹੋਵੇ।

ਉਹ ਜ਼ਾਲ ਜੋ production ਤੋੜ ਦਿੰਦੀਆਂ ਹਨ

ਇਹ ਗਲਤੀਆਂ ਅਕਸਰ ਨਜ਼ਰ ਆਉਂਦੀਆਂ ਹਨ:

NOT NULL ਬਹੁਤ ਜਲਦੀ ਘੜਨਾ, ਜਦੋਂ ਇਕ ਪੁਰਾਣਾ ਵਰਜ਼ਨ ਅਜੇ ਵੀ ਉਹ ਨਵੀਂ ਫੀਲਡ ਦੇ ਬਿਨਾਂ rows ਲਿਖ ਰਿਹਾ ਹੋਵੇ।
ਇੱਕ ਵੱਡੀ ਟੇਬਲ ਨੂੰ ਇੱਕ ਹੀ ਟ੍ਰਾਂਜ਼ੈਕਸ਼ਨ ਵਿੱਚ backfill ਕਰ ਦينا, ਜਿਸ ਨਾਲ locks, table bloat, ਅਤੇ timeouts ਹੋ ਸਕਦੇ ਹਨ।
default ਨੂੰ free ਮੰਨਣਾ। ਕੁਝ PostgreSQL ਵਰਜਨਾਂ ਵਿੱਚ defaults table rewrite trigger ਕਰ ਸਕਦੇ ਹਨ।
writes ਨਵੀਂ ਕਾਲਮ ਨੂੰ reliably populate ਕਰ ਰਹੇ ਹੋਣ ਤੋਂ ਪਹਿਲਾਂ reads ਨੂੰ ਨਵੇਂ ਕਾਲਮ 'ਤੇ switch ਕਰ ਦੇਣਾ।
ਹੋਰਨਾਂ writers ਅਤੇ readers (cron jobs, workers, exports, reporting queries) ਨੂੰ ਭੁੱਲ ਜਾਣਾ।

ਇੱਕ ਹਕੀਕਤੀ ਸੈਨਾਰਿਓ: ਤੁਸੀਂ API ਤੋਂ full_name ਲਿੱਕ ਰਿਹਾ/ਲਿਖ ਰਿਹਾ ਹੋ, ਪਰ ਇੱਕ background job ਜੋ users ਬਣਾਉਂਦਾ ਹੈ ਉਹ ਹਾਲੇ ਵੀ ਸਿਰਫ first_name ਅਤੇ last_name ਸੈੱਟ ਕਰਦਾ ਹੈ। ਇਹ ਰਾਤ ਨੂੰ ਚੱਲਦਾ ਹੈ, rows insert ਕਰਦਾ ਹੈ ਜਿਸ ਵਿੱਚ full_name = NULL ਹੁੰਦਾ ਹੈ, ਅਤੇ ਬਾਅਦ ਵਿੱਚ ਕੋਡ assume ਕਰਦਾ ਹੈ ਕਿ full_name ਹਮੇਸ਼ਾਂ ਮੌਜੂਦ ਹੈ।

ਮਿਡ-ਮਾਈਗ੍ਰੇਸ਼ਨ 'ਚ ਫਸਣ ਤੋਂ ਕਿਵੇਂ ਬਚੀਏ

ਹਰ ਕਦਮ ਨੂੰ ਇੱਕ release ਵਾਂਗ ਕਰਵਾਓ ਜੋ ਦਿਨਾਂ ਲਈ ਚਲ ਸਕਦਾ ਹੈ:

transition ਦੌਰਾਨ ਨਵੀਂ ਕਾਲਮ nullable ਰੱਖੋ, ਅਤੇ ਪਹਿਲਾਂ code ਵਿੱਚ "required" enforce ਕਰੋ।
ਛੋਟੇ batches ਵਿੱਚ backfill ਕਰੋ ਜੋ ਰੋਕਣ ਯੋਗ ਹੋਣ ਅਤੇ DB load 'ਤੇ ਨਜ਼ਰ ਰੱਖੋ।
ਕੋਡ tolerant ਬਣਾਓ: ਦੋ ਰਸਤਾ ਪੜ੍ਹੋ, ਜਰੂਰਤ ਪੈਣ 'ਤੇ ਦੋਹਾਂ ਵਿੱਚ ਲਿਖੋ, missing values ਸੰਭਾਲੋ।
ਉਸ ਨੇੜੇ ਸਾਰਿਆਂ ਥਾਵਾਂ ਦੀ audit ਕਰੋ ਜੋ table ਨੂੰ ਛੁਹਦੇ ਹਨ, workers ਅਤੇ reporting ਸਮੇਤ।

ਹਰ ਰਿਲੀਜ਼ ਤੋਂ ਪਹਿਲਾਂ ਇੱਕ ਤੇਜ਼ ਚੈੱਕਲਿਸਟ

ਇੱਕ ਦੁਹਰਾਏ ਜਾਣ ਵਾਲੀ ਚੈੱਕਲਿਸਟ ਤੁਹਾਨੂੰ ਐਸਾ ਕੋਡ ship ਕਰਨ ਤੋਂ ਰੋਕਦੀ ਹੈ ਜੋ ਕੇਵਲ ਇਕ ਡਾਟਾਬੇਸ ਸਟੇਟ 'ਤੇ ਕੰਮ ਕਰਦਾ ਹੋਵੇ।

ਡਿਪਲੌਇ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ, ਪੱਕਾ ਕਰੋ ਕਿ ਡਾਟਾਬੇਸ ਵਿੱਚ ਪਹਿਲਾਂ ਹੀ expanded pieces ਮੌਜੂਦ ਹਨ (ਨਵੀਆਂ ਕਾਲਮ/ਟੇਬਲ, low-lock ਤਰੀਕੇ ਨਾਲ ਬਣਾਈਆਂ ਇੰਡੈਕਸ)। ਫਿਰ ਯਕੀਨ ਕਰੋ ਕਿ ਐਪ tolerant ਹੈ: ਇਹ old shape, expanded shape, ਅਤੇ half-backfilled ਸਟੇਟ ਦੋਹਾਂ ਨਾਲ ਕੰਮ ਕਰ ਸਕਦੀ ਹੈ।

ਚੈੱਕਲਿਸਟ ਛੋਟੀ ਰੱਖੋ:

Expansion is present: ਨਵੀਂ schema objects ਮੌਜੂਦ ਹਨ ਅਤੇ ਘੱਟ-ਲੌਕ ਤਰੀਕੇ ਨਾਲ ਜੋੜੇ ਗਏ ਸਨ।
Compatibility is real: ਐਪ old ਅਤੇ expanded schema ਨਾਲ ਕੰਮ ਕਰਦੀ ਹੈ, workers ਅਤੇ admin paths ਸਮੇਤ।
Backfill is controlled: ਛੋਟੇ batches, pause/resume ਯੋਗ, basic progress metrics ਨਾਲ।
Read switch is planned: ਤੁਸੀਂ ਪੂਰੀ ਤਰ੍ਹਾਂ ਜਾਣਦੇ ਹੋ ਕਿ ਪੜ੍ਹਾਈ ਕਦੋਂ move ਹੋ ਰਹੀ ਹੈ ਅਤੇ ਜੇ ਨਤੀਜੇ ਗਲਤ ਲੱਗਣ 'ਤੇ rollback ਕਿਵੇਂ ਕਰਨਾ ਹੈ।
Contract is delayed: ਤੁਸੀਂ ਪੁਰਾਣੀਆਂ objects drop ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਇੱਕ ਜਾਂ ਦੋ release cycles ਰੁਕਦੇ ਹੋ।

ਇੱਕ ਮਾਈਗ੍ਰੇਸ਼ਨ ਤਦ ਹੀ ਮੁਕੰਮਲ ਮੰਨੀ ਜਾਂਦੀ ਹੈ ਜਦੋਂ reads ਨਵੀਂ ਡਾਟਾ ਵਰਤ ਰਹੇ ਹਨ, writes ਪੁਰਾਣੀ ਡਾਟਾ ਨੂ ਰੱਖਣਾ ਬੰਦ ਕਰ ਚੁੱਕੇ ਹਨ, ਅਤੇ ਤੁਸੀਂ backfill ਦੀ ਘੱਟੋ-ਘੱਟ ਇੱਕ ਸਧਾਰਣ ਜਾਂਚ (ਗਿਣਤੀ ਜਾਂ sample) ਨਾਲ verification ਕਰ ਲਿਆ ਹੈ।

ਇੱਕ ਹਕੀਕਤੀ ਉਦਾਹਰਣ: ਬਿਨਾਂ ਡਾਊਨਟਾਈਮ ਦੇ ਇੱਕ ਕਾਲਮ ਬਦਲੋ

Add dual-write safely

Build the dual-write and fallback logic into your app from day one.

Start Building

ਮੰਨੋ ਤੁਹਾਡੇ ਕੋਲ ਇੱਕ PostgreSQL table customers ਹੈ ਜਿਸ ਵਿੱਚ phone ਕਾਲਮ ਨੇ ਬੇਰੂਲੇ ਫਾਰਮੈਟ ਰੱਖੇ ਹੋਏ ਹਨ (ਵੱਖ-ਵੱਖ ਫਾਰਮੈਟ, ਕਈ ਵਾਰੀ ਖਾਲੀ)। ਤੁਸੀਂ ਇਸਨੂੰ phone_e164 ਨਾਲ ਬਦਲਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਪਰ ਰਿਲੀਜ਼ ਨੂੰ ਰੋਕਣਾ ਜਾਂ ਐਪ ਡਾਊਨ ਕਰਨਾ ਨੀ ਚਾਹੁੰਦੇ।

ਇੱਕ ਸਾਫ਼ expand/contract ਕ੍ਰਮ ਇਸ ਤਰ੍ਹਾਂ ਲੱਗਦਾ ਹੈ:

Expand: phone_e164 ਨੂੰ nullable ਦੇ ਤੌਰ 'ਤੇ ਜੋੜੋ, ਕੋਈ default ਨਾ ਰੱਖੋ, ਅਤੇ ਹੁਣੇ ਸਖ਼ਤ constraints ਨਾ ਲਗਾਓ।
Compatible deploy: ਕੋਡ ਅਪਡੇਟ ਕਰੋ ਤਾਂ ਕਿ ਦੋਨਾਂ phone ਅਤੇ phone_e164 ਵਿੱਚ ਲਿਖਿਆ ਜਾਵੇ, ਪਰ reads phone 'ਤੇ ਹੀ ਰੱਖੋ ਤਾਂ ਕਿ ਯੂਜ਼ਰਾਂ ਲਈ ਕੁਝ ਬਦਲੇ ਨਾ।
Backfill: ਮੌਜੂਦਾ rows ਨੂੰ ਛੋਟੇ batches (ਉਦਾਹਰਨ ਵਜੋਂ 1,000 ਇੱਕ ਵਾਰੀ) ਵਿੱਚ convert ਕਰੋ।
Switch reads: ਐਸਾ ਕੋਡ deploy ਕਰੋ ਜੋ ਪਹਿਲਾਂ phone_e164 ਨੂੰ ਪੜ੍ਹੇ, ਅਤੇ ਜੇ ਉਹ NULL ਹੋਵੇ ਤਾਂ phone ਨੂੰ fallback ਵਜੋਂ ਵਰਤਵੇ।
Contract: ਜਦੋਂ ਤੁਸੀਂ ਯਕੀਨੀ ਹੋ ਜਾਓ ਕਿ ਸਭ ਕੁਝ phone_e164 ਵਰਤ ਰਿਹਾ ਹੈ, fallback ਹਟਾ ਦਿਓ, phone drop ਕਰੋ, ਫਿਰ ਜੇ ਲੋੜ ਹੋਵੇ ਤਾਂ ਸਖ਼ਤ constraints ਲਗਾਓ।

Rollback ਸਧਾਰਨ ਰਹਿੰਦਾ ਹੈ ਜਦੋਂ ਹਰ ਕਦਮ backward compatible ਹੋਵੇ। ਜੇ read switch ਸਮੱਸਿਆ ਪੈਦਾ ਕਰੇ ਤਾਂ ਐਪ rollback ਕਰੋ ਅਤੇ ਡਾਟਾਬੇਸ ਦੋਨਾ ਕਾਲਮਾਂ ਨੂੰ ਰੱਖਦਾ ਹੈ। ਜੇ backfill load spike ਪੈਦਾ ਕਰੇ ਤਾਂ ਜੌਬ ਨੂੰ ਰੋਕੋ, batch size ਘਟਾਓ, ਅਤੇ ਬਾਅਦ ਵਿੱਚ ਜਾਰੀ ਰੱਖੋ।

ਟੀਮ ਨੂੰ aligned ਰੱਖਣ ਲਈ ਯੋਜਨਾ ਇਕੱਠੇ document ਕਰੋ: ਸਹੀ SQL, ਕਿਹੜਾ release reads flip ਕਰਦਾ ਹੈ, completion measure (ਜਿਵੇਂ percent non-NULL phone_e164), ਅਤੇ ہر ਕਦਮ ਦਾ owner.

ਅਗਲੇ ਕਦਮ: ਇਸਨੂੰ ਦੁਹਰਾਉਣ ਯੋਗ ਬਣਾਓ

Expand/contract ਸਭ ਤੋਂ ਚੰਗਾ ਕੰਮ ਕਰਦਾ ਹੈ ਜਦੋਂ ਇਹ routine ਜਿਹਾ ਮਹਿਸੂਸ ਹੋਵੇ। ਆਪਣੀ ਟੀਮ ਲਈ ਇੱਕ ਛੋਟਾ runbook ਲਿਖੋ ਜੋ ਹਰ ਸਕीਮਾ-ਬਦਲਾਅ ਲਈ ਦੁਹਰਾਇਆ ਜਾ ਸਕੇ—ਇੱਕ ਪੰਨਾ ਹੋਵੇ ਅਤੇ ਨਵਾ ਨੌਜਵਾਨ ਟੀਮ ਮੈਂਬਰ ਵੀ ਉਸਨੂੰ ਫੋਲੋ ਕਰ ਸਕੇ।

ਇੱਕ ਵਿਹਾਰਕ ਟੈਮਪਲੇਟ ਇਹਨਾਂ ਨੂੰ ਕਵਰ ਕਰੇ:

Expand (ਅਸਲ migrations)
Code changes (ਕੀ backward compatible ਰਹਿਣਾ ਚਾਹੀਦਾ ਹੈ, ਕਿੱਥੇ dual-read ਜਾਂ dual-write ਵਰਤੇ ਜਾਂਦੇ ਹਨ)
Backfill (batch size, rate limits, pause/resume)
Verify (ਉਹ queries ਅਤੇ metrics ਜੋ correctness ਸਾਬਤ ਕਰਨ)
Contract (ਕੀ ਹਟਾਇਆ ਜਾਵੇਗਾ, ਅਤੇ ਕਦੋਂ)

ਹੁਣ ਤੋਂ ownership ਪਹਿਲਾਂ ਨਿਧਾਰਤ ਕਰੋ। "ਹਰ ਕੋਈ ਸੋਚਦਾ ਸੀ ਕਿ ਕਿਸੇ ਹੋਰ ਨੇ contract ਕਰ ਲੈਣਾ"—ਇਹੀ ਕਾਰਨ ਹੁੰਦਾ ਹੈ ਕਿ ਪੁਰਾਣੇ ਕਾਲਮ ਅਤੇ feature flags ਮਹੀਨਿਆਂ ਤੱਕ ਰਹਿ ਜਾਂਦੇ ਹਨ।

ਚਾਹੇ backfill online ਹੀ ਚੱਲੇ, ਇਸਨੂੰ ਘੱਟ ਟਰੈਫਿਕ ਵੇਲੇ ਸ਼ਡਿਊਲ ਕਰੋ। ਛੋਟੇ batches ਰੱਖਣਾ, DB ਲੋਡ ਦੇਖਣਾ, ਅਤੇ latency ਵਧਣ 'ਤੇ ਤੁਰੰਤ ਰੋਕਣਾ ਆਸਾਨ ਹੁੰਦਾ ਹੈ।

ਜੇ ਤੁਸੀਂ Koder.ai (koder.ai) ਨਾਲ build ਅਤੇ deploy ਕਰ ਰਹੇ ਹੋ, ਤਾਂ Planning Mode migrations ਲਈ ਫੇਜ਼ ਅਤੇ checkpoints ਨਕਸ਼ਾ ਬਣਾਉਣ ਦਾ ਇੱਕ ਉਪਯੋਗੀ ਤਰੀਕਾ ਹੈ। ਐਸੇ ਹੀ compatibility ਨਿਯਮ ਲਾਗੂ ਹੁੰਦੇ ਹਨ, ਪਰ ਕਦਮਾਂ ਨੂੰ ਲਿਖਿਤ ਰੱਖਣ ਨਾਲ ਉਹ ਨਿਰਾਸ਼ਾਜਨਕ boring ਕਦਮ ਛੱਡਣਾ ਮੁਸ਼ਕਲ ਹੋ ਜਾਂਦਾ ਹੈ ਜੋ ਆਉਟੇਜ ਰੋਕਦੇ ਹਨ।

ਅਕਸਰ ਪੁੱਛੇ ਜਾਣ ਵਾਲੇ ਸਵਾਲ

Why do schema changes cause outages even when the SQL looks correct?

ਕਿਉਂਕਿ ਤੁਹਾਡਾ ਡਾਟਾਬੇਸ ਤੁਹਾਡੇ ਐਪ ਦੇ ਹਰੇਕ ਰਣ ਹੋ ਰਹੇ ਵਰਜ਼ਨ ਵੱਲੋਂ ਸਾਂਝਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। rolling deploys ਅਤੇ background jobs ਦੌਰਾਨ ਪੁਰਾਣੀ ਅਤੇ ਨਵੀਂ ਕੋਡ ਇਕੱਠੇ ਚੱਲ ਸਕਦੀ ਹਨ, ਅਤੇ ਜੇ ਮਾਈਗ੍ਰੇਸ਼ਨ ਨਾਮ ਬਦਲਦੀ ਹੈ, ਕਾਲਮ ਡਰੌਪ ਕਰਦੀ ਹੈ ਜਾਂ ਨਵੇਂ constraints ਜੋੜਦੀ ਹੈ ਤਾਂ ਉਹ ਕਿਸੇ ਵੀ ਵਰਜ਼ਨ ਨੂੰ ਟੁੱਟ ਸਕਦੀ ਹੈ ਜੋ ਉਸ ਖਾਸ ਸਕੀਮਾ ਸਟੇਟ ਲਈ ਨਹੀ ਬਣਾਇਆ ਗਿਆ।

What does “zero-downtime schema change” really mean?

ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਤੁਸੀਂ ਐਸਾ ਮਾਈਗ੍ਰੇਸ਼ਨ ਡਿਜ਼ਾਇਨ ਕਰੋ ਕਿ ਹਰ ਵਿਚਕਾਰਲਾ ਡਾਟਾਬੇਸ ਸਟੇਟ ਪੁਰਾਣੀ ਅਤੇ ਨਵੀਂ ਕੋਡ ਦੋਹਾਂ ਲਈ ਕੰਮ ਕਰੇ। ਪਹਿਲਾਂ ਨਵੀਂ ਸਟ੍ਰਕਚਰ ਜੋੜੋ, ਕੁਝ ਸਮਾਂ ਦੋ ਰਸਤੇ ਇਕੱਠੇ ਚਲਾਓ, ਫਿਰ ਹੌਲੀ-ਹੌਲੀ ਪੁਰਾਣੀਆਂ ਚੀਜ਼ਾਂ ਹਟਾਓ ਜਦੋਂ ਕੋਈ ਉਨ੍ਹਾਂ 'ਤੇ ਨਿਰਭਰ ਨਾ ਰਹੇ।

What’s the difference between the expand and contract phases?

Expand ਨਵੀਆਂ ਕਾਲਮਾਂ, ਟੇਬਲਾਂ ਜਾਂ ਇੰਡੈਕਸਾਂ ਨੂੰ ਜੋੜਦਾ ਹੈ ਬਿਨਾਂ ਉਹ ਚੀਜ਼یں ਹਟਾਏ ਜਿਨ੍ਹਾਂ ਦੀ ਮੌਜੂਦਾ ਐਪ ਨੂੰ ਲੋੜ ਹੈ। Contract ਉਹ ਸਾਫ਼-ਸਫ਼ਾਈ ਫੇਜ਼ ਹੈ ਜਿੱਥੇ ਤੁਸੀਂ ਪੁਰਾਣੇ ਕਾਲਮ, ਪੁਰਾਣੇ ਰੀਡ/ਰਾਈਟ ਕੋਡ ਅਤੇ ਅਣਚਾਹੀ ਸਿੰਕ ਲੌਜਿਕ ਹਟਾਉਂਦੇ ਹੋ, ਪਰ ընդੇ ਕੇਵਲ ਉਸ ਸਮੇਂ ਜਦੋਂ ਨਵਾਂ ਰਸਤਾ ਭਰੋਸੇਯੋਗ ਹੋ ਚੁੱਕੇ।

What’s the safest way to add a new column in PostgreSQL?

ਸਭ ਤੋਂ ਸੁਰੱਖਿਅਤ ਸ਼ੁਰੂਆਤ ਇੱਕ nullable ਕਾਲਮ ਬਣਾਉਣਾ ਹੈ ਜਿਸਦਾ ਕੋਈ ਡਿਫਾਲਟ ਨਾ ਹੋਵੇ, ਕਿਉਂਕਿ ਇਸ ਨਾਲ ਭਾਰੀ ਲਾਕਜ ਜਾਂ ਟੇਬਲ ਰੀਰਾਈਟ ਤੋਂ ਬਚਾਵ ਹੁੰਦਾ ਹੈ। ਫਿਰ ਕੋਡ ਐਸਾ ਡਿਪਲੌਇ ਕਰੋ ਜੋ ਕਾਲਮ ਦੇ ਮੌਜੂਦ ਨਾ ਹੋਣ ਜਾਂ NULL ਹੋਣ ਨੂੰ ਸੰਭਾਲ ਸਕੇ, ਹੌਲੀ-ਹੌਲੀ backfill ਕਰੋ ਅਤੇ ਫਿਰ ਬਾਅਦ ਵਿੱਚ NOT NULL ਵਰਗੇ constraints ਲਗਾਓ।

When should I use dual-write, and what does it do?

ਜਦੋਂ ਤਰਾਂ ਨਵਾਂ ਐਪ ਵਰਜ਼ਨ ਟਰਾਂਜ਼ਿਸ਼ਨ ਵਿੱਚ ਹੋਵੇ ਤਾਂ ਨਵੀਂ ਐਪ ਦੋਨਾਂ—ਪੁਰਾਣੇ ਅਤੇ ਨਵੇਂ—ਫੀਲਡਾਂ ਵਿੱਚ ਲਿਖਦੀ ਹੈ। ਇਸ ਨਾਲ ਡਾਟਾ consistent ਰਹਿੰਦਾ ਹੈ ਜਦੋਂ ਤੱਕ ਕੁਝ ਇੰਸਟੈਂਸ ਜਾਂ jobs ਸਿਰਫ਼ ਪੁਰਾਣੇ ਫੀਲਡ ਨੂੰ ਜਾਣਦੇ ਹਨ।

How do I backfill data without slowing down production?

ਛੋਟੇ batches ਵਿੱਚ backfill ਕਰੋ ਜੋ ਛੇਤੀ ਖਤਮ ਹੋਣ (ਸੈਕਿੰਡਾਂ, ਮਿੰਟ ਨਹੀਂ)। ਹਰ batch idempotent ਬਣਾਓ ਤਾਂ ਕਿ ਰੀਰਨ ਸਿਰਫ਼ ਉਹੀ ਰੋਜ਼ ਅੱਪਡੇਟ ਕਰੇ ਜੋ ਅਜੇ ਵੀ ਜ਼ਰੂਰਤ ਵਾਲੇ ਹਨ। query time, lock waits ਅਤੇ replication lag 'ਤੇ ਨਜ਼ਰ ਰੱਖੋ ਅਤੇ DB ਗਰਮ ਹੋਣ 'ਤੇ ਜੌਬ ਰੋਕਣ ਜਾਂ batch size ਘਟਾਉਣ ਲਈ ਤਿਆਰ ਰਹੋ।

How can I verify the migration is actually done before dropping anything?

ਪਹਿਲਾਂ completeness ਜਾਂਚੋ — ਨਵੀਂ ਕਾਲਮ ਵਿੱਚ ਅਣਉਮੀਦਤ NULL ਤਾਂ ਨਹੀਂ। ਕਿੰਨੀ rows eligible ਸਨ ਬਨਾਮ ਕਿੰਨੀਆਂ ਭਰੀਆਂ ਗਈਆਂ, UUID/IDs ਦੇ ਛੋਟੇ ਨਮੂਨੇ ਨਾਲ cross-check ਕਰੋ, ਅਤੇ edge cases ਟੈਸਟ ਕਰੋ। ਜੇ ਤੁਸੀਂ dual-write ਕਰ ਰਹੇ ਹੋ ਤਾਂ ਇੱਕ consistency ਚੈਕ ਰੱਖੋ ਜਿਸ ਨਾਲ rows ਜਿਨ੍ਹਾਂ ਵਿੱਚ old_value <> new_value ਹੋਵੇ ਉਹ ਦਿਖਾਏ ਜਾਣ।

What are the most common migration steps that break production?

ਸਰਲ ਰੀਕਾਂਡ: NOT NULL ਜਲਦੀ ਨਾ ਜੋੜੋ; ਵੱਡੇ ਟੇਬਲ ਨੂੰ ਇੱਕ ਟਰੇਂਜ਼ੈਕਸ਼ਨ ਵਿੱਚ backfill ਨਾ ਕਰੋ; defaults ਹਮੇਸ਼ਾਂ free ਨਹੀਂ ਹੁੰਦੇ—ਕੁਝ Postgres ਵਰਜਨਾਂ ਵਿੱਚ ਉਹ ਟੇਬਲ ਰੀਰਾਈਟ ਕਰ ਦੇਂਦੇ ਹਨ; ਅਤੇ reads ਨਵੀਂ ਕਾਲਮ 'ਤੇ switch ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਯਕੀਨੀ ਕਰੋ ਕਿ writes ਨੂ ਭਰ ਰਿਹਾ ਹੈ।

When is it safe to do the contract step and drop the old column?

ਜਦੋਂ ਤੁਸੀਂ ਪੁਰਾਣੀ ਫੀਲਡ ਨੂੰ ਲਿਖਣਾ ਬੰਦ ਕਰ ਦਿੰਦੇ ਹੋ, ਪੜ੍ਹਨ ਵਾਲੇ ਕੋਡ ਤੋਂ fallback ਹਟਾ ਦਿੰਦੇ ਹੋ, dead code/feature flags ਹਟਾ ਦਿੰਦੇ ਹੋ ਅਤੇ ਅੰਤ ਵਿੱਚ temporary triggers/compatibility views ਨੂੰ ਹਟਾ ਕੇ ਪੁਰਾਣੀ ਕਾਲਮ ਡ੍ਰੌਪ ਕਰ ਸਕਦੇ ਹੋ।Drop column ਇੱਕ ਛੋਟਾ ACCESS EXCLUSIVE lock ਲੈ ਸਕਦਾ ਹੈ—ਇਸ ਲਈ ਰੂਟ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਇੱਕ release cycle ਰੁਕੋ।

Do I always need expand/contract, or can I just take a maintenance window?

ਜੇ ਤੁਸੀਂ maintenance window ਮਨਜ਼ੂਰ ਕਰ ਸਕਦੇ ਹੋ ਅਤੇ ਟਰੈਫਿਕ ਘੱਟ ਹੈ ਤਾਂ ਇੱਕ ਸਧਾਰਨ ਇੱਕ-ਵਾਰ migration ਠੀਕ ਰਹੇਗੀ। ਪਰ ਜੇ ਤੁਹਾਡੇ ਕੋਲ ਰੀਅਲ ਯੂਜ਼ਰ, ਬਹੁਤ ਸਾਰੇ app instances, workers ਜਾਂ SLAs ਹਨ ਤਾਂ expand/contract ਜ਼ਿਆਦਾ ਮਦੀਰੀ ਹੁੰਦਾ ਹੈ ਕਿਉਂਕਿ ਇਹ ਰੋਲਆਊਟ ਅਤੇ ਰੋਲਬੈਕ ਨੂੰ ਸੁਰੱਖਿਅਤ ਬਣਾਉਂਦਾ ਹੈ; Koder.ai Planning Mode ਵਿੱਚ ਚਰਣਾਂ ਅਤੇ ਚੈੱਕਲਿਸਟ ਲਿਖ ਕੇ ਤੁਸੀਂ ਉਹਨੂੰ ਰੁਟੀਨ ਬਣਾਉ ਸਕਦੇ ਹੋ।