Skip to main content

Windows Azure Service Disruption due to date: 2012-02-29

שלום לכולם

כפי שחלקכם שמעתם או מי שלא שמע מוזמן לשמוע על התקלה בענן של מיקרוסופט בתאריך 2012-02-29. כידוע זהו תאריך שונה במעט מאחר והוא קיים רק אחת ל 4 שנים. מה שנקרא – שנה מעוברת.

למיקרוסופט יש מערכת התרעות יחסית טובה – גם סטאטוסים בטוויטר – גם התרעות במיילים וגם עמוד דש בורד יפה וברור.

בבוקרו של אותו היום החלו לצוץ התרעות מכל מיני סוגים, בכל האתרים, דבר שהוא מאד יוצא דופן, כיוון שגם כשיש תקלות הם מאד מקומיות ולא קריטיות, להלן כמה דוגמאות להתרעות שהוקפצו בכל מדיה אפשרית:

SQL Azure Data Sync - North Europe
[SQL Azure Data Sync] [North Europe] [Red] Service Unavailable
Feb 29 2012 8:00AM We are troubleshooting this issue. Further updates will be p...
3/1/2012 4:27:32 AM

Service Bus, Access Control & Caching Portal - Worldwide
[Service Bus, Access Control & Caching Portal] [Worldwide] [Red] Service Unavailable
Feb 29 2012 11:15AM Further updates will be published to keep you apprised of th...
3/1/2012 4:02:33 AM

Service Bus - South Central US
[Service Bus] [South Central US] [Red] Service Unavailable
Feb 29 2012 11:15AM Further updates will be published to keep you apprised of th...
3/1/2012 2:34:29 AM

Windows Azure Marketplace - DataMarket - South Central US
[Windows Azure Marketplace - DataMarket] [South Central US] [Red] Windows Azure Marketplace Incident
Feb 29 2012 10:55AM We are currently experiencing an issue with ACS in the South...
3/1/2012 1:35:45 AM

Access Control 2.0 - South Central US
[Access Control 2.0] [South Central US] [Red] Service Outage
Feb 29 2012 11:15AM We are experiencing an issue with Access Control 2.0 in the ...
3/1/2012 1:31:53 AM

Windows Azure Compute - North Central US
[Windows Azure Compute] [North Central US] [Yellow] Windows Azure Compute Availability
Feb 29 2012 10:55AM We are experiencing an issue with Windows Azure Compute in t...
2/29/2012 11:44:21 PM

Windows Azure Compute - South Central US
[Windows Azure Compute] [South Central US] [Yellow] Windows Azure Compute Availability
Feb 29 2012 10:55AM We are experiencing an issue with Windows Azure Compute in t...
2/29/2012 11:43:08 PM

Windows Azure Compute - North Europe
[Windows Azure Compute] [North Europe] [Yellow] Windows Azure Compute Availability
Feb 29 2012 10:55AM We are experiencing an issue with Windows Azure Compute in t...
2/29/2012 11:43:05 PM

Windows Azure Compute - South Central US
[Windows Azure Compute] [South Central US] [Yellow] Windows Azure Compute Availability
Feb 29 2012 10:55AM We are experiencing an issue with Windows Azure Compute in t...
2/29/2012 10:57:43 PM

 

רואים תקלות מאיזורים שונים וברכיבים שונים.

גם סגן נשיא מיקרוסופט לעניני שרתים הוציא הודעה ובה התנצלות על התקלה:

Windows Azure Service Disruption Update

לאנשי ה SQL Azure מבינינו – שימו לב שהוא עצמו לא נפגע – מה שכן זה הגישה אליו מהפורטל.

הסיבה לתקלה כפי שאני מבין עדיין נחקרת, וכולם מחכים למסקנות ולתובנות.

רציתי להביא 2 מאמרים בנושא:

מאמר אחד המציג את העובדה שגם בענן ייתכנו תקלות – הוא מזכיר את המקרה באפריל אצל אמזון ואת התקלות ב Gmail ועוד ועוד. לדעתו הדבר לא יעצור את התהליכים שמעבירים פעילויות לענן. אולם המקרה הזה מזכיר לנו את הצורך ב DRP מסודר, כמה זמן אתה מוכן לא להיות באויר, כמה עלות אתה מוכן להשקיע בניתוב האתר למקום אחר מחוץ לענן או בתוכו.

תקלות קורות וייקרו השאלה היא מה לומדים מהם. אני באופן אישי מאד מסכים עם הנאמר במאמר זה.:

On the Recent Windows Azure Leap Day Outage מאת David Pallmann @davidpallmann

מאמר שני נכתב באתר zdnet ובו צעד אחר צעד מציג Jack Clark @mappingbabel  את האירועים לפי לוח הזמנים בהם ארעו. הוא מנסה כמו כן לנסות ולהבין מה היה.

בכתבה זו הוא מציין די בפרוטרוט את לוח הזמנים של התקלה… הוא אינו מציין את סיומה.

Microsoft grapples with Windows Azure outage

לדעת כולם אכן מדובר בהשפעה של התאריך יוצא הדופן של פברואר אולם כרגע לא פורסם רישמית התחקיר.

אני תיקווה שהלקחים יילמדו על ידי שני הצדדים – צד הספק ילמד מהטעויות וכיצד ניתן להתגבר על תקלות ביתר מהירות וצד הלקוח ילמד לכלכל את צעדיו בתבונה על מנת למזער נזקים בעת משבר.

במידה ויהיו ממצאים רישמיים אעדכן אותכם

חג פורים שמח

Comments

Popular posts from this blog

How to restore deleted Azure Synapse dedicated SQL pool

  Existing dedicated pool can be easily restored from Azure portal or PowerShell command, but for now deleted pool could be restored from PowerShell only! Example: # Connect to Azure with system-assigned managed identity $AzureContext = (Connect-AzAccount -Identity).context # set and store context $AzureContext = Set-AzContext -SubscriptionName $AzureContext.Subscription -DefaultProfile $AzureContext # $AzureContext = Set-AzContext -SubscriptionName $SubscriptionName -DefaultProfile $AzureContext $SubscriptionName="Databases" $ResourceGroupName="stg-rg-we" $ServerName="stg-synapse-we"   $DatabaseName="sql_we_2023_11_07_13_42" $NewDatabaseName="sql_dp_we_deleted" ######################################## $token = (Get-AzAccessToken -ResourceUrl https://database.windows.net).Token $SubscriptionId = "ce088f9e-1111111a3914b" $DedicatedPoolEndPoint = "stg-synapse-we.sql.azuresynapse.net" $DedicatedPoolName = $DatabaseNam...

Back to Basic - create new Azure SQL DB

Hi All Long time no posts, i have been busy in last few months on a hard day 2 day work and did not  had the chance to publish some posts. So i have decided to sit and write some "Back to Basic" posts. Today i will write about how to create an Azure SQL Db from the portal. Choose the Subscription. RG - if its in special Project connect to its RG (Resource group is a virtual collection of resources in order to easy manage budgets.) DB Name Server - choose the correct or create one(Server has limited manage capabilities on the DB like security, backup policies and other rules) Choose no (elastic pool is a feature that will not be explained here) This is the server tier, means the power of the DB and by pass the payments of the DB (i will have special post on the new tiers options, for this post i will leave the default) This is the Storage redundancy , for now leave it in the default option. now we will move to the Networking tab: 8 - 9. Configuration of networking and s...

Configuring secondary database in Azure SQL DB - Bug found

Hi All Last week we had an issue with a secondary DB in geo replication and fail over group. To make the long story short we had to delete the secondary and recreate a secondary from scratch . And now let me tell you the story, we build a DB in P6 tier - very high, expensive and highly available. Then we add a geo replication copy via the platform, like it shows here. This is take from MSFT documentation: https://docs.microsoft.com/en-us/azure/azure-sql/database/active-geo-replication-overview It is written:  " Both primary and secondary databases are required to have the same service tier. It is also strongly recommended that the secondary database is created with the same backup storage redundancy and compute size (DTUs or vCores) as the primary. If the primary database is experiencing a heavy write workload, a secondary with lower compute size may not be able to keep up with it. That will cause redo lag on the secondary, and potential unavailability of the secondary. To mit...