Skip to main content

Compression in SQL Azure - Yes we have!!!

שלום לכולם
אתמול בלילה במקרה קראתי את הבלוג של Bob Beachemin שהוא חלק מ SQLSkills ושם הוא הזכיר בחצי משפט על זה שעכשיו יש דחיסה בבסיסי הנתונים בענן - לא האמנתי למראה עיניי.
ישר רצתי לבדוק ואכן זה עובד. אז ראשית התודות ל - @bobbeach

שאגב לקח לי בשניה האחרונה את הפוסט על Extended Events ב Azure.

דחיסה.... כן כן סוף סוף יש תמיכה בדחיסה - אפשר לדחוס טבלאות ואינדקסים ובכך לצמצם את גודל בסיס הנתונים ולהפחית עלויות.
כמובן יש מחיר של cpu, ועוד ההשפעות של דחיסה  - אולם יש דחיסה אפשר להקטין בסיסי נתונים ולשלם פחות ועדיין לקבל ביצועים.
פיצ'ר זה הוא סנונית ראשונה של פיצ'רים שלא היו עד היום ומנעו פעילות טובה בענן - הייתי צריך לעשות מיגרציה של בסיס נתונים ותמיד מנע אותי הענן מלהעלות כמו שהוא את בסיס הנתונים כי היתה לי דחיסה על הרבה בסיסי נתונים.

ב - etoro אנו שומרים כל מיני לוגים שמחוקרים מהם פעילות לקוחות וזה צריך להיות זמין כל הזמן תקופה ארוכה, נוח למתחקרים לתחקר בסיס נתונים רלציוני אולם מחירו לא היה כדאי עכשיו - גם הוסיפו שכבות וגם עושים דחיסה ובכך מורידים עוד גודלו של בסיס הנתונים ובכך משלמים פחות.

אתמול בצהריים הרצתי פקודה זו על בסיס הנתונים של סביבת ה QA של הלוגים הללו:

ALTER TABLE [dbo].[ExternalLogs] REBUILD PARTITION = ALL 
WITH (DATA_COMPRESSION = PAGE)
GO 

כמובן - סוף סוף - לא הייתה שגיאה שזה לא נתמך והפקודה רצה והנה התוצאה:
בסיס הנתונים ירד מ 22.69 - ל 8.44
MB.



כרגע אני עסוק בהורדת גודל הטבלאות הגדולות - שזה נושא יותר בעייתי בגלל אורך טרנזקציות בענן אבל זה נושא לדיון אחר.

פיני

Comments

Popular posts from this blog

How to restore deleted Azure Synapse dedicated SQL pool

  Existing dedicated pool can be easily restored from Azure portal or PowerShell command, but for now deleted pool could be restored from PowerShell only! Example: # Connect to Azure with system-assigned managed identity $AzureContext = (Connect-AzAccount -Identity).context # set and store context $AzureContext = Set-AzContext -SubscriptionName $AzureContext.Subscription -DefaultProfile $AzureContext # $AzureContext = Set-AzContext -SubscriptionName $SubscriptionName -DefaultProfile $AzureContext $SubscriptionName="Databases" $ResourceGroupName="stg-rg-we" $ServerName="stg-synapse-we"   $DatabaseName="sql_we_2023_11_07_13_42" $NewDatabaseName="sql_dp_we_deleted" ######################################## $token = (Get-AzAccessToken -ResourceUrl https://database.windows.net).Token $SubscriptionId = "ce088f9e-1111111a3914b" $DedicatedPoolEndPoint = "stg-synapse-we.sql.azuresynapse.net" $DedicatedPoolName = $DatabaseNam...

The journey to the Lakehouse

A long time has passed since the last post, we have gone through a long and tedious journey to adapt what Azure offers us, to our needs. Our needs were simple, the Current Datawarehouse (SQL Server on VM inazure) served the BI. ML teams worked on GCP, we want to let both teams to work on Azure in a platform that will have the ability to scale and will not fail every 2 days. We checked: Snowflake on azure Synapse analytics GCP We decided to go for the full Azure product for the reasons: Migration time support costs Synapse as a platform contains many components, and the challenge was to find what fits  us as an organization and as a group. The knowledge of the people and their abilities influenced the plans. Here's what we planned and what we did: We start to put everything in the Data Lake in parquet or delta format, build on top of Azure ADLS gen 2. We had to move some data to T-SQL compatible platform, so this involves setting up a dedicated Synapse pool , which is a fully man...

Configuring secondary database in Azure SQL DB - Bug found

Hi All Last week we had an issue with a secondary DB in geo replication and fail over group. To make the long story short we had to delete the secondary and recreate a secondary from scratch . And now let me tell you the story, we build a DB in P6 tier - very high, expensive and highly available. Then we add a geo replication copy via the platform, like it shows here. This is take from MSFT documentation: https://docs.microsoft.com/en-us/azure/azure-sql/database/active-geo-replication-overview It is written:  " Both primary and secondary databases are required to have the same service tier. It is also strongly recommended that the secondary database is created with the same backup storage redundancy and compute size (DTUs or vCores) as the primary. If the primary database is experiencing a heavy write workload, a secondary with lower compute size may not be able to keep up with it. That will cause redo lag on the secondary, and potential unavailability of the secondary. To mit...