[SQL查詢優(yōu)化技術] 數據庫sql實驗 查詢優(yōu)化
發(fā)布時間:2020-02-16 來源: 美文摘抄 點擊:
摘要:數據查詢是數據庫應用程序的重要組成部分,查詢語句的執(zhí)行速度已成為數據庫整體性能的瓶頸。本文闡述了影響查詢效率的因素,并根據具體情況,給出了優(yōu)化的方法,以提高查詢語句的執(zhí)行效率。?
關鍵詞:SQL;查詢優(yōu)化;查詢語句?
中圖分類號:TP311.13 文獻標識碼:A??
1 引言?
目前,隨著計算機技術的不斷發(fā)展,數據庫技術應用越來越廣泛,特別是大型數據庫的廣泛使用。而基于數據庫的應用程序在執(zhí)行時,應用程序需要在數據庫中查詢相應的信息。SQL(Structured Query Language)語言是關系數據庫的標準語言,集數據操縱、數據定義和數據控制等功能于一體,數據庫的查詢又是數據庫的核心操作,也是最常用的操作。但人們在使用SQL語言往往只注意結果的準確,忽視了其執(zhí)行的效率,影響了系統(tǒng)的整體性能。據統(tǒng)計,90%的性能問題主要來源于程序員或用戶使用了不恰當的SQL查詢語句。由此可見,SQL查詢語句的質量對于數據庫管理信息系統(tǒng)的質量有較大的影響,如何保證在結果正確的條件下,提高查詢效率成為一個急需解決的問題。?
2 查詢語句效率的影響因素分析?
查詢語句的效率既可以利用邏輯方法進行查詢優(yōu)化,也可以采用物理的方法進行查詢優(yōu)化,但在實際中,CPU的處理速度比從磁盤上讀寫信息的速度快得多,要進行查詢優(yōu)化,關鍵是要減少對磁盤的訪問。RDBMS 優(yōu)化器的輸入是一條查詢語句,輸出是一個執(zhí)行策略。執(zhí)行策略是執(zhí)行查詢所需要的一系列步驟。優(yōu)化器的優(yōu)化算法影響數據庫的反應速度,優(yōu)化器的優(yōu)化策略還與所查詢表的內容和其他一些與服務器有關的因素有關,如cache大小、cache策略、I/O 大小等。通常硬盤訪問是成本最高的操作,因此對查詢優(yōu)化來講,最為重要的選擇就是使用什么索引和采用何種表的連接手段。?
影響查詢效率的因素,主要有以下幾點:①索引是否合適;②查詢條件中的數據類型是否兼容;③查詢條件中操作符使用是否得當;④多個選擇條件查詢時,選擇條件的次序是否合理;⑤ 是否合理安排連接選擇運算.⑥多表查詢是否合理等。?
3 SQL語句的優(yōu)化方法?
SQL 查詢語句執(zhí)行都涉及到存取用戶或系統(tǒng)對象的表頁或索引項。一般而言,系統(tǒng)存取頁面的速度越快,SQL 語句的性能就越高。因此對SQL查詢語句進行優(yōu)化,應盡量減少頁面存取,或使用內存的頁面代替訪問磁盤。本文以SQL SERVER 2000為例,給出了進行查詢優(yōu)化的幾種方法。?
3.1 選取合適的索引字段?
對于查詢優(yōu)化來說,提高速度最快的方法是建立索引。在數據庫中建立合適的索引能避免表掃描并減少因查詢而產生的輸入/輸出開銷,使查詢速度大為提高。?
SELECT查詢中的WHERE語句是查詢優(yōu)化器處理的重點。WHERE語句中的每一列都是索引的候選列,但對每一列都建立索引會形成很多索引,增加系統(tǒng)的開銷,故應盡量分析出每一個重要查詢的使用頻度,將常查詢的列建立索引。?
盡量覆蓋一個查詢。例如:如果一個查詢只選擇列甲和列乙,把列甲和列乙作為索引鍵建立復合索引,這個查詢就是覆蓋的,這樣被提取的數據存放在索引鍵自身中,根本不需要讀取實際數據。因而會減少輸入/輸出總量,大大提高查詢速度。?
在經常要進行插入、刪除、修改、更新操作的表上不要建立太多不必要的索引。因為表數據修改后,所有的索引都必須做相應的調整,所有的分頁操作都被記錄在系統(tǒng)日志中。這也會增加輸入/輸出操作,從而影響數據庫性能。?
3.2 避免使用不兼容的數據類型?
在SQL中,float、int、varchar binary和varbinary是不兼容的。數據的不兼容使得無法使用預先定義好的索引,影響查詢速度,如語句SELECT NAME FROM CUSTOMERWHERE COST>1000在執(zhí)行時因COST是MONEY型數據,1000是整型,形成數據類型不兼容,無法使用建立在COST上的索引,系統(tǒng)在執(zhí)行時要先將1000轉換成MONEY型,再與COST進行比較。故應當在編成程序時,將1000轉化成MONEY型,而不是等到運行時轉化?蓪⑵滢D化成SELECT NAME FROM CUSTOMERWHERE COST>$1000。?
3.3 避免對搜索參數使用其它操作符(如數學,字符串函數等)?
若在WHERE子句中,存在一個數學表達式,查詢優(yōu)化器就不能使用分布統(tǒng)計信息,影響查詢效率。如查詢語句SELECT NAME?ID FROMCUSTOMERWHERE COST *5>3000應寫成SELECT NAME?ID FROMCUSTOMERWHERE COST >600。?
例如:SELECT AU?LNAMEFROM AUTHORS WHERE SUBSTRING(STATE,1,1)= ‘A’ ?
應寫成SELECT AU?LNAMEFROM AUTHORSWHERESTATELIKE‘A%’。?
3.4 避免使用非聚合表達式?
非聚合表達式很難利用索引,故在執(zhí)行含有非聚合表達式的SQL語句時,必須進行大規(guī)模的掃描,降低了執(zhí)行的速度,例如不等關系符號“<>”是一個排斥性的的操作符,故含有“<>”符號的SQL語句在執(zhí)行時,在掃描整個表之前無法確定子句的選擇范圍,必須掃描整個表。像“NOT”,“NOT IN”,“NOT LIKE”,“NOT EXIST”等都是非聚合表達式,應避免使用。例如:SELECT SNAME FROM STUDENT WHERE AGE<>20可改寫成SELECT SNAME FROM STUDENT WHERE AGE20。?
3.5避免通配符(%)在搜尋詞首出現?
通配符(%)出現在搜尋詞首,系統(tǒng)不使用索引,會降低SQL語句的執(zhí)行速度。然而當通配符出現在字符串其他位置時,優(yōu)化器就能利用索引。在下面的查詢中索引得到了使用:?
SELECTAU?LNAMEFROMAUTHORSWHERESTATELIKE‘A%’;?
3.6 對于連接查詢,適當冗余?
缺省情況下多于4個表的連接查詢,按每次4個處理。對每個表集找到并保存最佳的外表,其余的組合則用來估計下一個次外表。如果在查詢中應當提供一些冗余的搜索參數,使優(yōu)化器有更多的選擇余地,可提高查詢速度。?
如下面兩個查詢是相同的?
SELECTGRADEFROMST,KCWHEREST.SNO=KC.SNOANDST.NO=‘20060101’?
SELECTGRADEFROMST,KCWHEREST.SNO=KC.SNOANDST.NO=‘20060101’ ANDKC.NO=‘20060101’?
但后一個查詢的速度更快。?
3.7 注意選擇條件的排列順序?
選擇條件的排列順序不僅能影響索引的選取,還關系到臨時表的大小,對系統(tǒng)的性能有較大的影響。?
例如:比較SELECT*FROMAUTHORSWHERE STATE=‘CA’ANDAU?LNAME=‘WHITE’和SELECT*FROMAUTHORSWHEREAU?LNAME=‘WHITE’ ANDSTATE=‘CA’ 的查詢效率。假設AUTHORS表中共有20萬條記錄,其中滿足STATE=‘CA’的記錄為12萬條,滿足AU?LNAME=‘WHITE’的記錄為2萬條。在SQL SERVER 2000中查詢條件的選取是從左至右的。第一條SQL語句在執(zhí)行時,首先返回一個12萬條記錄的臨時表,然后在從中進行選擇。第二條SQL語句在執(zhí)行時,首先返回一個2萬條記錄的臨時表,然后在從中進行選擇。顯然,第二條SQL語句的查詢效率比第一條要高。一般來說,為提高查詢速度,將條件嚴格的寫在前面。?
3.8 將多表的連接運算改為嵌套SQL語句來實現?
連接運算會產生很大的臨時表,特別是未優(yōu)化的多表連接查詢。未經過優(yōu)化的SQL查詢語句會產生巨大的計算工作量,可將其改為嵌套SQL語句來提高查詢效率。例如:?
SELECT STUDENT.SNAME?
FROMSTUDENT, SC
WHERE STUDENT.SNO = SC.SNO?
AND SC.CNO= ‘ 2 ’?
可改為?
SELECT SNAME FROM STUDENT?
WHERE SNO IN (SELECT SNOFROM SC WHERE CNO= ‘ 2 ’)?
假設STUDENT表中有1000條記錄,SC表中有5000條記錄,其中CNO為2的有500條,在第一個SQL語句中,首先形成1000×5000=5000000條記錄的臨時表,再進行選擇運算。若采用第二個SQL語句,先對SC表進行選擇運算,有500條記錄滿足條件,然后再與STUDENT表進行連接運算,很顯然,后者的計算量要比前者少很多,故對于多個數據表的連接選擇運算過程,先做選擇運算后做連接運算,比先做連接運算后做選擇運算計算量小,查詢響應時間短,查詢效率高。?
3.9 使用存儲過程?
存儲過程是編譯好、優(yōu)化過且存儲在數據庫中的SQL語句和控制流語言的集合,設計優(yōu)良的應用程序都應當使用存儲過程。如果在程序中利用好存儲過程,可極大地增強SQL語言的效率、功能和靈活性。編譯進存儲過程的SQL語句在執(zhí)行時可省去大量的處理時間。存儲過程在客戶端執(zhí)行請求使用網絡的效率往往比將等效的SQL語句發(fā)送到服務器高。?
4 結束語?
分析了查詢語句效率影響因素的基礎上,提出了具體的優(yōu)化方法。在系統(tǒng)開發(fā)和維護過程中須針對具體的情況,綜合運用多種優(yōu)化方法,不斷加以調整,可以提高SQL語句的執(zhí)行效率,取得滿意的運行效果。?
參考文獻?
[1]薩師煊,珊著.庫系統(tǒng)概論[M].北京:高等教育出版社,2001.?
[2]章立民著.SQL SERVER 2000 TRANSACT-SQL 程序設計[M].北京:中國鐵道出版社,2002.?
[3]胡百敬著.MICROSOFT SQL SERVER性能調校[M].北京:電子工業(yè)出版社,2005.
相關熱詞搜索:優(yōu)化 查詢 技術 SQL查詢優(yōu)化技術 mysql查詢優(yōu)化技術 mysql分頁查詢優(yōu)化
熱點文章閱讀