Pandas是基于NumPy 的一種工具,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。Pandas 納入了大量庫和一些標準的數(shù)據(jù)模型,提供了高效地操作大型數(shù)據(jù)集所需的工具。Pandas提供了大量能使我們快速便捷地處理數(shù)據(jù)的函數(shù)和方法。你很快就會發(fā)現(xiàn),它是使Python成為強大而高效的數(shù)據(jù)分析環(huán)境的重要因素之一。本文主要介紹一下Pandas中read_sql方法的使用。
pandas.read_sql(sql,con,index_col = None,coerce_float = True,params = None,parse_dates = None,columns = None,chunksize = None)
將SQL查詢或數(shù)據(jù)庫表讀入DataFrame。
此功能是一個方便的包裝read_sql_table和 read_sql_query(為了向后兼容)。它將根據(jù)提供的輸入委托給特定的功能。SQL查詢將被路由到read_sql_query,而數(shù)據(jù)庫表名將被路由到read_sql_table。請注意,委托的功能可能有更多關(guān)于其功能的特定說明,此處未列出。
參數(shù): |
sql:string或SQLAlchemy可選(選擇或文本對象) 要執(zhí)行的SQL查詢或表名。 con:SQLAlchemy可連接(引擎/連接)或數(shù)據(jù)庫字符串URI 或DBAPI2連接(回退模式) 使用SQLAlchemy可以使用該庫支持的任何數(shù)據(jù)庫。如果是DBAPI2對象, 則僅支持sqlite3。 index_col:字符串或字符串列表,可選,默認值:無 要設(shè)置為索引的列(MultiIndex)。 coerce_float:boolean,默認為True 嘗試將非字符串,非數(shù)字對象(如decimal.Decimal)的值轉(zhuǎn)換為浮點, 這對SQL結(jié)果集很有用。 params:list,tuple或dict,optional,default:None 要傳遞給執(zhí)行方法的參數(shù)列表。用于傳遞參數(shù)的語法取決于數(shù)據(jù)庫驅(qū)動程序。 檢查數(shù)據(jù)庫驅(qū)動程序文檔, 了解PEP 249的paramstyle中描述的五種語法樣式中的哪一種。 例如,對于psycopg2,使用%(name)s,所以使用params = {'name':'value'} parse_dates:list或dict,默認值:None 要解析為日期的列名的列表。 的字典,其中格式字符串是在解析的情況下的strftime兼容的字符串倍, 或是在解析整數(shù)時間戳的情況下(d,S,NS,MS,我們)之一。{column_name: format string} dict of ,其中arg dict對應(yīng)于關(guān)鍵字參數(shù),特別適用于沒有本機Datetime支持的數(shù)據(jù)庫, 例如SQLite。{column_name: arg dict}pandas.to_datetime() columns:list,默認值:None 從SQL表中選擇的列名列表(僅在讀取表時使用)。 chunksize:int,默認無 如果指定,則返回一個迭代器,其中chunksize是要包含在每個塊中的行數(shù)。 |
返回: |
DataFrame(數(shù)據(jù)幀) |
例如
import MySQLdb mysql_cn= MySQLdb.connect(host='myhost', port=3306,user='myusername', passwd='mypassword', db='information_schema') df_mysql = pd.read_sql('select * from VIEWS;', con=mysql_cn) print 'loaded dataframe from MySQL. records:', len(df_mysql) mysql_cn.close()
內(nèi)容擴展:
有沒有關(guān)于如何使用Pandas中的SQL查詢傳遞參數(shù)的示例?
特別是我正在使用SQLAlchemy引擎來連接到PostgreSQL數(shù)據(jù)庫。到目前為止,我發(fā)現(xiàn)以下工作:
df = psql.read_sql(('select "Timestamp","Value" from "MyTable" ' 'where "Timestamp" BETWEEN %s AND %s'), db,params=[datetime(2014,6,24,16,0),datetime(2014,6,24,17,0)], index_col=['Timestamp'])
pandas文檔說,params也可以作為一個dict來傳遞,但我似乎無法讓這個工作嘗試了:
df = psql.read_sql(('select "Timestamp","Value" from "MyTable" ' 'where "Timestamp" BETWEEN :dstart AND :dfinish'), db,params={"dstart":datetime(2014,6,24,16,0),"dfinish":datetime(2014,6,24,17,0)}, index_col=['Timestamp'])
到此這篇關(guān)于Python Pandas pandas.read_sql函數(shù)實例用法的文章就介紹到這了,更多相關(guān)Python Pandas pandas.read_sql函數(shù)詳解內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!