當前位置:首頁 » 股票投資 » 量化股票投資免費NoSQL資料庫適合

量化股票投資免費NoSQL資料庫適合

發布時間: 2021-06-13 04:02:25

A. 如何建立一個股票量化交易模型並模擬

研究量化投資模型的目的是找出那些具體盈利確定性的時空價格形態,其最重要手段的概率取勝,最重要的技術是概率統計,最主要的研究方向是市場行為心理。那麼我們在選擇用於研究的參數時,也應該用我們的經驗來確定是否把某技術參數放進去,因為一般來說定性投資比較好用的參數指標對量化投資同樣適用。
量化投資區別於傳統定性投資的主要特徵在於模型。我打個比方,我們看病,中醫與西醫的診療方法是不同,中醫是望、聞、問、切,最後判斷出的結果,很大程度上基於中醫的經驗,主觀定性程度大一些;西醫就不同了,先要病人去拍片子、化驗等,這些都要依託於醫學儀器,最後得出結論,對症下葯。中醫對醫生的經驗要求非常高,他們的主觀判斷往往決定了治療效果,而西醫則要從容得多,按事先規定好的程序走就行了。量化投資就是股票投資中的西醫,它可以比較有效地矯正理智與情緒的不兼容現象。
量化投資的一般思路:選定某些技術指標(我們稱之為參數,往往幾個組成一組),並將每一個參數的數據范圍進行分割,成幾等份。然後,用計算機編程寫出一段能對這些參數組對股票價格造成的影響進行數據統計的程序,連接至大型資料庫進行統計計算,自動選擇能夠達到較高收益水平的參數組合。但是選出這些參數組後還不能馬上應用,因為這里涉及到一個概率陷阱的問題,比如說,有1到100這一百個數字放在那裡,現在讓你選擇,請問你選到100的可能性是多大?是的,就是1/100,如果較幸運你選到了100並不能說明你比別人聰明,而是概率的必然。所以,在進行統計時要特別關注統計的頻率與選出的結果組數量之間的關系。在選出符合要求的參數組後我們還應留出至少三年的原始市場數據進行驗證,只有驗證合格後才能試用。
量化投資原始數據策略:我們選用96年後的市場數據,因為96年股市有過一次交易政策改革(你可以自己查詢了解一下),為了不影響研究結果我們不採納96年以前的數據進資料庫。
量化投資研究的硬設備:高計算性能電腦,家用電腦也可以,不過運算時間會很長,我曾經用家用電腦計算了三個月時間才得到想要的數據。
統計方法:可以選用遺傳演算法,但我在這里陪大家做的是比較簡單的模型,所以採用普通統計方法就可以了。
用於量化研究的軟體:我採用的是免費的大型資料庫MYSQL,ASP網路編程語言,以及可以設置成網路伺服器的旗艦版WIN7操作系統。

B. 請教一下,現在比較流行的免費資料庫有哪些呢哪些比較適合小公司里用呢

3.1 MySQL簡介
SQL Server資料庫是目前最流行的關系資料庫系統之一,它對伺服器的要求比較低,並包含了視圖的靈活運用、觸發器與存儲過程、用戶自定義數據類型與自定義函數、維護數據的完整性等功能,有很強的實用性。
SQL Server是一個多用戶、多線程SQL資料庫伺服器。SQL(結構化查詢語言)是世界上最流行的和標准化的資料庫語言。MySQL是憑一個客戶機/伺服器結構的形式來實現的,它由一個伺服器守護程序和很多不同的客戶程序和庫組成。
SQL是一種標准化的語言,它使得存儲、更新和存取信息更容易。例如,你能用SQL語言為一個網站檢索產品信息及存儲顧客信息,同時MySQL也足夠快和靈活以允許你存儲記錄文件和圖像MySQL與其他資料庫管理系統相比,它具有許多的優勢:
(1)MySQL是一個關系資料庫管理系統。
(2)MySQL是開源的,也就是所它是免費的,可以減少許多企業的成本。
(3)MySQL系統的速度非常快,同時它的性能也是十分優良的。
(4)MySQL伺服器實用性很強,能夠工作在客戶/伺服器或嵌入系統中。
(5)我們可以有大量的MySQL軟體可以使用,。
由於其體積小、速度快、成本低,世界上許多中小型網站選擇了MySQL作為網站資料庫。

C. 選擇哪種nosql資料庫

NoSQL不像傳統關系型庫那樣有統一的標准,也不具有普適性。所以要根據應用和數據的存取特徵來選擇適合的NoSQL。
如果以前沒有接觸過NoSQL,MongoDB是一個比較好的選擇,他支持的所以和查詢能力是所有NoSQL中最強大的,缺點是索引的成本和文檔大小限制。
如果是使用Hadoop大數據分析,數據基本上不存在修改,只是插入和查詢,並且需要配合Hadoop的MR任務,HBase會是很好的選擇。
如果要求有很強的擴展能力,高並發讀寫和維護方便,Casaandra則是不錯的選擇。
當然除了上面三個流行的NoSQL,還有很多優秀的NoSQL資料庫,而且他們都有各自擅長領域,所以需要了解你們產品自身的特點然後分析選擇哪種才是最適合的,往往在大型系統中不是單一的資料庫,而是使用多種資料庫組合。

D. nosql資料庫的基本要求

Nosql全稱是Not Only SQL,是一種不同於關系型資料庫的資料庫管理系統設計方式。對NoSQL最普遍的解釋是「非關系型的」,強調Key-Value Stores和文檔資料庫的優點,而不是單純的反對RDBMS

E. python量化哪個平台可以回測模擬實盤還不要錢

Python量化投資框架:回測+模擬+實盤
Python量化投資 模擬交易 平台 1. 股票量化投資框架體系 1.1 回測 實盤交易前,必須對量化交易策略進行回測和模擬,以確定策略是否有效,並進行改進和優化。作為一般人而言,你能想到的,一般都有人做過了。回測框架也如此。當前小白看到的主要有如下五個回測框架: Zipline :事件驅動框架,國外很流行。缺陷是不適合國內市場。 PyAlgoTrade : 事件驅動框架,最新更新日期為16年8月17號。支持國內市場,應用python 2.7開發,最大的bug在於不支持3.5的版本,以及不支持強大的pandas。 pybacktest :以處理向量數據的方式進行回測,最新更新日期為2個月前,更新不穩定。 TradingWithPython:基於pybacktest,進行重構。參考資料較少。 ultra-finance:在github的項目兩年前就停止更新了,最新的項目在谷歌平台,無奈打不開網址,感興趣的話,請自行查看吧。 RQAlpha:事件驅動框架,適合A股市場,自帶日線數據。是米筐的回測開源框架,相對而言,個人更喜歡這個平台。 2 模擬 模擬交易,同樣是實盤交易前的重要一步。以防止類似於當前某券商的事件,半小時之內虧損上億,對整個股市都產生了惡劣影響。模擬交易,重點考慮的是程序的交易邏輯是否可靠無誤,數據傳輸的各種情況是否都考慮到。 當下,個人看到的,喜歡用的開源平台是雪球模擬交易,其次是wind提供的模擬交易介面。像優礦、米筐和聚寬提供的,由於只能在線上平台測試,不甚自由,並無太多感覺。 雪球模擬交易:在後續實盤交易模塊,再進行重點介紹,主要應用的是一個開源的easytrader系列。 Wind模擬交易:若沒有機構版的話,可以考慮應用學生免費版。具體模擬交易介面可參看如下鏈接:http://www.dajiangzhang.com/document 3 實盤 實盤,無疑是我們的終極目標。股票程序化交易,已經被限制。但對於萬能的我們而言,總有解決的辦法。當下最多的是破解券商網頁版的交易介面,或者說應用爬蟲爬去操作。對我而言,比較傾向於食燈鬼的easytrader系列的開源平台。對於機構用戶而言,由於資金量較大,出於安全性和可靠性的考慮,並不建議應用。 easytrader系列當前主要有三個組成部分: easytrader:提供券商華泰/傭金寶/銀河/廣發/雪球的基金、股票自動程序化交易,量化交易組件 easyquotation : 實時獲取新浪 / Leverfun 的免費股票以及 level2 十檔行情 / 集思路的分級基金行情 easyhistory : 用於獲取維護股票的歷史數據 easyquant : 股票量化框架,支持行情獲取以及交易 2. 期貨量化投資框架體系 一直待在私募或者券商,做的是股票相關的內容,對期貨這塊不甚熟悉。就根據自己所了解的,簡單總結一下。 2.1 回測 回測,貌似並沒有非常流行的開源框架。可能的原因有二:期貨相對股票而言,門檻較高,更多是機構交易,開源較少; 去年至今對期貨監管控制比較嚴,至今未放開,只能做些CTA的策略,另許多人興致泱泱吧。 就個人理解而言,可能wind的是一個相對合適的選擇。 2.2 模擬 + 實盤 vn.py是國內最為流行的一個開源平台。起源於國內私募的自主交易系統,2015年初啟動時只是單純的交易API介面的Python封裝。隨著業內關注度的上升和社區不斷的貢獻,目前已經一步步成長為一套全面的交易程序開發框架。如官網所說,該框架側重的是交易模塊,回測模塊並未支持。 能力有限,如果對相關框架感興趣的話,就詳看相關的鏈接吧。個人期望的是以RQAlpha為主搭建回測框架,以雪球或wind為主搭建模擬框架,用easy系列進行交易。

F. NoSQL自動生成上千萬的數據可以有哪些方法

1. CouchDB

所用語言: Erlang
特點:DB一致性,易於使用
使用許可: Apache
協議: HTTP/REST
雙向數據復制,
持續進行或臨時處理,
處理時帶沖突檢查,
因此,採用的是master-master復制(見編注2)
MVCC – 寫操作不阻塞讀操作
可保存文件之前的版本
Crash-only(可靠的)設計
需要不時地進行數據壓縮
視圖:嵌入式 映射/減少
格式化視圖:列表顯示
支持進行伺服器端文檔驗證
支持認證
根據變化實時更新
支持附件處理
因此, CouchApps(獨立的 js應用程序)
需要 jQuery程序庫

最佳應用場景:適用於數據變化較少,執行預定義查詢,進行數據統計的應用程序。適用於需要提供數據版本支持的應用程序。

例如: CRM、CMS系統。 master-master復制對於多站點部署是非常有用的。

(編注2:master-master復制:是一種資料庫同步方法,允許數據在一組計算機之間共享數據,並且可以通過小組中任意成員在組內進行數據更新。)

2. Redis

所用語言:C/C++
特點:運行異常快
使用許可: BSD
協議:類 Telnet
有硬碟存儲支持的內存資料庫,
但自2.0版本以後可以將數據交換到硬碟(注意, 2.4以後版本不支持該特性!)
Master-slave復制(見編注3)
雖然採用簡單數據或以鍵值索引的哈希表,但也支持復雜操作,例如 ZREVRANGEBYSCORE。
INCR & co (適合計算極限值或統計數據)
支持 sets(同時也支持 union/diff/inter)
支持列表(同時也支持隊列;阻塞式 pop操作)
支持哈希表(帶有多個域的對象)
支持排序 sets(高得分表,適用於范圍查詢)
Redis支持事務
支持將數據設置成過期數據(類似快速緩沖區設計)
Pub/Sub允許用戶實現消息機制

最佳應用場景:適用於數據變化快且資料庫大小可遇見(適合內存容量)的應用程序。

例如:股票價格、數據分析、實時數據搜集、實時通訊。

(編注3:Master-slave復制:如果同一時刻只有一台伺服器處理所有的復制請求,這被稱為
Master-slave復制,通常應用在需要提供高可用性的伺服器集群。)

3. MongoDB

所用語言:C++
特點:保留了SQL一些友好的特性(查詢,索引)。
使用許可: AGPL(發起者: Apache)
協議: Custom, binary( BSON)
Master/slave復制(支持自動錯誤恢復,使用 sets 復制)
內建分片機制
支持 javascript表達式查詢
可在伺服器端執行任意的 javascript函數
update-in-place支持比CouchDB更好
在數據存儲時採用內存到文件映射
對性能的關注超過對功能的要求
建議最好打開日誌功能(參數 –journal)
在32位操作系統上,資料庫大小限制在約2.5Gb
空資料庫大約占 192Mb
採用 GridFS存儲大數據或元數據(不是真正的文件系統)

最佳應用場景:適用於需要動態查詢支持;需要使用索引而不是 map/rece功能;需要對大資料庫有性能要求;需要使用
CouchDB但因為數據改變太頻繁而占滿內存的應用程序。

例如:你本打算採用 MySQL或 PostgreSQL,但因為它們本身自帶的預定義欄讓你望而卻步。

4. Riak

所用語言:Erlang和C,以及一些Javascript
特點:具備容錯能力
使用許可: Apache
協議: HTTP/REST或者 custom binary
可調節的分發及復制(N, R, W)
用 JavaScript or Erlang在操作前或操作後進行驗證和安全支持。
使用JavaScript或Erlang進行 Map/rece
連接及連接遍歷:可作為圖形資料庫使用
索引:輸入元數據進行搜索(1.0版本即將支持)
大數據對象支持( Luwak)
提供「開源」和「企業」兩個版本
全文本搜索,索引,通過 Riak搜索伺服器查詢( beta版)
支持Masterless多站點復制及商業許可的 SNMP監控

最佳應用場景:適用於想使用類似 Cassandra(類似Dynamo)資料庫但無法處理
bloat及復雜性的情況。適用於你打算做多站點復制,但又需要對單個站點的擴展性,可用性及出錯處理有要求的情況。

例如:銷售數據搜集,工廠控制系統;對宕機時間有嚴格要求;可以作為易於更新的 web伺服器使用。

5. Membase

所用語言: Erlang和C
特點:兼容 Memcache,但同時兼具持久化和支持集群
使用許可: Apache 2.0
協議:分布式緩存及擴展
非常快速(200k+/秒),通過鍵值索引數據
可持久化存儲到硬碟
所有節點都是唯一的( master-master復制)
在內存中同樣支持類似分布式緩存的緩存單元
寫數據時通過去除重復數據來減少 IO
提供非常好的集群管理 web界面
更新軟體時軟無需停止資料庫服務
支持連接池和多路復用的連接代理

最佳應用場景:適用於需要低延遲數據訪問,高並發支持以及高可用性的應用程序

例如:低延遲數據訪問比如以廣告為目標的應用,高並發的 web 應用比如網路游戲(例如 Zynga)

6. Neo4j

所用語言: Java
特點:基於關系的圖形資料庫
使用許可: GPL,其中一些特性使用 AGPL/商業許可
協議: HTTP/REST(或嵌入在 Java中)
可獨立使用或嵌入到 Java應用程序
圖形的節點和邊都可以帶有元數據
很好的自帶web管理功能
使用多種演算法支持路徑搜索
使用鍵值和關系進行索引
為讀操作進行優化
支持事務(用 Java api)
使用 Gremlin圖形遍歷語言
支持 Groovy腳本
支持在線備份,高級監控及高可靠性支持使用 AGPL/商業許可

最佳應用場景:適用於圖形一類數據。這是 Neo4j與其他nosql資料庫的最顯著區別

例如:社會關系,公共交通網路,地圖及網路拓譜

7. Cassandra

所用語言: Java
特點:對大型表格和 Dynamo支持得最好
使用許可: Apache
協議: Custom, binary (節約型)
可調節的分發及復制(N, R, W)
支持以某個范圍的鍵值通過列查詢
類似大表格的功能:列,某個特性的列集合
寫操作比讀操作更快
基於 Apache分布式平台盡可能地 Map/rece
我承認對 Cassandra有偏見,一部分是因為它本身的臃腫和復雜性,也因為 Java的問題(配置,出現異常,等等)

最佳應用場景:當使用寫操作多過讀操作(記錄日誌)如果每個系統組建都必須用 Java編寫(沒有人因為選用
Apache的軟體被解僱)

例如:銀行業,金融業(雖然對於金融交易不是必須的,但這些產業對資料庫的要求會比它們更大)寫比讀更快,所以一個自然的特性就是實時數據分析

8. HBase

(配合 ghshephard使用)

所用語言: Java
特點:支持數十億行X上百萬列
使用許可: Apache
協議:HTTP/REST (支持 Thrift,見編注4)
在 BigTable之後建模
採用分布式架構 Map/rece
對實時查詢進行優化
高性能 Thrift網關
通過在server端掃描及過濾實現對查詢操作預判
支持 XML, Protobuf, 和binary的HTTP
Cascading, hive, and pig source and sink moles
基於 Jruby( JIRB)的shell
對配置改變和較小的升級都會重新回滾
不會出現單點故障
堪比MySQL的隨機訪問性能

最佳應用場景:適用於偏好BigTable:)並且需要對大數據進行隨機、實時訪問的場合。

例如: Facebook消息資料庫(更多通用的用例即將出現)

編注4:Thrift
是一種介面定義語言,為多種其他語言提供定義和創建服務,由Facebook開發並開源。

當然,所有的系統都不只具有上面列出的這些特性。這里我僅僅根據自己的觀點列出一些我認為的重要特性。與此同時,技術進步是飛速的,所以上述的內容肯定需要不斷更新。我會盡我所能地更新這個列表。

G. 量化交易都有哪些主要的策略模型

研究量化投資模型的目的是找出那些具體盈利確定性的時空價格形態,其最重要手段的概率取勝,最重要的技術是概率統計,最主要的研究方向是市場行為心理。那麼我們在選擇用於研究的參數時,也應該用我們的經驗來確定是否把某技術參數放進去,因為一般來說定性投資比較好用的參數指標對量化投資同樣適用。
量化投資區別於傳統定性投資的主要特徵在於模型。我打個比方,我們看病,中醫與西醫的診療方法是不同,中醫是望、聞、問、切,最後判斷出的結果,很大程度上基於中醫的經驗,主觀定性程度大一些;西醫就不同了,先要病人去拍片子、化驗等,這些都要依託於醫學儀器,最後得出結論,對症下葯。中醫對醫生的經驗要求非常高,他們的主觀判斷往往決定了治療效果,而西醫則要從容得多,按事先規定好的程序走就行了。量化投資就是股票投資中的西醫,它可以比較有效地矯正理智與情緒的不兼容現象。
量化投資的一般思路:選定某些技術指標(我們稱之為參數,往往幾個組成一組),並將每一個參數的數據范圍進行分割,成幾等份。然後,用計算機編程寫出一段能對這些參數組對股票價格造成的影響進行數據統計的程序,連接至大型資料庫進行統計計算,自動選擇能夠達到較高收益水平的參數組合。但是選出這些參數組後還不能馬上應用,因為這里涉及到一個概率陷阱的問題,比如說,有1到100這一百個數字放在那裡,現在讓你選擇,請問你選到100的可能性是多大?是的,就是1/100,如果較幸運你選到了100並不能說明你比別人聰明,而是概率的必然。所以,在進行統計時要特別關注統計的頻率與選出的結果組數量之間的關系。在選出符合要求的參數組後我們還應留出至少三年的原始市場數據進行驗證,只有驗證合格後才能試用。

量化投資原始數據策略:我們選用96年後的市場數據,因為96年股市有過一次交易政策改革(你可以自己查詢了解一下),為了不影響研究結果我們不採納96年以前的數據進資料庫。 量化投資研究的硬設備:高計算性能電腦,家用電腦也可以,不過運算時間會很長,我曾經用家用電腦計算了三個月時間才得到想要的數據。
統計方法:可以選用遺傳演算法,但我在這里陪大家做的是比較簡單的模型,所以採用普通統計方法就可以了。
用於量化研究的軟體:我採用的是免費的大型資料庫MYSQL,ASP網路編程語言,以及可以設置成網路伺服器的旗艦版WIN7操作系統。

H. 現在學哪個nosql資料庫比較好

NoSQL,是not only sql,是非關系資料庫,不同於oracle等關系資料庫。hadoop,是分布式解決方案,即為Maprece(計算的)和HDFS(文件系統),使用Hadoop和NoSQL可以構造海量數據解決方案。

I. 量化交易主要有哪些好的策略

研究量化投資模型的目的是找出那些具體盈利確定性的時空價格形態,其最重要手段的概率取勝,最重要的技術是概率統計,最主要的研究方向是市場行為心理。那麼我們在選擇用於研究的參數時,也應該用我們的經驗來確定是否把某技術參數放進去,因為一般來說定性投資比較好用的參數指標對量化投資同樣適用。
量化投資區別於傳統定性投資的主要特徵在於模型。我打個比方,我們看病,中醫與西醫的診療方法是不同,中醫是望、聞、問、切,最後判斷出的結果,很大程度上基於中醫的經驗,主觀定性程度大一些;西醫就不同了,先要病人去拍片子、化驗等,這些都要依託於醫學儀器,最後得出結論,對症下葯。中醫對醫生的經驗要求非常高,他們的主觀判斷往往決定了治療效果,而西醫則要從容得多,按事先規定好的程序走就行了。量化投資就是股票投資中的西醫,它可以比較有效地矯正理智與情緒的不兼容現象。
量化投資的一般思路:選定某些技術指標(我們稱之為參數,往往幾個組成一組),並將每一個參數的數據范圍進行分割,成幾等份。然後,用計算機編程寫出一段能對這些參數組對股票價格造成的影響進行數據統計的程序,連接至大型資料庫進行統計計算,自動選擇能夠達到較高收益水平的參數組合。但是選出這些參數組後還不能馬上應用,因為這里涉及到一個概率陷阱的問題,比如說,有1到100這一百個數字放在那裡,現在讓你選擇,請問你選到100的可能性是多大?是的,就是1/100,如果較幸運你選到了100並不能說明你比別人聰明,而是概率的必然。所以,在進行統計時要特別關注統計的頻率與選出的結果組數量之間的關系。在選出符合要求的參數組後我們還應留出至少三年的原始市場數據進行驗證,只有驗證合格後才能試用。
量化投資原始數據策略:我們選用96年後的市場數據,因為96年股市有過一次交易政策改革(你可以自己查詢了解一下),為了不影響研究結果我們不採納96年以前的數據進資料庫。
量化投資研究的硬設備:高計算性能電腦,家用電腦也可以,不過運算時間會很長,我曾經用家用電腦計算了三個月時間才得到想要的數據。
統計方法:可以選用遺傳演算法,但我在這里陪大家做的是比較簡單的模型,所以採用普通統計方法就可以了。
用於量化研究的軟體:我採用的是免費的大型資料庫mysql,asp網路編程語言,以及可以設置成網路伺服器的旗艦版win7操作系統。

熱點內容
金融生應該如何奉獻社會 發布:2025-07-26 20:15:16 瀏覽:232
學理財課多少學費合適 發布:2025-07-26 19:58:55 瀏覽:415
如何理解貨幣的流通次數 發布:2025-07-26 19:56:44 瀏覽:978
股票投資年收益年均一般能達到多少 發布:2025-07-26 19:55:57 瀏覽:577
國內科技股票代碼 發布:2025-07-26 19:49:48 瀏覽:691
非法金融活動怎麼判 發布:2025-07-26 19:45:28 瀏覽:411
美格智能股票歷史價 發布:2025-07-26 18:36:41 瀏覽:302
投資期貨的原始憑證是什麼 發布:2025-07-26 18:14:40 瀏覽:834
如何開拓金融行業培訓 發布:2025-07-26 18:12:09 瀏覽:933
古井貢酒歷史股票行情 發布:2025-07-26 17:33:40 瀏覽:872