數據流動性和系統互操作性
如何對複雜的異質數據和系統進行自動化對齊和管理?
數據集成和分析是解決我們最大挑戰的瓶頸,從做科學和創造通用人工智能到介於兩者之間的一切。對集成數據的需求,可以從一些創業公司的數量上看出來,這些公司只專注於收集感興趣的整齊劃一的數據集清單,並將專項查詢貨幣化。對於涉及內在異質數據的工作來說,如藥物發現、複雜設計、社會學研究等,高度一致的高質量數據集是金礦。衆多數據格式和標準的存在,使任何如"列出世界上所有狗的名單"之類簡單的問題,對於專注於其它特定領域的創業公司來說,是一個難以逾越的追求。現有的解決方案,如鏈接的本體感知數據格式不夠靈活和豐富,無法方便地從任意特設詞彙表中定義具有多詞彙字段的記錄,而且缺乏對值類型的定義、可調用對象接口和修改權限的支持,使得對象無法在與產生它們的數據管理系統解耦後仍能保留屬性。
當前廣爲人知的解決方案(如“鏈接數據”),並不完全適合這個問題,因爲它們需要將大量數據以相同格式序列化,而在日益多樣化的世界中從來沒有這種情況,而且沒有標準的方法將模式、權限和其他上下文數據嵌入到數據項中,這是使它們在查詢中可以重用的必要條件。
將基於RDF的SPARQL(用於對齊)與OAUTH2(用於許可)和一些與標準結合以安全地加密關於查詢源上下文的數據(如查詢源身份密鑰、Cookie、IP地址和資源的架構版本的定義,數據來自何處),它可能會接近所需的數據屬性,即保留在任意編程語言的上下文中作爲對象重用數據項的能力,而不需要編寫自定義集成。然而這似乎尚未完成,可能有更好的方案來解決該問題。
例如,由於網絡中系統的多樣性和複雜性(協議和格式),可能還有其他(更好的?)方法來解決這個問題,基於使用驅動程序的設備的即插即用原理,允許抽象化Web資源API,並將功能齊全的多態交互數據作爲所有編程語言的共享功能,將網站和Web系統(包括去中心化系統)作爲操作系統設備直接作爲變量提供給編程語言。
無論選擇何種實現方式,數據流動性和系統互操作性似乎仍然是重要的未解決問題,也是在衆多數字活動領域中快速發展的瓶頸。
Create a polycontext metasymbol, and overcome the fact that standardization does not generalize.
In designing this data liquidity system, we should have some idea of the kinds of questions we want to answer
Armed with a thesaurus and an almanac of system functionality we can write robots that program themselves
我對此表示贊同,因爲這也是我想發生的事情。我看到了兩種發生方式:
*人們合作並創建整合。
*人們不合作也不創建整合。在這種情況下,我們必須自己處理問題。我相信在操作系統或瀏覽器級別進行鍵盤記錄是保持我們自己數據所有權的唯一方法。
I'm upvoting this as it's something I want to happen too. I see two ways of it happening:
People cooperate and create integrations.
People don't cooperate and don't create integrations. In which case we have to take matters into our own hands. I believe keylogging at the operating system or browser level is the only way to keep ownership of our own data.
[+]