Adobe 發布開源工具 Stringlifier 識別隨機生成的字符串
Adobe已經發布了一個名為Stringlifier的開源工具,該工具允許用戶識別任何純文本中隨機生成的字符串,該工具可用于清理日志。
Stringlifier工具是用Python編寫的,它使用機器學習來識別插入普通文本中的隨機字符序列。
開源工具可用于出于多種目的分析日志,例如研究意外暴露的憑證。
“ Stringlifier是我們最新的開源項目,它可以幫助您解決這一通常很困難的任務。該項目是一個開放源代碼的python軟件包,可讓您檢測類似于任何純文本中隨機生成的字符串的代碼/文本。它使用機器學習來區分正常字符序列和隨機字符序列。它也可以適用于更細粒度的分類(密碼,API密鑰,哈希等)。” 閱讀Adobe發布的帖子寫道。
Stringlifier能夠在源代碼或配置文件中查找API密鑰,哈希,隨機生成的字符串,包括密碼,日志。
“字符串分類器–是用于檢測隨機字符串和散列文本/代碼的python模塊。” Adobe在Github上發布的描述中寫道。
“典型的使用場景包括:
- 清理應用程序或安全日志
- 檢測意外暴露的憑據(復雜的密碼或API密鑰) “
Stringlifier工具的源代碼可從Adobe的公共GitHub存儲庫中獲得。Adobe還發布了一個Python包安裝程序,包括一個預先訓練好的模型。
您可以通過pip-installation快速使用stringlifier:
$ pip安裝stringlifier
API示例:
來自 stringlifier。api 導入 Stringlifier
stringlifier = Stringlifier()
小號 = stringlifier(“com.docker.hyperkit -A -u -F虛擬機/ 0 / hyperkit.pid -c 8 -m 8192M -b 127.0.0.1 --pass = \” NlcXVpYWRvcg \” -s 0:0,hostbridge -s 31,lpc -s 1:0,virtio-vpnkit,path = vpnkit.eth.sock,uuid = 45172425-08d1-41ec-9d13-437481803412 -U c6fb5010-a83e-4f74-9a5a-50d9086b9“)
之后,
s應為:
'/System/Library/DriverExtensions/AppleUserHIDDrivers.dext/AppleUserHIDDrivers com.apple.driverkit.AppleUserUSBHostHIDDevice0 <RANDOM_STRING>'
您還可以選擇查看完整的標記化和分類輸出:
小號,令牌 = stringlifier(“com.docker.hyperkit -A -u -F虛擬機/ 0 / hyperkit.pid -c 8 -m 8192M -b 127.0.0.1 --pass = \” NlcXVpYWRvcg \” -s 0:0 ,hostbridge -s 31,lpc -s 1:0,virtio-vpnkit,path = vpnkit.eth.sock,uuid = 45172425-08d1-41ec-9d13-437481803412 -U c6fb5010-a83e-4f74-9a5a-50d9086b9“,return_tokens = 真)
s與以前相同,tokens將包含以下數據:
[[('0' ,33,34,'<NUMERIC>' ),
('8' ,51,52,'<NUMERIC>' ),
('8192' ,56,60,'<NUMERIC>' ),
('127.0.0.1' ,65,74,'<IP_ADDR>' ),
('NlcXVpYWRvcg' ,83,95,'<RANDOM_STRING>' ),
('0' ,100,101,'<NUMERIC>' ),
('0' ,102,103,'<NUMERIC>' ),
('31' ,118,120,'<NUMERIC>' ),
('1' ,128,129,'<NUMERIC>' ),
('0' ,130,131,'<NUMERIC>' ),
('45172425-08d1-41ec-9d13-437481803412' ,172,208,'<UUID>' ),
( 'c6fb5010-a83e-4f74-9a5a-50d9086b9',212,244, '<UUID>')]]
Adobe已使用該工具識別數據集中的隨機字符串,以及另一個名為Tripod的開源工具。
Adobe透露,用于處理長字符串并將其轉換為數字形式的多種方法在遇到隨機字符串時會遇到問題。
專家們將所有隨機字符序列替換為 ;以便更容易地對類似類型的命令行進行分組,即使它們在參數中使用了隨機hash。
Adobe總結道:“我們希望你覺得stiringlifier有用。整個源代碼都可以在Adobe的GitHub存儲庫中找到。您還可以在該存儲庫中找到來自整個Adobe安全團隊的所有其他開源項目。”