[綜合]無題 無名 ID:XDy1A4iM 2020/12/16(三) 00:34:25.838 No.20916939 評分:-1, 年:-1, 月:-1, 週:-1, 日:-1, [+1 / -1] 最後更新:2021-07-28 19:05:44
這幾個月都在耍廢看vtuber
最近終於又重新開始了專案
今年內應該會生出來
島民的ㄐㄐ由我來統治= =
無題 無名 ID:XDy1A4iM 2020/12/16(三) 00:35:49.458 No.20916959
無本文
無題 無名 ID:EpOwClds 2020/12/16(三) 00:37:51.518 No.20916985
射精管理
無題 無名 ID:v51Sywis 2020/12/16(三) 00:48:19.736 No.20917060 島這是要為伊甸園留下一塊備用的土地嗎
好奇如果你有要用爬蟲去抓圖的話
抓下來的圖片怎麼儲存
上次浩劫聽說全部有50TB= =
另外熊貓會不會擋IP鎖會員
如果你短時間頻繁抓圖的話
有用Proxy之類的嗎
以上請問專業島島~
無題 無名 ID:uJLqq.XU 2020/12/16(三) 00:51:06.516 No.20917090 >>20917060路過回答
1. 這是react.js 離線閱讀器
2. 儲存方面只能用錢去解決
3. 熊貓會ban ip, 建議減少線程數, 然後定期換ip
無題 無名 ID:XDy1A4iM 2020/12/16(三) 00:51:45.368 No.20917096 >>20917033概念上類似這個軟體
https://www.ptt.cc/bbs/AC_In/M.1569436760.A.261.html
但更注重在瀏覽上面
他的程式是用來管理的,我的程式更多是用來看圖的
像是可以在看本途中用快捷鍵"["、"]"切換上下本
還可以限制瀏覽範圍,像我用搜尋限定了3個tag,所以瀏覽範圍就會是含有這3個tag的本子
無題 無名 ID:iJs3rfPg 2020/12/16(三) 00:54:09.296 No.20917120 無題 無名 ID:uJLqq.XU 2020/12/16(三) 00:56:05.781 No.20917141 >>20916939想請教一下原PO, 我還不太熟悉js,
react.js 能實現多線程讀取嗎?
是用Web Worker 還是 wasm之類的方式實現嗎?
無題 無名 ID:XDy1A4iM 2020/12/16(三) 00:59:23.723 No.20917159
>>20917120沒有了
而且匹配率不高,每次開啟時載入太慢
我的程式參考他的演算法做出修改,改成比起正確率更注重匹配率
無題 無名 ID:XDy1A4iM 2020/12/16(三) 01:00:23.295 No.20917167 無題 無名 ID:a40pc86E 2020/12/16(三) 01:04:39.847 No.20917204
無題 無名 ID:a40pc86E 2020/12/16(三) 01:05:43.248 No.20917215
無題 無名 ID:v51Sywis 2020/12/16(三) 01:07:06.472 No.20917230 謝島回答
Tag我是覺得英文+假名漢字就好
畢竟大家都看熊貓還有日本片長大的
無題 無名 ID:v51Sywis 2020/12/16(三) 01:09:26.999 No.20917249
無題 無名 ID:gzvC4nEo 2020/12/16(三) 01:11:51.080 No.20917261 >>20917060>>好奇如果你有要用爬蟲去抓圖的話 抓下來的圖片怎麼儲存
有人有寫出自動打包程式
就是每一本會儲存成.zip 還會包含一個關於這本在熊貓裡面的本本名稱跟資訊的.txt檔在裡面
>>上次浩劫聽說全部有50TB= =
熊貓網站一堆重複的本本 我覺得實際容量可能比50TB少很多
>>另外熊貓會不會擋IP鎖會員 如果你短時間頻繁抓圖的話
熊貓本來就有對IP做流量管制
花錢買會員就可以提高流量
無題 無名 ID:XDy1A4iM 2020/12/16(三) 01:16:25.275 No.20917286
無題 無名 ID:XDy1A4iM 2020/12/16(三) 01:19:17.847 No.20917300 另外提一下
中文翻譯是從這個專案拿資料,直接簡轉繁搞出來的
所以有些名詞是支語
支語警察可以自己翻
無題 無名 ID:XDy1A4iM 2020/12/16(三) 01:20:52.536 No.20917308 >>20917300忘記放網址= =
https://github.com/EhTagTranslation/EhSyringe
反正2020內會生出來,就慢慢等八
無題 無名 ID:uJLqq.XU 2020/12/16(三) 01:24:23.110 No.20917332 >>20917308我是上面問多執行緒的, 剛剛查了一下js的資料,
js在多執行緒處理方面似乎表現不佳, 如果讀取200+頁的本子,
會有效能瓶頸嗎?
無題 無名 ID:v51Sywis 2020/12/16(三) 01:25:49.693 No.20917344
無題 無名 ID:gzvC4nEo 2020/12/16(三) 01:26:03.447 No.20917347
>>20917290我就已經抓了快8千頁的原始檔案
扣除掉重複的本本 再用RAR壓縮也才8TB多一點左右
現在熊貓也還不到3萬5千多頁
無題 無名 ID:GdCk6TUM 2020/12/16(三) 01:29:55.910 No.20917370
無題 無名 ID:XDy1A4iM 2020/12/16(三) 01:39:31.816 No.20917414 >>20917332js有非同步執行函式,理論上來說如果善用是可以完全平行化的
然後效能瓶頸可以參考chrome/chromium,圖片讀取函式完全由chromium處理
使用的是electron,目前感受是一次大量圖片解碼速度反而效果不錯,但單一圖片解碼速度有些許延遲感(瀏覽圖片時)
目前採用預先解碼來迴避這問題,但大檔案圖片就算解碼完成,插入DOM時還是有延遲(不確定)
無題 無名 ID:DI1yuvPk 2020/12/16(三) 02:52:26.378 No.20917726
>>20917414感謝回答,我前幾個月有跟到你的串,
不過我居然記錯了...,原來是electron
我之前是用wxpython,感覺electron也蠻不錯的,
感謝你的解說
無題 無名 ID:X9J7pOCM 2020/12/16(三) 03:04:36.837 No.20917776
無題 無名 ID:330lYVww 2020/12/16(三) 03:08:24.509 No.20917791