增加網址:
文章備註、標題(會記錄下來,但是暫時不會顯示):
[綜合]無題 無名 ID:XDy1A4iM 2020/12/16(三) 00:34:25.838 No.20916939
評分:-1, 年:-1, 月:-1, 週:-1, 日:-1, [+1 / -1] 最後更新:2021-07-28 19:05:44
附圖
這幾個月都在耍廢看vtuber
最近終於又重新開始了專案
今年內應該會生出來
島民的ㄐㄐ由我來統治= =
無題 無名 ID:XDy1A4iM 2020/12/16(三) 00:35:49.458 No.20916959
附圖
無本文
無題 無名 ID:XDy1A4iM 2020/12/16(三) 00:37:26.978 No.20916980
回覆: >>20917033
附圖
有什麼想問的就問八
邊寫程式邊回答
無題 無名 ID:EpOwClds 2020/12/16(三) 00:37:51.518 No.20916985
射精管理
無題 無名 ID:a40pc86E 2020/12/16(三) 00:44:36.437 No.20917033
回覆: >>20917096
>>20916980
是什麼軟體?
無題 無名 ID:KOBwHNHQ 2020/12/16(三) 00:45:53.912 No.20917041
回覆: >>20917112
>>20916939
島民根本不需要中文= =
無題 無名 ID:v51Sywis 2020/12/16(三) 00:48:19.736 No.20917060
島這是要為伊甸園留下一塊備用的土地嗎

好奇如果你有要用爬蟲去抓圖的話
抓下來的圖片怎麼儲存
上次浩劫聽說全部有50TB= =
另外熊貓會不會擋IP鎖會員
如果你短時間頻繁抓圖的話
有用Proxy之類的嗎

以上請問專業島島~
無題 無名 ID:uJLqq.XU 2020/12/16(三) 00:51:06.516 No.20917090
>>20917060
路過回答
1. 這是react.js 離線閱讀器
2. 儲存方面只能用錢去解決
3. 熊貓會ban ip, 建議減少線程數, 然後定期換ip
無題 無名 ID:XDy1A4iM 2020/12/16(三) 00:51:45.368 No.20917096
附圖
>>20917033
概念上類似這個軟體
https://www.ptt.cc/bbs/AC_In/M.1569436760.A.261.html
但更注重在瀏覽上面
他的程式是用來管理的,我的程式更多是用來看圖的
像是可以在看本途中用快捷鍵"["、"]"切換上下本
還可以限制瀏覽範圍,像我用搜尋限定了3個tag,所以瀏覽範圍就會是含有這3個tag的本子
無題 無名 ID:XDy1A4iM 2020/12/16(三) 00:53:10.188 No.20917112
回覆: >>20917204
附圖
>>20917041
阿我上次問就一堆人要中文阿
我還附贈一個中文解釋欸= =
無題 無名 ID:iJs3rfPg 2020/12/16(三) 00:54:09.296 No.20917120
回覆: >>20917159
>>20917096
這個 紳士方舟 Hentai Ark 還有載點嗎?
無題 無名 ID:Dql1U3kQ 2020/12/16(三) 00:54:18.402 No.20917123
回覆: >>20917167
>>20917096
簡單說是改良版?
不過熊貓的最大問題是下載不知道那些下載過那些沒有
整理比較麻煩
無題 無名 ID:KOBwHNHQ 2020/12/16(三) 00:55:21.939 No.20917137
回覆: >>20917155
>>20917090
爬蟲不會對原站有影響嗎= =
到時候又害亞洲IP被ban
無題 無名 ID:uJLqq.XU 2020/12/16(三) 00:56:05.781 No.20917141
回覆: >>20917207
>>20916939
想請教一下原PO, 我還不太熟悉js,
react.js 能實現多線程讀取嗎?
是用Web Worker 還是 wasm之類的方式實現嗎?
無題 無名 ID:uJLqq.XU 2020/12/16(三) 00:58:45.563 No.20917155
回覆: >>20917207
>>20917137
限制兩線程 模擬人類手速,
一次只爬一本, 沒這麼嚴重吧,
有些人被ban是線程數開太高了
無題 無名 ID:XDy1A4iM 2020/12/16(三) 00:59:23.723 No.20917159
附圖
>>20917120
沒有了
而且匹配率不高,每次開啟時載入太慢
我的程式參考他的演算法做出修改,改成比起正確率更注重匹配率
無題 無名 ID:XDy1A4iM 2020/12/16(三) 01:00:23.295 No.20917167
回覆: >>20917215
附圖
>>20917123
自動匹配
Hentai Ark有手動匹配,我的程式就只能自動匹配
無題 無名 ID:a40pc86E 2020/12/16(三) 01:04:39.847 No.20917204
>>20917096
讚喔
希望能有個鍵是可以切換圖上半部->圖下半部->下頁圖上半部的順序
比較好尻
>>20917112
中文很讚啊
tag性癖的英文都太冷門很難懂
無題 無名 ID:uHGYeoQ. 2020/12/16(三) 01:04:50.420 No.20917207
回覆: >>20917236
無題 無名 ID:a40pc86E 2020/12/16(三) 01:05:43.248 No.20917215
>>20917167
還是彩虹推
真識貨
無題 無名 ID:v51Sywis 2020/12/16(三) 01:07:06.472 No.20917230
回覆: >>20917286
附圖
謝島回答
Tag我是覺得英文+假名漢字就好
畢竟大家都看熊貓還有日本片長大的
無題 無名 ID:uJLqq.XU 2020/12/16(三) 01:07:48.111 No.20917236
回覆: >>20917249
>>20917207
好好好 工作辛苦了,
之前有些資料是看中國,一時還沒轉換過來,
我改thread可以了吧?
無題 無名 ID:v51Sywis 2020/12/16(三) 01:09:26.999 No.20917249
>>20917236
支語警察就不要理了XD
中文是有個翻譯叫做執行緒
無題 無名 ID:gzvC4nEo 2020/12/16(三) 01:11:51.080 No.20917261
回覆: >>20917290
>>20917060
>>好奇如果你有要用爬蟲去抓圖的話 抓下來的圖片怎麼儲存
有人有寫出自動打包程式
就是每一本會儲存成.zip 還會包含一個關於這本在熊貓裡面的本本名稱跟資訊的.txt檔在裡面

>>上次浩劫聽說全部有50TB= =
熊貓網站一堆重複的本本 我覺得實際容量可能比50TB少很多

>>另外熊貓會不會擋IP鎖會員 如果你短時間頻繁抓圖的話
熊貓本來就有對IP做流量管制
花錢買會員就可以提高流量
無題 無名 ID:XDy1A4iM 2020/12/16(三) 01:16:25.275 No.20917286
附圖
>>20917230
移到上面會顯示原文
無題 無名 ID:uJLqq.XU 2020/12/16(三) 01:17:02.366 No.20917290
>>20917261
50TB應該是未壓縮的,
熊貓壓過的都是jpeg q80 1x1x1,
壓過的應該沒有這麼多TB?
無題 無名 ID:XDy1A4iM 2020/12/16(三) 01:19:17.847 No.20917300
回覆: >>20917308
附圖
另外提一下
中文翻譯是從這個專案拿資料,直接簡轉繁搞出來的
所以有些名詞是支語
支語警察可以自己翻
無題 無名 ID:XDy1A4iM 2020/12/16(三) 01:20:52.536 No.20917308
附圖
>>20917300
忘記放網址= =
https://github.com/EhTagTranslation/EhSyringe
反正2020內會生出來,就慢慢等八
無題 無名 ID:uJLqq.XU 2020/12/16(三) 01:24:23.110 No.20917332
回覆: >>20917414
>>20917308
我是上面問多執行緒的, 剛剛查了一下js的資料,
js在多執行緒處理方面似乎表現不佳, 如果讀取200+頁的本子,
會有效能瓶頸嗎?
無題 無名 ID:v51Sywis 2020/12/16(三) 01:25:49.693 No.20917344
>>20917290
全站算50萬本的話
假設主要都圖片1本單平均100MB
這個數字好像差不多?
早期很多畫廊檔案偏小
近期是有部分畫廊掃出來檔案很肥

>>20917308
期待個 島島加油!
無題 無名 ID:gzvC4nEo 2020/12/16(三) 01:26:03.447 No.20917347
>>20917290
我就已經抓了快8千頁的原始檔案
扣除掉重複的本本 再用RAR壓縮也才8TB多一點左右
現在熊貓也還不到3萬5千多頁
無題 無名 ID:GdCk6TUM 2020/12/16(三) 01:29:55.910 No.20917370
>>20917096
射精專用神器?
如果tag和瀏覽範圍等設定可以滙出成一個檔案再分享給他人就更好了
無題 無名 ID:XDy1A4iM 2020/12/16(三) 01:39:31.816 No.20917414
回覆: >>20917726
附圖
>>20917332
js有非同步執行函式,理論上來說如果善用是可以完全平行化的
然後效能瓶頸可以參考chrome/chromium,圖片讀取函式完全由chromium處理
使用的是electron,目前感受是一次大量圖片解碼速度反而效果不錯,但單一圖片解碼速度有些許延遲感(瀏覽圖片時)
目前採用預先解碼來迴避這問題,但大檔案圖片就算解碼完成,插入DOM時還是有延遲(不確定)
無題 無名 ID:DI1yuvPk 2020/12/16(三) 02:52:26.378 No.20917726
>>20917414
感謝回答,我前幾個月有跟到你的串,
不過我居然記錯了...,原來是electron

我之前是用wxpython,感覺electron也蠻不錯的,
感謝你的解說
無題 無名 ID:X9J7pOCM 2020/12/16(三) 03:04:36.837 No.20917776
無題 無名 ID:330lYVww 2020/12/16(三) 03:08:24.509 No.20917791
>>20916939
你做得真好
怎麼稱呼你呢?