עמוד 1 מתוך 1

מנוע סינון HTML.

הודעהפורסם: 01 פברואר 2015, 22:13
על ידי mat
אני רוצה למנות מישהו מתנדב שיהיה אחראי על מנוע סינון HTML. בצורה חכמה.

שיוכל לזהות מקטעים בדף לבדוק שם אם יש תוכן שלילי ע"י צירופים של מילים. הטיות וכו'. ולהסיר מקטעים שלילים.

כמובן שאני יהיה בתמונה. ויעזור בכל הידע שלי.

מי שחושב שהוא יכול לעשות את זה. מוזמן לפנות אלי למייל.
netfree613@gmail.com

שפות תיכנות אפשריות כל שפות לינוקס. עדיף JS או C.

Re: מנוע סינון HTML.

הודעהפורסם: 18 פברואר 2015, 20:51
על ידי ClickOne
הייתי מנסה לחשוב בצורה של דיבים. ז"א, ברגע שנמצאה מילה שלילית בדף, הדף נשלח לבדיקה נוספת, כאשר רציםעל הDOM במערך, ובודקים כל DIV בפני עצמו. (כמובן שיש עד אלמנטים שוי ערך לDIV ואפשר לבדוק גם אותם).
ברגע שנמצאה מילה שלילית בתוך DIV מסויים - כל הDIV נפסל, ונמחק מתוכן הדף.

אפשר להחליט על כמות מסויימת של מילים שליליות בדף שאז כל הדף ייפסל, לדוגמא: מעל 10 מילים שליליות,הדף יהיה חסום, גם אם האתר עצמו פתוח.

לגבי הטיות אם אני לא טועה ארכיטקט בעבר שאל על מנוע דומה. צריך לראות איתו מה יצא לו. (ארכיטקט?)

Re: מנוע סינון HTML.

הודעהפורסם: 06 מאי 2015, 16:45
על ידי shraga
יש התקדמות?

Re: מנוע סינון HTML.

הודעהפורסם: 06 מאי 2015, 19:20
על ידי MacroShadow
כל הזמן...
אם אתה מחפש תוצאות, צריך עדיין להתאזר בסבלנות.
הוא עוד לא מושלם אבל פועל באתרים מסויימים.

Re: מנוע סינון HTML.

הודעהפורסם: 06 מאי 2015, 19:25
על ידי shraga
באלו למשל?

Re: מנוע סינון HTML.

הודעהפורסם: 18 מאי 2015, 09:25
על ידי shraga
קבלו את מנוע סינון הטקסט
http://he.wikipedia.org/wiki/%D7%90%D7%95%D7%A0%D7%A1
אם מישהו יכול להביא הסברים, מתי הדף כולו עם * מתי פיסקה שלמה, ומתי רק כמה מילים בתוך משפט

Fatal: ./cache/ is NOT writable.