text mining problem

Mohamad1367Mohamad1367 MemberPosts:22Contributor I
edited June 2020 inHelp
hi dear community
i have a question about filter stop word (dictionary) operator that i asked in previous post but didn't answer anyone. when i apply this operator after tokenizing the eaxample set i don't recieve filtered output what is the cause of this problem?

Answers

  • Telcontar120Telcontar120 Moderator, RapidMiner Certified Analyst, RapidMiner Certified Expert, MemberPosts:1,635Unicorn
    Are you sure there are tokens in your dataset that are also in your stopwords dictionary file? Is your dictionary file correctly formatted? Are you receiving any error messages? Do you have an example process? The question is pretty vague right now and without more information it will probably be difficult for anyone to provide more specific guidance.
    Brian T.
    Lindon Ventures
    Data Science Consulting from Certified RapidMiner Experts
  • Mohamad1367Mohamad1367 MemberPosts:22Contributor I
    edited June 2020
    hi@Telcontar120thank you for your response...i think that everything looks good ...i share my process, stop word dictionary and data set here ...thank you very much for your help

    Jasmine_
  • sara20sara20 MemberPosts:110Unicorn
    edited June 2020
    سلام وقت بخیر
    متاسفانه روال پردازش شما در سیستم بنده کار نمیکند. در حال حاضر مشکل چی هست؟
    سارا
  • Mohamad1367Mohamad1367 MemberPosts:22Contributor I
    @sara20سلام وقت بخیر ممنون که پاسخ دادین
    من یه دیتاستی دارم از نظرات هتل که هر نظر یه کلاسی داره و این کلاس از 1 تا 5 هست
    که کلاس شماره 1 به معنی منفی و کلاس شماره 5 به معنی خیلی مثبته
    حالا وقتی میام فیلتر کنم استپ ورد هارو بعد اینکه توکنایز کردم فقط توکنایز شده دیتاستم رو میبینم و اثری از دیتاستی که استپ وردهاش فیلتر شده نمیبینم تو نتیجه ..من کد فرایندمو اینجا براتون میذارم شاید براتون اجرا بشه اسکرین شات فرایندم رو هم میذارم که اگه اجرا نشد از رو اسکرین شات اگه امکانش هست کمکم کنید





























    <参数键= " 1 " value = " label.true.integer.attribute"/>






    <参数键= value =“attribute_filter_type唱歌le"/>
































































    sara20
  • sara20sara20 MemberPosts:110Unicorn
    بازم کار نکرد کلا هنگ کرده اون بخش توکنایز ایراد داره مدام یا ارور میده یا هنگ میکنه ولی بازم سرچ میکنم ببینم چی پیدا میکنم لینکش براتون میفرستم

    شرمنده
  • Mohamad1367Mohamad1367 MemberPosts:22Contributor I
    @sara20ahan moshkeletoon bakhshe tokenization hast? baraye tokenization tooye farsi man ye extension nasb kardam be name rosette extension emkanesh hast oono nasb konin bebinin irade karam az chie?man taghriban kole in anjoman ro ziro roo kardam:/
  • sara20sara20 MemberPosts:110Unicorn
    اونم نصب کردم ولی متاسفانه بازم کار نمیکنه:(
    هنگ کرده
    image image image
  • Mohamad1367Mohamad1367 MemberPosts:22Contributor I
    edited June 2020
    @sara20tooye bakhshe parameter haye in operator ye ja hast ke bayad api key begiri ke too ghesmate connection set koni oono gerefti?

    rooye oon logoye ghermez mizani ye bakhshe add connection dare ke behet api key mide

Sign InorRegisterto comment.