שילוב מטה-קוגניציה במבחני שמישות

Similar documents
Hebrew Ulpan HEB Young Judaea Year Course in Israel American Jewish University College Initiative

תכנית סטארט עמותת יכולות, בשיתוף משרד החינוך א נ ג ל י ת שאלון א' Corresponds with Module A (Without Access to Information from Spoken Texts) גרסה א'

A R E Y O U R E A L L Y A W A K E?

ASP.Net MVC + Entity Framework Code First.

השוואה בין הבנת הנקרא של טקסט מודפס להבנת טקסט דיגיטלי: מחקר מטה-אנליזה

FILED: NEW YORK COUNTY CLERK 07/16/2014 INDEX NO /2014 NYSCEF DOC. NO. 102 RECEIVED NYSCEF: 07/16/2014 EXHIBIT 5

Rules Game (through lesson 30) by Nancy Decker Preparation: 1. Each rule board is immediately followed by at least three cards containing examples of

מיהו המורה הנושר? מאפיינים דמוגרפיים,תעסוקתיים ומוסדיים של הנשירה מהוראה

מבחן באנגלית בהצלחה הצלחה!!! שם פרטי: שם משפחה: מס' תעודת זהות: תאריך: שם מרכז מנהל מרכז השכלה: תאריך בדיקת המבחן: כל הזכויות שמורות למשרד החינוך

הטכנולוגיה בחינוך ד ר קובי גל אוניברסיטת בן גוריון בנגב

A Comparative Study of Online and Face-to-Face Friendship among Israeli School Students

תכנית סטארט עמותת יכולות, בשיתוף משרד החינוך א נ ג ל י ת שאלון ב' Corresponds with Module B גרסה ב' הוראות לנבחן

קשירות.s,t V שני צמתים,G=(V,E) קלט: גרף מכוון מ- s t ל- t ; אחרת.0 אם יש מסלול מכוון פלט: הערה: הגרף נתון בייצוג של רשימות סמיכות.

Genetic Tests for Partners of CF patients

סטטיסטיקה בתכנית "מוסמך" ש"ת, ש 3 "ס.

המבנה הגאומטרי של מידה

שאלון ד' הוראות לנבחן

שאלון ו' הוראות לנבחן

ANNEXURE "E1-1" FORM OF IRREVOCABLE STANDBY LETTER OF CREDIT PERFORMANCE OF CONTRACT (WHERE PRICES ARE NOT LINKED TO AN ESCALATION FORMULA)

FILED: NEW YORK COUNTY CLERK 07/16/2014 INDEX NO /2014 NYSCEF DOC. NO. 134 RECEIVED NYSCEF: 07/16/2014 EXHIBIT 37

מקומה של הדרכה בבניית ארגון תומך חדשנות פרופ' מרים ארז הטכניון ראש תוכנית ה- MBA ומרכז הידע לחדשנות

(MODULE E) ב ה צ ל ח ה!

Name Page 1 of 6. דף ט: This week s bechina starts at the two dots in the middle of

שאלון ו' הוראות לנבחן

Patents Basics. Yehuda Binder. (For copies contact:

תוצאות סקר שימוש בטלפון

מעבר מדיונים כלליים על תשובות תלמידים לדיונים ממוקדים באמצעות ניתוח למידה ממוחשבת

טכנולוגיית WPF מספקת למפתחים מודל תכנות מאוחד לחוויית בניית יישומיי

א נ ג ל י ת בהצלחה! ב. משרד החינוך בגרות לנבחנים אקסטרניים )מילון הראפס אנגלי-אנגלי-ערבי( השימוש במילון אחר טעון אישור הפיקוח על הוראת האנגלית.

CML כנס שנתי של מודעות ל- CML 4-6 לאוקטובר 2018, מלון רמדה, חדרה

Practical Session No. 13 Amortized Analysis, Union/Find

חוק זכויות הסוכן חוק חוזה סוכנות )סוכן מסחרי וספק(

נספח: כישורי חשיבה )לפרק ראשון ושני( אנגלית (MODULE F) ספרות או: מילון אנגלי-ערבי / ערבי-אנגלי או: מילון אנגלי-אנגלי-ערבי

אנגלית (MODULE E) בהצלחה!

פיזיקה של נהיגה מדריך למורה

אנגלית שאלון ז' (MODULE G) ג רסה א' הוראות לנבחן )מילון אנגלי-ערבי / ערבי-אנגלי )

מספר השאלון: Thinking Skills נספח: כישורי חשיבה )לפרק ראשון ושני( א נ ג ל י ת (MODULE F) ספרות )מילון הראפס אנגלי-אנגלי-ערבי(

נילי חמני

הקיטסיגול הרבחה יעדמל בלושמה גוחה

תורשכ ירפס לכ ץבוק " ב י קלח יללכ רעש

Theories of Justice

מקוון Sharing and Playing: Serious Games and Collaboration in Online Education

Reflection Session: Sustainability and Me

אנגלית שאלון ז' ג רסה א' הוראות לנבחן בהצלחה! )4( ההנחיות בשאלון זה מנוסחות בלשון זכר ומכוונות לנבחנות ולנבחנים כאחד. (MODULE G)

מבוא לתרבות סייבר שיעור מס

אנגלית ספרות בהצלחה! /המשך מעבר לדף/ נספח: כישורי חשיבה )לפרק ראשון ושני( או: מילון אנגלי-ערבי / ערבי-אנגלי או: מילון אנגלי-אנגלי-ערבי

THINKING ABOUT REST THE ORIGIN OF SHABBOS

תצוגת LCD חיבור התצוגה לבקר. (Liquid Crystal Display) המערכת.

Screencast Feedback to Students' Artifacts: Potential & Challenges

Balanced Scorecard. Benchmarking. Business Process Quality Management. Business Intelligence (BI)

בהצלחה! (MODULE C) Hoffman, Y. (2014). The Universal English-Hebrew, Hebrew-English Dictionary

תוכן העניינים: פרק סדרות סיכום תכונות הסדרה החשבונית:... 2 תשובות סופיות:...8 סיכום תכונות הסדרה ההנדסית:...10

מ ש ר ד ה ח י נ ו ך ה פ ד ג ו ג י ת א ש כ ו ל מ ד ע י ם על ה ו ר א ת ה מ ת מ ט י ק ה מחוון למבחן מפמ"ר לכיתה ט', רמה מצומצמת , תשע"ב טור א'

Forgive us, pardon us, grant us atonement Parashat Shelach Lecha June 9, 2018 Rabbi Carl M. Perkins Temple Aliyah, Needham

Name Page 1 of 5. דף ז. This week s bechina begins with the fifth wide line at the top of

מוטיבציה והכוונה עצמית

מאמר מחקרי השפעתו של אימון קוגניטיבי ממוחשב על מדדי הליכה וניידות בקרב חולי פרקינסון תקציר הקדמה

(פוסטר) The Contribution of FaceBook to the Learning Process in Academic Courses (Poster) Yossi Lev Ashkelon college

ב. משרד החינוך בגרות לנבחנים אקסטרניים א נ ג ל י ת (MODULE B) הוראות מיוחדות: )2( בתום הבחינה החזר את השאלון למשגיח. בהצלחה!

תרבויות בית ספר אבי קפלן ומרטין ל' מאהר* תרבות בית הספר

מספר השאלון: הצעת תשובות לשאלות בחינת הבגרות אנגלית (MODULE C) מילון אנגלי-אנגלי-עברי או מילון אנגלי-עברי-עברי-אנגלי قاموس إنجليزي - إنجليزي - عربي

ãówh,é ËÓÉÔê ÌW W É Å t" Y w f É ËÓÉÑ É èw É f Ñ u ð NNM YóQ' ÌW W É Y ÉgO d óqk É w f ym Éd É u ð NNM ÌWNQMH uqo ð NNM ÌWNQMH

Advisor Copy. Welcome the NCSYers to your session. Feel free to try a quick icebreaker to learn their names.

נספח: כישורי חשיבה )לפרק ראשון ושני( אנגלית (MODULE D) ספרות או מילון אנגלי-עברי-עברי-אנגלי

Depth-First Search DFS

פיתוח אוריינות סביבתית בקרב תלמידים באמצעות למידה משתפת עידית אדלר, מיכל ציון וזמירה מברך 1

ב. משרד החינוך בגרות לנבחנים אקסטרניים א נ ג ל י ת (MODULE B) הוראות מיוחדות: )2( בתום הבחינה החזר את השאלון למשגיח. בהצלחה!

נובמבר 2011 (מנחת העבודה תאריך

לצפייה בפתרון בווידאו לתרגילים שבחוברת, כנסו ל "סטטיסטיקה והסתברות" בשאלון 802 שבאתר

נספח: כישורי חשיבה )לפרק ראשון ושני( אנגלית (MODULE F) ספרות מילון אנגלי-אנגלי-עברי או מילון אנגלי-עברי-עברי-אנגלי

Apple, keys, pen, pencils, pencilbox,(toy)elephant,( toy) boy, (toy) girl, ball

עוררות ונעימות רגשית על עיבוד השפעת

The eteacherbiblical team would like to welcome you to our Noah s Ark ebook and thank you for downloading.

An English Play Is Hosted by Facebook: Students Achievements and Attitudes towards Studying an English Play Using the Facebook Environment

A JEW WALKS INTO A BAR: JEWISH IDENTITY IN NOT SUCH JEWISH PLACES

מכונת מצבים סופית תרגול מס' 4. Moshe Malka & Ben lee Volk

הוראת המורים למתמטיקה: המצב הקיים ומודל התערבות לשינויו

פרק 12 מבוא..(Sundström, Fransson, Malmberg, & Davey, 2009)

נספח: כישורי חשיבה )לפרק ראשון ושני( אנגלית (MODULE D) ספרות מילון אנגלי-אנגלי-עברי או מילון אנגלי-עברי-עברי-אנגלי

קריאת גרפים. לצפייה בפתרון בווידאו לתרגילים שבחוברת, כנסו ל "קריאת גרפים" בשאלון 801 שבאתר 116

הילה (ון-הילה), קוגניציה, למידה יחידנית, למידה בזוגות.

ההשפעה של אסטרטגיות מיקוד קשב על למידה של מטלות

אנוטציות אישיות ושיתופיות ב- Annoto : תובנות לגבי השתתפות פעילה וסבילה מניתוח תוכן ומכריית נתוני התנהגות בסביבת היפר-וידאו באקדמיה

מ ק ו מ ו ת 5 מ י נ ה ל כ ס פ י ו מ ו ר י ה ח ב ר ה ל פ י ת ו ח י ר ו ש ל י ם ב ע מ מ ב ו א כ ל ל י ב ש נ ת, ב מ ס ג ר ת ח ג י ג ו ת י

מדריך לניהול VPS טריפל סי מחשוב ענן בע"מ.

SEEDS OF GREATNESS MINING THROUGH THE STORY OF MOSHE S CHILDHOOD

נספח: כישורי חשיבה )לפרק ראשון ושני( אנגלית (MODULE D) ספרות או מילון אנגלי-עברי-עברי-אנגלי

החינוך וסביבו ל"ו / תשע"ד 2014 מחקרים וסוגיות בחינוך

מיקוד באנגלית. Module D. New Program in English Literature. Option 1 שאלון אינטרני מספר שאלון אקסטרני מספר 414

The Power of Words. (Holding Koren Mahzor aloft) How many words are we going to say today? How many?

NATIONAL COUNCIL OF YOUNG ISRAEL. Shavuot Nation JEWISH EDITION. Compiled by Gabi Weinberg Teen Program Director

קורסים מקוונים באורנים על-פי תפיסת הסטודנטים

BEING A VISIONARY JOLT LEADERSHIP PROGRAM 2014

Students' Dichotomic Perceptions of the Use of ICT in Teaching and Learning

ב "ה. ABC s of Judaism. Fundamentals of Jewish Thought and Practice. June 2007 Tammuz 5767 Jewish Educational Institute Chabad Brisbane

הערכת תמריצים חברתייים לתרומות והתנדבות גיל פלג מבוא

מבוא למשפט האיחוד האירופי

הצעת תשובות לשאלות בחינת הבגרות אנגלית

טו: and ends on the bottom of

דיאלוג מומחז בין מרטין בובר וקרל רוג'רס

Transcription:

פרידה נסאר, רקפת אקרמן, אברהם שטוב 119 ע שילוב מטה-קוגניציה במבחני שמישות אברהם שטוב הטכניון מכון טכנולוגי לישראל shtub@ie.technion.ac.il רקפת אקרמן הטכניון מכון טכנולוגי לישראל ackerman@ie.technion.ac.il פרידה נסאר הטכניון מכון טכנולוגי לישראל fareda.nassar@gmail.com Incorporating Metacognition into Usability Testing Fareda Nassar Technion Israel Institute of Technology Abstract Rakefet Ackerman Technion Israel Institute of Technology Avraham Shtub Technion Israel Institute of Technology Usability testing is an important phase in the development of any software product, and of those used for learning, in particular. Usually, objective measures, like response time and success rates, are collected, together with global subjective measures, such as satisfaction. In this study, we adapted measures from the metacognitive approach to generate a comprehensive set of measures allowing more detailed analysis of users subjective experience and work efficiency. We compared two user interfaces of a software tool designed to support project management learning in an academic course. In addition to measuring fluent work with the system and global satisfaction, the participants performed a set of focused tasks and rated their confidence in their success in each one. Triangulation of response time, success, and confidence was highly informative in exposing differences between the user interfaces, that were not exposed by global performance and satisfaction measures. Importantly, better outcomes were found when reliable confidence was experienced. This finding suggests that a product that eliminates overconfidence produces better outcomes. Overall, the study offers an applicable methodology for usability tests that takes into account metacognitive considerations for delving into the subjective experience and learning process of the users in more detail than done before. Keywords: metacognition, overconfidence, e-learning, usability testing. תקציר פיתוח תוכנה שנועדה לליווי תהליך למידה מחייב שימוש במבחני שמישות המותאמים למטרה זו. בדרך כלל, במבחני שמישות נאספים מדדים אובייקטיבים, כמו זמן ביצוע מטלה ואחוזי הצלחה, ובנוסף נאספים מדדים סובייקטיבים כלליים, כמו שביעות רצון. כדי להתעמק יותר בתהליך הלמידה ובויסות המאמצים הקוגנטיביים, במחקר הנוכחי בדקנו את התרומה של מדדים מתחום המטה-קוגניציה להערכת שימושיות התוכנה. הבדיקה נעשתה על ידיהשוואהביןשני ממשקים של אותה תוכנה, שנועדה לתמוך בלמידה של ניהול פרוייקטים בקורס אקדמי. מעבר לניהול פרויקט באופן שוטף, הנבדקים ביצעו סטשל משימות נקודתיות, כגון העסקת עובד והקצאת תקציב למשימה. עבור כל משימה הנבדקים התבקשו לדרג ביטחון בתשובה שסיפקו. דירוג הביטחוןביחד עם זמןביצוע מטלה ונכונות התשובה אפשרו יצירת סט מדדים מורחב להערכת הלמידה. מדדי הביצוע ושביעות הרצון הכלליים לא הצביעו על הבדל בין שני הממשקים, בעוד המדדים המפורטים הצביעו על הבדלים רבים. הממצא החשוב הואשנמצאכי קיים קשרבין מידתביטחוןהיתר לבין הביצוע, כך שבממשק שהישלה את המשתמשים פחות הביצוע היה טוב יותר. המחקר ספר הכנס העשירי לחקר חדשנות וטכנולוגיות למידה ע"ש צ'ייס: האדם הלומד בעידן הטכנולוגי י' עשת-אלקלעי, א' בלאו, א' כספי, נ' גרי, י' קלמן, ו' זילבר-ורוד (עורכים), רעננה: האוניברסיטה הפתוחה

120 ע שילוב מטה-קוגניציה במבחני שמישות מבוא מציע שילוב של מדדים מטה-קוגניטיביים במבחני שמישות לבחינה והערכה יותר מעמיקה של השימוש בתוכנות מחשב המלוות למידה. מילות מפתח: מטה-קוגניציה, ביטחון יתר, למידה באמצעות מחשב, מבחני שמישות, טכנולוגיות למידה. במהלך פיתוח תוכנות המלוות תהליך למידה, יש לבצע בדיקות שמישות המותאמות למטרה זו. על פי ההגדרה הכי נפוצה שלה, שמישות היא המידה שבה מוצר מאפשר לקבוצת משתמשים נתונה להשיג מטרות קבועות מראש בצורה יעילה ומשביעת רצון ) Usability, ISO,9241-11 Guidance on ( 1998 מדדי שמישות מתחלקים למדדים אובייקטיבים ומדדים סובייקטיביים. מדדים אובייקטיבים כוללים למשל מידת ההצלחה ומשך ביצוע המשימה. לעומת זאת, מדדים סובייקטיביים מבטאים את חויית המשתמש, כמו דירוג קלות השימוש במוצר ועמדות כלפי המוצר (2006.(Hornbaek, (2006) Hornbaek הראה קורלציה נמוכה בין המדדים האובייקטיבים והמדדים הסובייקטיביים, מה שמעיד על חשיבות השילוב של שני סוגי המדדים כדי לקבל תמונה מלאה של שמישות המוצר. מדד סובייקטיבי נוסף הנפוץ בספרות של מבחני שמישות הינו ה- System Usability SUS זהו שאלון המספק מבט סובייקטיבי גלובלי לגבי שמישות של מוצר. התוצר של.Scale (SUS) הינו ציון הנע בין 0 ל 100 שמאפשר השוואה של שימושיות בין מוצרים שונים. במחקר הנוכחי אנחנו מציעים להוסיף למבחני שמישות קבוצת מדדים הנגזרת מתחום המטה-קוגניציה ומאפשרת התעמקות מפורטת יותר בחווית המשתמש תוך כדי תהליך הלמידה בעזרת מוצר תוכנה המלווה קורס אקדמי. המחקר בתחום המטה-קוגניציה עוסק בניהול ההשקעה של משאבים קוגניטיביים בזמן ביצוע משימות כגון למידה, מענה לשאלות ידע ופתרון בעיות. התהליך המטה-קוגניטיבי מחולק לניטור ושליטה. הניטור כולל הערכה סובייקטיבית של איכות ביצוע המשימה ואילו השליטה היא ההחלטה שמתקבלת בעקבות הניטור. לדוגמה, בתחום הלמידה, בזמן למידת טקסט התלמיד מעריך את רמת הידע שצבר ולפי זה מקבל החלטה לגבי המשך השקעת הזמן בלימוד (1990 Narens,.(Nelson & הניטור המטה-קוגניטיבי שבו התמקדנו במחקר הנוכחי הינו ביטחון בתשובה שהנבדק מספק (בסקלה של %100-0). קיימות שתי תופעות נפוצות בהשוואה בין מידת הביטחון לרמת ההצלחה בפועל: ביטחון יתר וביטחון חסר. תופעת ביטחון היתר מתגלה בעת שממוצע הביטחון שהנבדק מספק גבוה מאחוז התשובות הנכונות בפועל במבחן. לעומת זאת, ביטחון חסר מתגלה בעת שממוצע הביטחון נמוך מאחוז התשובות הנכונות. התופעה הנפוצה יותר היא ביטחון יתר (& Ackerman e.g., Zalmanov, 2012 ). מחקרים הראו כי דיוק הניטור המטה-קוגניטיבי משפיע על קבלת החלטות לגבי ויסות תהליך הלמידה ועל איכות הביצוע במבחן בתום הלמידה Anderson,) e.g., Thiede,.(&Therriault, 2003 בנוסף, לתרומת המטה-קוגניציה לתחום הלמידה ניתן להבחין בספרות בתרומה בתחום אינטראקציות אדם-מחשב. Vu ועמיתיו (2000) הראו כי ההערכות הסובייקטיביות של הנבדקים לגבי רמת המומחיות בשימוש בתוכנות מחשבים מנבאות בצורה אמינה יותר את איכות השימוש בתוכנות בפועל מאשר תדירות השימוש. כמו כן, מחקרים הראו תופעת ביטחון יתר עקבית בעת למידת טקסטים ממסך מחשב לעומת למידה מנייר (;2011 Goldsmith, Ackerman & Ackerman, 2014.(Ackerman & Lauterman, 2012; Lauterman & מחקרים קודמים שאספו ביטחון בהצלחה כחלק ממדדי שמישות, התיחסו רק להשוואה ברמת הביטחון בין תנאים שונים et.al,) Vu 2000), אך לא דנו בביטחון יתר ובמדדים נוספים המקובלים בספרות המטה-קוגנטיבית ומאפשרים התעמקות רבה יותר בתהליך הלמידה. במחקר הנוכחי נערכה השוואה של שמישות בין שני ממשקים למשתמש עבור מוצר תוכנה אחד שנועד לתמיכה בלימוד הנושא של ניהול פרויקטים, הידוע במורכבותו הרבה. המשתתפים במחקר נבחרו להיות בעלי שתי רמות ידע בתחום ניהול פרויקטים. מחקרים מראים כי בעיות שמישות שונות מתגלות אצל קבוצות נבדקים ברמות ידע שונות (2010 Ruttinger,.(e.g., Sauer, Seibel & המשתתפים כללו סטודנטים לפני ואחרי הקורס האקדמי "תכנון פרוייקטים וניהולם", אך אף סטודנט לא התנסה עם הממשקים של תוכנת לימוד ניהול פרוייקטים לפני המחקר. השערות המחקר ההשערה הראשונה הייתה שממשק שמאפשר ניטור מטה-קוגניטיבי יותר אמין יניב ביצוע יותר טוב. במילים אחרות, הממשק שיאפשר מדדים מטה-קוגניטיביים יותר מדוייקים יניב למידה יותר טובה. ההשערה השניה היתה שמדדים מטה-קוגנטיביים מאפשרים לחשוף הבדלי שמישות שמדדים

פרידה נסאר, רקפת אקרמן, אברהם שטוב 121 ע מקובלים בתחום לא מגלים. כך מפתחי התוכנה יכולים לגלות בעיות בממשק למשתמש שכדאי לשפר ולהסיק איזה ממשק מתאים יותר לליווי למידה. מתודולוגיה נבדקים. במחקר השתתפו 99 סטודנטים מהפקולטה להנדסת תעשייה וניהול (46% נשים). מחצית הסטודנטים סיימו את הקורס "תכנון פרויקטים וניהולם" בפקולטה להנדסת תעשיה וניהול והם היוו את קבוצת בעלי הידע הקודם (49 = N). המחצית השנייה כללה סטודנטים שעוד לא לקחו את הקורס והם היוו את קבוצת חסרי הידע הקודם. חומרים. בנוסף לשני הממשקים של התוכנה שנועדה לתמיכה בלימוד נושא ניהול פרוייקטים היו גם א) דף הדרכה כללית לשימוש בתוכנה, ב) דף לרישום תשובות למשימות שניתנו לנבדקים שכלל גם כן סקלה לסימון ביטחון בתשובה וסקלה לציון קלות ביצוע משימה. ג) סקלתSUS להערכה כללית של שמישות התוכנות. הליך. ההרצה של הניסוי התבצעה באופן יחידני. כל נבדק התנסה בשימוש בשני הממשקים למשתמש. הממשקים שונים זה מזה באופן הצגת המידע כך שבממשק הראשון כל סוגי המידע מוצגים בצורה במקביל במסך הראשי (ראו איור 1), דבר המאפשר סרגל כלים פחות עמוס (ראו איור 2). לעומת זאת, בממשק 2 הנבדק צריך לנווט בין מסכים שונים על מנת לקבל סוגי מידע שונים (משימות, משאבים, כספים). לדוגמא, איור 3 מראה את המשימות על כל המסך ועל מנת לעבור לסוג מידע אחר (משאבים, כספים, תרשימים) צריך לעבור למסך אחר ע"י ניווט דרך סרגל הכלים הראשי בממשק. דבר שהופך את סרגל הכלים ליותר עמוס (ראו איור 4) ומצריך להפעיל את הזיכרון של המשתמשים בניווט. איור 1. המסך הראשי בממשק 1 איור 2. סרגל הכלים בממשק 1

122 ע שילוב מטה-קוגניציה במבחני שמישות איור 3. המסך הראשי בממשק 2 בעת הצגת המשימות איור 4. סרגל הכלים בממשק 2 הנבדק ביצע בכל ממשק עשר משימות אשר נקבעו מראש בהסתמך על ניתוח משימות Task) (analysis לשני הממשקים. המשימות חולקו לשני סטים, כך שסט ראשון כלל משימות שלאור ניתוח המשימות היו צפויות להיות קלות יותר לביצוע באמצעות הממשק הראשון. הסט השני כלל משימות שצפויות להיות קלות יותר לביצוע באמצעות ממשק 2. עבור כל משימה אספנו את המדדים הבאים: אחוז הצלחה נכונות התשובה שהנבדק מספק בעקבות ביצוע המשימה. זמן תגובה ביצוע המשימה (בשניות). ביטחון של הנבדק בתשובה שהוא סיפק (סקלה 0-100). קושי נתפס דירוג של קושי ביצוע המשימה (סקלה 1-7) מייד אחרי שהנבדק סיים לבצע את המשימות בעזרת הממשק הראשון הוא התבקש למלא את שאלון ה-,SUS המסכם את החויה שלו עם הממשק זה, ולעבור לביצוע אותן משימות בעזרת ממשק 2 ולמלא את סקלת ה- SUS לגבי השימוש בממשק 2. סדר השימוש בממשקים אוזן מעבר לנבדקים. המפגש עם כל נבדק נמשך כשעתיים. תוצאות שילוב מדדים מטה-קוגנטיביים ואובייקטיביים בניתוח מפורט אפשר איתור הבדלים בין הממשקים לעומת שאלון ה SUS שלא הצביע על הבדלים בין שני הממשקים:.SUS הציונים של ה SUS נעו בין 100-0. ניתוח שונות נעשה על ציוני ה- SUS שהתקבלו עבור שני הממשקים. לא נמצאו הבדלים בין שני הממשקים וגם לא בין שתי קבוצות הנבדקים השונות ברקע שלהם בניהול פרוייקטים, < 1 F. ראו איור 5.

פרידה נסאר, רקפת אקרמן, אברהם שטוב 123 ע 100 80 ציון ה SUS- 60 40 20 0 לפני הקורס תכנון פרוייקטים אחרי הקורס תכנון לפני הקורס תכנון פרוייקטים ממשק 1 ממשק 2 אחרי הקורס תכנון פרוייקטים מדדים אובייקטיבים ומטה-קוגניטיביים: איור 5. תוצאות ה- SUS בנוסף למדדים שנאספו ישירות, נכונות התשובה, זמן תגובה, ביטחון, קלות נתפסת, בניתוח הזה התווספו מדדים מחושבים המתבססים על המדדים הישירים: א) יעילות: אחוז תשובות נכונות שנצברו לדקה ב) ביטחון יתר: הפער בין ממוצע הביטחון בתשובה לבין אחוז התשובות הנכונות בפועל ג) רזולוציה: קורלציה תוך נבדקית בין הביטחון בתשובה לבין נכונות התשובה. המדדים האובייקטיבים הצביעו על הבדלים בביצוע בין שני הממשקים עבור כל סט, תוצאות התומכות בחלוקה לשני סטים. אחוז הצלחה. עבור כל נבדק חישבנו את אחוז התשובות הנכונות שלו מעבר לכל 9 המשימות (100-0). לא היה הבדל באחוז ההצלחה בין שני הממשקים, < 1 F. לעומת זאת, כן נמצא הבדל באחוז ההצלחה בין שני הסטים כך שאחוז ההצלחה בסט הראשון (44.5 = SD M) = ;70.0 היה קטן יותר מאחוז ההצלחה בסט השני 42.3) = SD.F(1,196) = 6.3, p <.01,(M = 75.2; האינטראקציה המובהקת של הממשק עם הסט 01. < p (1,196)F, =,51.9 הראתה כי אחוז ההצלחה בסט הראשון היה גבוה יותר בממשק הראשון, 01. < p (98)t, =,4.1 מצד שני האפקט היה הפוך עבור הסט השני, 01. < p (98)t. =,5.8 ראו איור 6. ההבדלים האלה בין הסטים מוכיחים כי חלוקת המשימות לשני סטים תאמה את ניתוח המשימות.

124 ע שילוב מטה-קוגניציה במבחני שמישות % הצלחה / ביטחון 90 85 80 75 70 65 60 20 40 60 80 100 120 140 160 זמן תגובה ביצוע על ממשק 1 עבור סט 1 ביצוע על ממשק 2 עבור סט 1 ביצוע על ממשק 1 עבור סט 2 ביצוע על ממשק 2 עבור סט 2 בטחון על ממשק 1 עבור סט 1 בטחון על ממשק 2 עבור סט 1 בטחון על ממשק 1 עבור סט 2 בטחון על ממשק 2 עבור סט 2 איור 6. גרף המראה את הביטחון, אחוז ההצלחה וביטחון היתר על ציר הזמן זמן תגובה. זמן התגובה נמדד בשניות. הנבדקים ביצעו את המשימות בזמן קצר יותר בעזרת הממשק הראשון 44.0) = SD (M = 78.1; לעומת ממשק 59.3) 2 = SD F(1,196) = 4.9,,(M = 90.9; 03. = p. בנוסף, נמצא כי האפקט של הסט היה מובהק, כך שזמן התגובה בסט הראשון קצר יותר מזמן התגובה בסט השני.01, < p.f(1,196) = 334.9, האינטראקציה המובהקת 23.7, = F(1,196) (98)t =,3.8 הראתה כי זמן התגובה בסט הראשון היה קצר יותר על הממשק הראשון, p, < 01. 01. < p, מצד שני לא נמצא אפקט עבור הסט השני, 1 < (98)t. ראו איור 6. יעילות. מדד היעילות חושב על ידי חלוקת אחוז ההצלחה בזמן הביצוע הממוצע למטלה. נמצא הבדל מובהק ביעילות בין הסטים. הנבדקים היו פחות יעילים בביצוע הסט הראשון.F(1,196) = 271.3 p <.01,(M = 222.6; SD = 335.8) לעומת הסט השני (M = 70.8; SD = 77.3) האינטראקציה המובהקת בין הסט לממשק, 01. < p (1,196)F, =,12.6 מצביעה כי עבור הסט הראשון הנבדקים היו יותר יעילים על הממשק הראשון, 01. < p (98)t. =,4.2 לעומת זאת, עבור הסט השני הנבדקים היו יותר יעילים על ממשק 2. ראו איור 6. התוצאות עבור מדדי הביצוע האובייקטיבים, כלומר, אחוז הצלחה, זמן תגובה ויעילות היו טובות יותר עבור הסט המתאים לכל ממשק ביחס לסט השני. גם המדדים המטה-קוגניטיביים הראו הבדלים בין הממשקים לפי הסטים, כך שהממשק שאפשר ניטור מטה-קוגניטיבי יותר אמין הביצוע על אותו ממשק היה יותר טוב: ביטחון בתשובה (100-0%). נמצא כי הביטחון על הממשק הראשון (16.3 = SD M) = ;77.9 היה נמוך יותר מהביטחון על ממשק 17.7) 2 = SD.F(1,196) = 4.9, p =.03,(M = 81.1; לא נמצא הבדל בביטחון בין שני הסטים. לעומת זאת, האינטראקציה בין הממשק לסט נמצאה מובהקת 01. < p (1,196)F =,64.4 כך שעבור הסט הראשון ההבדל בביטחון בשני הממשקים לא היה מובהק 10. = p. (98)t =,1.6 מצד שני, עבור הסט השני הביטחון על הממשק הראשון היה נמוך יותר מהביטחון על ממשק.01,2 < p.t(98) = 6.1, ראו איור. 6 ביטחון יתר. מדד ביטחון היתר נמדד ע"י חישוב הפער בין אחוז ההצלחה לביטחון. לא נמצאו אפקטים עיקריים, אך האינטראקציה בין הסט לממשק היתה מובהקת, 01. < p (1,196)F. =,18.1 עבור הסט הראשון ביטחון היתר על הממשק הראשון (20.2 = SD M) = ;4.0 היה נמוך יותר לעומת ממשק 21.5) 2 = SD.t(98) = 3.3, p <.01,(M = 12.0; לעומת זאת, עבור הסט השני נמצא אפקט הפוך,.05 < p,t(98) = 2.5, כך שביטחון היתר על הממשק הראשון 24.3) = SD (M = 9.1; היה גבוה יותר מביטחון היתר על ממשק (17.9 2 = SD M). = ;2.5 ראו איור 6. כלומר, תחושת הביטחון היתה מכוילת באופן מדויק יותר עבור הסט המתאים לממשק. רזולוציה. מכיוון שחישוב הרזולוציה על ידי קורלציה תוך-נבדקית מותנה בשימוש בלפחות 6 פריטים בעוד שכאן יש 5-4 פריטים בכל סט, חישבנו את הרזולוציה מעבר לכל 9 המשימות. התוצאות הראו אפקט מובהק שולית של הממשק = 0.08 p (1,196)F. =,3.04 הרזולוציה של הנבדקים נטתה להיות נמוכה יותר על הממשק הראשון (63. = SD M) = ;34. לעומת ממשק 2

פרידה נסאר, רקפת אקרמן, אברהם שטוב 125 ע דיון (52. = SD M). = ;49. רזולוציה גבוהה מעידה על כך שהנבדק בטוח יותר במשימות שבהן גם הצליח בפועל יותר, כלומר מבחין היטב בין טיב הלמידה במשימות השונות. הרזולוציה הגבוהה יותר בממשק 2 יכולה לרמוז על עיבוד עמוק יותר בממשק זה. חשוב לציין שבכל התנאים הרזולוציה היתה שונה מאפס באופן מובהק, 01. < p. קושי השימוש. הנבדקים מצאו את ממשק 1 יותר קשה לשימוש (1.1 = SD M) = ;3.1 לעומת ממשק,2 1.2) = SD.F(1,196) = 3.4, p =.07,(M = 2.9; בנוסף, הנבדקים מצאו את הסט הראשון יותר קשה לשימוש, 01. < p (1,196)F, =,45.9 האינטראקציה בין סט לממשק נמצאה מובהקת 01. < p (1,196)F. =,78.1 עבור הסט הראשון, ממשק 1 נמצא קל יותר לשימוש. לעומת זאת, עבור הסט השני ממשק 1 נמצא יותר קשה לשימוש. גם עבור המדד הזה, התוצאות תואמות לחלוקת לשני סטים. תוצאות המחקר הראו כי ה- SUS אינו יכול לשמש כמדד יחיד לבחינת שמישות מכיוון שכן התגלו הבדלים באחוז ההצלחה, זמן ביצוע, דירוג קלות הביצוע ובביטחון יתר בין שני הממשקים, בעוד הוא לא הראה הבדלים בין הממשקים. המחקר מדגיש את החשיבות של בחינה מפורטת של מדדים אובייקטיבים וסובייקטיביים בעת עריכת מבחן שמישות. הגישה המטה-קוגניטיבית מספקת מדדים המקשרים בין המדדים האובייקטיבים לבין המדדים הסובייקטיביים על ידי בחינת מדד הביטחון ומדדים הנובעים משילוב שלו עם הצלחה בפועל ועם זמן תגובה. מהמחקר עולה שניתוח מפורט, לאור סט מדדים מגוון המתייחס לביצוע משימות ספציפיות, עשוי לחשוף בעיות שמישות, שלא היו מתגלות בשימוש בסקאלות כלליות להערכה סובייקטיבית, כגון ה- SUS שמקובלת מאוד בתחום מבחני השמישות. אחד היתרונות החשובים של שיטת בחינת השמישות שמוצעת במחקר הזה היא היכולת לאסוף מדדים אובייקטיבים וסובייקטיביים מפורטים מבלי להפריע לנבדק ומבלי להשפיע על האינטראקציה בין הנבדק לממשק, בעיה שהוצגה במחקרים קודמים (2003) al.,.van den Haak et דבר המאפשר הערכה אמינה של השימוש בתוכנה. ראוי להדגיש את הקשר שנמצא בין ההטיה בביטחון לבין אחוז ההצלחה עבור אותו סט של משימות. החשיבות של הממצא היא שעבור נבדקים שביצעו פחות טוב סט מסוים של משימות נוצרת אשליה שאחוז ההצלחה יהיה דומה לסט מטלות בו אחוז ההצלחה בפועל היה טוב יותר. הסיכון הוא בהשפעת האשליה הזאת על שימושים עתידיים בממשק. משתמש שהושלה שביצע טוב, לא יבדוק את הביצוע שלו שנית וגם לא יחשוב שיש צורך בלמידה או הדרכה נוספת לשימוש עתידי בממשק. במבט כללי יותר, מחקרים שעסקו בתרומה של המדדים המטה-קוגניטיביים והשפעת הדיוק של מדדים אלה על הליך הלמידה עסקו עד עכשיו במטלות זיכרון של צמדי מילים, למידה מטקסטים, ומענה על שאלות ידע כללי ) et e.g., Ackerman &Goldsmith, 2008; Metcalfe & Finn, 2008; Thiede ). Ackerman & Thompson, in או בפתרון בעיות מתמטיות ומילוליות (ראו סקירהpress (al., 2003 במחקר הנוכחי יישמנו את אותה מתודולוגיה לבחינת הביצוע של המשתמשים בעת שימוש בתוכנה לימודית. אנו מקווים לראות בעתיד מחקרים נוספים המיישמים שיטה זו לצורך מבחני שמישות ולצורך חקר ביצוע מטלות מורכבות בכלל. מקורות Ackerman, R., & Goldsmith, M. (2008). Control over grain size in memory reporting with and without satisficing knowledge. Journal of Experimental Psychology: Learning, Memory, and Cognition, 34, 1224-1245. Ackerman, R., & Goldsmith, M. (2011). Metacognitive regulation of text learning: On screen versus on paper. Journal of Experimental Psychology: Applied, 17(1), 18-32. Ackerman, R., & Lauterman, T. (2012).Taking reading comprehension exams on screen or on paper? A metacognitive analysis of learning texts under time pressure. Computers in Human Behavior, 28, 1816-1828. Ackerman, R. & Thompson, V. (in press). Meta-reasoning: What we can learn from meta-memory. To appear in A. Feeney, & V. Thompson (Eds.), Reasoning as Memory. Hove, UK: Psychology Press.

126 ע שילוב מטה-קוגניציה במבחני שמישות Ackerman, R., & Zalmanov, H. (2012). The persistence of the fluency-confidence association in problem solving. Psychonomic Bulletin & Review, 19(6), 1187-1192. Hornbæk, K. (2006). Current practice in measuring usability: Challenges to usability studies and research. International Journal of Human-Computer Studies, 64(2), 79-102. ISO/IEC. "9241-11 Ergonomic Requirements for Of Tice Work with Visual Display Terminals (VDT) s-part II Guidance on Usability," ISO/IEC 9241-11,1998 (E). Lauterman, T., & Ackerman, R. (2014). Overcoming screen inferiority in learning and calibration. Computers in Human Behavior, 35, 455-463. Metcalfe, J., & Finn, B. (2008).Evidence that judgments of learning are causally related to study choice. Psychonomic Bulletin & Review, 15(1), 174-179. Nelson, T. O., & Narens, L. (1990). Metamemory: A theoretical framework and new findings. The Psychology of Learning and Motivation, 26, 125-141. Sauer, J., Seibel, K. &Ruttinger, B. (2010).The influence of user expertise and prototype fidelity in usability tests. Applied Ergonomics, 41, 130-140. Thiede, K. W., Anderson, M., &Therriault, D. (2003). Accuracy of metacognitive monitoring affects learning of texts. Journal of Educational Psychology, 95(1), 66-73. Van den Haak, M., De Jong, M., &Schellens, P. J. (2003). Retrospective vs. concurrent think-aloud protocols: Testing the usability of an online library catalogue. Behavior & Information Technology, 22(5), 339-351. Vu, K.P.L., Hanley, G. L., Strybel, T. Z., & Proctor, R. W. (2000). Metacognitive processes in human computer interaction: Self-assessments of knowledge as predictors of computer expertise. International Journal of Human Computer Interaction, 12, 43-71.