-
1Academic Journal
المؤلفون: Gerhard B. van Huyssteen, Roald Eiselen, Jaco du Toit
المصدر: Journal of Open Humanities Data, Vol 9, Pp 14-14 (2023)
مصطلحات موضوعية: afrikaans, offensive language, offensiveness, rating, swearing, swearword, taboo language, tabooness, History of scholarship and learning. The humanities, AZ20-999, Language and Literature
وصف الملف: electronic resource
-
2Academic Journal
المؤلفون: Roald Eiselen, Gerhard B. van Huyssteen
المصدر: Journal of Open Humanities Data, Vol 9, Pp 18-18 (2023)
مصطلحات موضوعية: likert-type data, swearwords, afrikaans, statistical comparisons, History of scholarship and learning. The humanities, AZ20-999, Language and Literature
وصف الملف: electronic resource
-
3
المؤلفون: Roald Eiselen, Andiswa Bukula
المصدر: ACM Transactions on Asian and Low-Resource Language Information Processing. 22:1-19
مصطلحات موضوعية: General Computer Science
-
4
المؤلفون: Febe de Wet, Andiswa Bukula, Willem Karsten, Martin Puttkammer, Erwin Schillack, Roné Wierenga, Roald Eiselen
المصدر: Journal of the Digital Humanities Association of Southern Africa (DHASA). 4
-
5
المؤلفون: Tanja Gaustad, Roald Eiselen
المصدر: Journal of the Digital Humanities Association of Southern Africa (DHASA). 4
-
6
المؤلفون: Roald Eiselen, Dimakatso Mathe
المصدر: South African Journal of African Languages. 41:259-269
مصطلحات موضوعية: Linguistics and Language, Literature and Literary Theory, Language and Linguistics
-
7
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 247,926; Token count: 3,633,845; Vocab size: 63,772; Embedding dimensions: 600; 3.62GB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/597
-
8
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 816,776; Token count: 15,801,081; Vocab size: 101,924; Embedding dimensions: 400; 143.02MB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/655
-
9
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 12,794,432; Token count: 381,087,586; Vocab size: 582,279; Embedding dimensions: 500; 1.01GB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/626
-
10
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 299,112; Token count: 4,436,576; Vocab size: 76,883; Embedding dimensions: 600; 3.69GB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/599
-
11
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 360,698; Token count: 7,357,764; Vocab size: N/A; Embedding dimensions: 2,048; 182.03MB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/612
-
12
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 304,248; Token count: 7,363,713; Vocab size: 30,000; Embedding dimensions: 768; 236.05MB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/643
-
13
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 304,248; Token count: 7,363,713; Vocab size: 52,778; Embedding dimensions: 400; 75.55MB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/663
-
14
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 12,794,432; Token count: 381,087,586; Vocab size: 582,279; Embedding dimensions: 600; 6.62GB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/586
-
15
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 299,112; Token count: 4,436,576; Vocab size: 41,685; Embedding dimensions: 600; 89.24MB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/659
-
16
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 515,961; Token count: 14,518,437; Vocab size: 33,074; Embedding dimensions: 600; 71.93MB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/651
-
17
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 718,751; Token count: 13,190,962; Vocab size: 172,170; Embedding dimensions: 600; 3.97GB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/594
-
18
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 304,248; Token count: 7,363,713; Vocab size: N/A; Embedding dimensions: 2,048; 182.21MB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/623
-
19
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 299,112; Token count: 4,436,576; Vocab size: N/A; Embedding dimensions: 2,048; 181.96MB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/609
-
20
المؤلفون: Roald Eiselen
المساهمون: Rico Koen, Albertus Kruger, Jacques van Heerden
المصدر: Web ; Government Documents
وصف الملف: Training data: Paragraphs: 360,698; Token count: 7,357,764; Vocab size: 61,817; Embedding dimensions: 400; 88.52MB (Zipped); application/octet-stream
Relation: https://hdl.handle.net/20.500.12185/662