نتائج البحث - "Visual Question Answering (VQA)" :: Library Catalog

تحديد النتيجة رقم 1
1

Academic Journal

Intelligent visual question answering in TCM education: An innovative application of IoT and multimodal fusion

المؤلفون: Wei Bi, Qingzhen Xiong, Xingyi Chen, Qingkun Du, Jun Wu, Zhaoyu Zhuang

المصدر: Alexandria Engineering Journal, Vol 118, Iss , Pp 325-336 (2025)

مصطلحات موضوعية: Internet of Things (IoT), TCM education, Visual question answering (VQA), VisualBERT, Multimodal fusion, Deep learning, Engineering (General). Civil engineering (General), TA1-2040

وصف الملف: electronic resource

Relation: http://www.sciencedirect.com/science/article/pii/S1110016824016508; https://doaj.org/toc/1110-0168

URL الوصول: https://doaj.org/article/1cb09f28430241c2b3df11a4a062bb6f

View record in DOAJ Full Text Finder

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 2
2

Academic Journal

Designing and Evaluating a Dual-Stream Transformer-Based Architecture for Visual Question Answering

المؤلفون: Faheem Shehzad, Aniello Minutolo, Massimo Esposito

المصدر: IEEE Access, Vol 12, Pp 195561-195574 (2024)

مصطلحات موضوعية: Visual question answering (VQA), transformer models, natural language processing, dual-stream architecture, multimodal question answering, attention mechanisms, Electrical engineering. Electronics. Nuclear engineering, TK1-9971

وصف الملف: electronic resource

Relation: https://ieeexplore.ieee.org/document/10811881/; https://doaj.org/toc/2169-3536

URL الوصول: https://doaj.org/article/354ed089f6a74cfcab842d69274098f4

View record in DOAJ Full Text Finder

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 3
3

Academic Journal

PERS: Parameter-Efficient Multimodal Transfer Learning for Remote Sensing Visual Question Answering

المؤلفون: Jinlong He, Gang Liu, Pengfei Li, Xiaonan Su, Wenhua Jiang, Dongze Zhang, Shenjun Zhong

المصدر: IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, Vol 17, Pp 14823-14835 (2024)

مصطلحات موضوعية: Multimodal representation learning, parameter-efficient transfer learning, remote sensing (RS) visual question answering (VQA), Ocean engineering, TC1501-1800, Geophysics. Cosmic physics, QC801-809

وصف الملف: electronic resource

Relation: https://ieeexplore.ieee.org/document/10643278/; https://doaj.org/toc/1939-1404; https://doaj.org/toc/2151-1535

URL الوصول: https://doaj.org/article/9b2880f8a088446b81905f73107a8f63

View record in DOAJ

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 4
4

Conference

Vision LLM-Driven operational hazard recognition for building fire safety compliance checking

المؤلفون: Dayou Chen, Long Chen, Yiheng Zeng, Craig Hancock, Russell Lock, Simon Solvsten

مصطلحات موضوعية: Fire Safety Compliance, Automated Compliance Checking (ACC), Vision Large Language Models (vLLM), Visual Question Answering (VQA), Computer Vision, Operational Phase Monitoring

Relation: 2134/28023164.v1

الاتاحة: https://figshare.com/articles/conference_contribution/Vision_LLM-Driven_operational_hazard_recognition_for_building_fire_safety_compliance_checking/28023164

View record in BASE

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 5
5

Academic Journal

Review of Visual Question Answering Technology

المؤلفون: WANG Yu, SUN Haichun

المصدر: Jisuanji kexue yu tansuo, Vol 17, Iss 7, Pp 1487-1505 (2023)

مصطلحات موضوعية: visual question answering (vqa), modal fusion, visual dialogue, intelligent question answering, cross-modal technology, Electronic computers. Computer science, QA75.5-76.95

وصف الملف: electronic resource

Relation: http://fcst.ceaj.org/fileup/1673-9418/PDF/2303025.pdf; https://doaj.org/toc/1673-9418

URL الوصول: https://doaj.org/article/07b5121b970449d29ac9ce31fc3bd51f

View record in DOAJ

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 6
6

Academic Journal

A multi-scale contextual attention network for remote sensing visual question answering

المؤلفون: Jiangfan Feng, Hui Wang

المصدر: International Journal of Applied Earth Observations and Geoinformation, Vol 126, Iss , Pp 103641- (2024)

مصطلحات موضوعية: Remote sensing, Visual question answering (VQA), Cross-modal, Attention, Multi-scales, Physical geography, GB3-5030, Environmental sciences, GE1-350

وصف الملف: electronic resource

Relation: http://www.sciencedirect.com/science/article/pii/S156984322300465X; https://doaj.org/toc/1569-8432

URL الوصول: https://doaj.org/article/ce6b3aef0b2941349cc55c9abaf68a3d

View record in DOAJ Full Text Finder

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 7
7

Academic Journal

Vision-language models for biomedical applications

المؤلفون: Thapa, Surendrabikram, Naseem, Usman, Zhou, Luping, Kim, Jinman

المصدر: Thapa , S , Naseem , U , Zhou , L & Kim , J 2024 , Vision-language models for biomedical applications . in VLM4Bio '24 : proceedings of the First International Workshop on Vision-Language Models for Biomedical Applications . Association for Computing Machinery , New York , pp. 1-2 , First International Workshop on Vision-Language Models for Biomedical Applications (1st : 2024) , Melbourne , Victoria , Australia , 28/10/24 . https://doi.org/10.1145/3689096.3690770

مصطلحات موضوعية: Vision-Language Models (VLMs), Multimodal Biomedical AI, Visual Question Answering (VQA), Clinical Decision Support Systems, Healthcare Applications

وصف الملف: application/pdf

Relation: urn:ISBN:9798400712074

الاتاحة: https://researchers.mq.edu.au/en/publications/60cdd7ca-082e-4aec-8f28-05bd45728fb8
https://doi.org/10.1145/3689096.3690770
https://research-management.mq.edu.au/ws/files/389134772/389106407.pdf

View record in BASE

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 8
8

Academic Journal

Machine-to-Machine Visual Dialoguing with ChatGPT for Enriched Textual Image Description

المؤلفون: Ricci, Riccardo, Bazi, Yakoub, Melgani, Farid

المساهمون: Ricci, Riccardo, Bazi, Yakoub, Melgani, Farid

مصطلحات موضوعية: ChatGPT, image captioning, visual dialoguing, visual question answering (VQA), visual question generation (VQG)

Relation: info:eu-repo/semantics/altIdentifier/wos/WOS:001160070300001; volume:16; issue:3; firstpage:44101; lastpage:44118; numberofpages:18; journal:REMOTE SENSING; https://hdl.handle.net/11572/437939

الاتاحة: https://hdl.handle.net/11572/437939
https://doi.org/10.3390/rs16030441
https://www.mdpi.com/2072-4292/16/3/441

View record in BASE

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 9
9

Academic Journal

RS-LLaVA: A Large Vision-Language Model for Joint Captioning and Question Answering in Remote Sensing Imagery

المؤلفون: Bazi, Yakoub, Bashmal, Laila, Al Rahhal, Mohamad Mahmoud, Ricci, Riccardo, Melgani, Farid

المساهمون: Bazi, Yakoub, Bashmal, Laila, Al Rahhal, Mohamad Mahmoud, Ricci, Riccardo, Melgani, Farid

مصطلحات موضوعية: captioning, instruction tuning, Large Language and Vision Assistant Model (LLaVA), large language models (LLMs), remote sensing (RS), visual question answering (VQA)

Relation: info:eu-repo/semantics/altIdentifier/wos/WOS:001219825600001; volume:2024, 16; issue:9; firstpage:147701; lastpage:147718; numberofpages:18; journal:REMOTE SENSING; https://hdl.handle.net/11572/437938

الاتاحة: https://hdl.handle.net/11572/437938
https://doi.org/10.3390/rs16091477
https://www.mdpi.com/2072-4292/16/9/1477

View record in BASE

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 10
10

Academic Journal

SBVQA 2.0: Robust End-to-End Speech-Based Visual Question Answering for Open-Ended Questions

المؤلفون: Faris Alasmary, Saad Al-Ahmadi

المصدر: IEEE Access, Vol 11, Pp 140967-140980 (2023)

مصطلحات موضوعية: Speech-based visual question answering (SBVQA), question answering, visual question answering (VQA), machine learning, multimodal, Electrical engineering. Electronics. Nuclear engineering, TK1-9971

وصف الملف: electronic resource

Relation: https://ieeexplore.ieee.org/document/10343139/; https://doaj.org/toc/2169-3536

URL الوصول: https://doaj.org/article/a6f1fa32684a401da808b8fd9af3764c

View record in DOAJ Full Text Finder

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 11
11

Report

Multihop Multimodal QA using Joint Attentive Training and Hierarchical Attentive Vision Language transformers

المؤلفون: Dheeraj Pai, Deigant Yadava, João Monteiro, Vinay Nair

مصطلحات موضوعية: Knowledge Representation and Machine Learning, Natural Language Processing, multimodal machine learning (ML), Machine Learning Methods, alignment, Reasoning in Machine Learning, Reasoning, Visual Question Answering (VQA)

Relation: https://figshare.com/articles/preprint/Multihop_Multimodal_QA_using_Joint_Attentive_Training_and_Hierarchical_Attentive_Vision_Language_transformers/24920718

الاتاحة: https://doi.org/10.1184/r1/24920718.v1
https://figshare.com/articles/preprint/Multihop_Multimodal_QA_using_Joint_Attentive_Training_and_Hierarchical_Attentive_Vision_Language_transformers/24920718

View record in BASE

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 12
12

Academic Journal

Improving visual question answering for remote sensing via alternate-guided attention and combined loss

المؤلفون: Jiangfan Feng, Etao Tang, Maimai Zeng, Zhujun Gu, Pinglang Kou, Wei Zheng

المصدر: International Journal of Applied Earth Observations and Geoinformation, Vol 122, Iss , Pp 103427- (2023)

مصطلحات موضوعية: Remote sensing, Visual question answering (VQA), Cross-modal, Transformer, Physical geography, GB3-5030, Environmental sciences, GE1-350

وصف الملف: electronic resource

Relation: http://www.sciencedirect.com/science/article/pii/S1569843223002510; https://doaj.org/toc/1569-8432

URL الوصول: https://doaj.org/article/cf95caeea90e4efcbf37478ad5fd17ca

View record in DOAJ Full Text Finder

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 13
13

Academic Journal

Research on the Teaching Method of College Students’ Education Based on Visual Question Answering Technology

المؤلفون: Lin, Fang

المصدر: International Journal of Emerging Technologies in Learning (iJET); Vol. 18 No. 22 (2023); pp. 167-182 ; 1863-0383

مصطلحات موضوعية: visual question answering (VQA), education and teaching, college students

وصف الملف: application/pdf

Relation: http://online-journals.org/index.php/i-jet/article/view/44103/14235; http://online-journals.org/index.php/i-jet/article/view/44103

الاتاحة: http://online-journals.org/index.php/i-jet/article/view/44103

View record in BASE

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 14
14

Academic Journal

A Visual Question Answering Network Merging High- and Low-Level Semantic Information

المؤلفون: Chin-Chen CHANG, Chongqing CHEN, Dezhi HAN, Dun LI, Huimin LI, Kuan-Ching LI

المصدر: IEICE Transactions on Information and Systems. 2023, E106.D(5):581

View record in JSTAGE

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 15
15

Academic Journal

Reframing explanation as an interactive medium: The EQUAS (Explainable QUestion Answering System) project

المؤلفون: William Ferguson, Dhruv Batra, Raymond Mooney, Devi Parikh, Antonio Torralba, David Bau, David Diller, Josh Fasching, Jaden Fiotto‐Kaufman, Yash Goyal, Jeff Miller, Kerry Moffitt, Alex Montes de Oca, Ramprasaath R. Selvaraju, Ayush Shrivastava, Jialin Wu, Stefan Lee

المصدر: Applied AI Letters, Vol 2, Iss 4, Pp n/a-n/a (2021)

مصطلحات موضوعية: explainable artificial intelligence (XAI), human/computer interaction (HCI), tasking and adapting agents, visual question answering (VQA), Electronic computers. Computer science, QA75.5-76.95

وصف الملف: electronic resource

Relation: https://doaj.org/toc/2689-5595

URL الوصول: https://doaj.org/article/ffe9220d361948c3b1cc848fc27bf274

View record in DOAJ Full Text Finder

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 16
16

Conference

How Transferable are Reasoning Patterns in VQA?

المؤلفون: Kervadec, Corentin, Jaunet, Theo, Antipov, Grigory, Baccouche, Moez, Vuillemot, Romain, Wolf, Christian

المساهمون: Laboratoire d'InfoRmatique en Image et Systèmes d'information (LIRIS), Université Lumière - Lyon 2 (UL2)-École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), Orange Labs, 35512 Cesson-Sévigné, France, Orange Labs R&D Rennes, France Télécom-France Télécom, Situated Interaction, Collaboration, Adaptation and Learning (SICAL), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Université Lumière - Lyon 2 (UL2)-École Centrale de Lyon (ECL), Extraction de Caractéristiques et Identification (imagine), ANR-20-CHIA-0018,REMEMBER,Apprendre Raisonnement, Mémoire et Contrôle(2020)

المصدر: IEEE Conference on Computer Vision and Pattern Recognition (CVPR) ; https://hal.science/hal-03192949 ; IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Jun 2021, Nashville, Tennessee, United States. ⟨10.1109/CVPR46437.2021.00419⟩ ; http://cvpr2021.thecvf.com/

مصطلحات موضوعية: Visual Question Answering (VQA), Deep Learning, Visual Reasoning, [INFO.INFO-CV]Computer Science [cs]/Computer Vision and Pattern Recognition [cs.CV]

جغرافية الموضوع: Nashville, Tennessee, United States

الاتاحة: https://hal.science/hal-03192949
https://hal.science/hal-03192949v1/document
https://hal.science/hal-03192949v1/file/reasoning_pattern_openreview_v2.pdf
https://doi.org/10.1109/CVPR46437.2021.00419

View record in BASE

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 17
17

Academic Journal

Multi-Modal Instruction-Tuning Small-Scale Language-and-Vision Assistant for Semiconductor Electron Micrograph Analysis

المؤلفون: Sakhinana, Sagar Srinivas, Sannidhi, Geethan, Runkana, Venkataramana

المصدر: Proceedings of the AAAI Symposium Series; Vol. 3 No. 1: Proceedings of the 2024 AAAI Spring Symposium Series; 234-242 ; 2994-4317

مصطلحات موضوعية: Large Multi-Modal Models (LMMs), Visual Question Answering (VQA), Vision-Language Instruction Tuning (VLIT), Parameter Efficient Fine-Tuning (PEFTs), Semiconductor Science

وصف الملف: application/pdf

Relation: https://ojs.aaai.org/index.php/AAAI-SS/article/view/31205/33365

الاتاحة: https://ojs.aaai.org/index.php/AAAI-SS/article/view/31205
https://doi.org/10.1609/aaaiss.v3i1.31205

View record in BASE

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 18
18

Dissertation/ Thesis

Generación de descripciones de imágenes basadas en la experiencia ; Experience-based Image Description Generation

المؤلفون: Pérez Peinador, Adrián, Sanjuán Espejo, Adrián, Gómez Blanco, Rubén

المساهمون: Sánchez Ruiz-Granados, Antonio Alejandro, Díaz Agudo, María Belén

مصطلحات موضوعية: 004(043.3), Visual Question Answering (VQA), Case-Based Reasoning (CBR), Razonamiento basado en experiencia, Inteligencia Artificial (IA), Similitud entre imágenes, Detección de objetos, COCO, Descripción de imágenes, Embeddings, IA Explicable (XAI), Experience based reasoning, Artificial Intelligence (AI), Image similarity, Object detection, Image description, Explainable AI (XAI), Informática (Informática), 33 Ciencias Tecnológicas

وصف الملف: application/pdf

Relation: https://hdl.handle.net/20.500.14352/106900; XXXX-XXXX

الاتاحة: https://hdl.handle.net/20.500.14352/106900

View record in BASE

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 19
19

PitVQA: A Dataset of Visual Question Answering in Pituitary Surgery

المؤلفون: Mobarack Islam, Matt Clarkson, Sophia Bano, Danail Stoyanov, Hani Marcus

مصطلحات موضوعية: Biomedical imaging, Intelligent robotics, Natural language processing, Computer vision, Image processing, Multimodal analysis and synthesis, Visual Question Answering (VQA), large language models in medicine, Large language models (LLMs) in healthcare, Vision Language Models, Pituitary surgery, artificial intelligence analysis, surgical data science

Relation: https://figshare.com/articles/dataset/PitVQA_A_Dataset_of_Visual_Question_Answering_in_Pituitary_Surgery/27004666

الاتاحة: https://doi.org/10.5522/04/27004666.v2
https://figshare.com/articles/dataset/PitVQA_A_Dataset_of_Visual_Question_Answering_in_Pituitary_Surgery/27004666

View record in BASE

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في:
تحديد النتيجة رقم 20
20

Book

Hierarchical relational attention for video question answering

المؤلفون: Chowdhury, Muhammad Iqbal Hasan, Sridharan, Sridha, Fookes, Clinton, Nguyen Thanh, Kien

المساهمون: Kondi, L P, Boulgouris, N

المصدر: Proceedings of the 2018 25th IEEE International Conference on Image Processing (ICIP)

مصطلحات موضوعية: Hierarchical relational attention, Visual Question Answering (VQA), scene understanding

وصف الملف: application/pdf

Relation: https://eprints.qut.edu.au/122718/1/icip_2018_eprint.pdf; Chowdhury, Muhammad Iqbal Hasan, Sridharan, Sridha, Fookes, Clinton, & Nguyen Thanh, Kien (2018) Hierarchical relational attention for video question answering. In Kondi, L P & Boulgouris, N (Eds.) Proceedings of the 2018 25th IEEE International Conference on Image Processing (ICIP). Institute of Electrical and Electronics Engineers Inc., United States of America, pp. 599-603.; https://eprints.qut.edu.au/122718/; Institute for Future Environments; Science & Engineering Faculty

الاتاحة: https://eprints.qut.edu.au/122718/

View record in BASE

qrcode_show

أضف إلى سلة الكتب حذف من سلة الكتب
أضف إلى المفضلة

محفوظ في: