Tez Koleksiyonu
Bu koleksiyon için kalıcı URI
Güncel Gönderiler
Öğe Grounding text-to-image diffusion models for controlled high-quality image generation(Türk-Alman Üniversitesi, Fen Bilimler Enstitüsü, 2025) Süleyman, Ahmadge-scale text-to-image (T2I) diffusion models have emerged as the new state-of-the art image generative models, demonstrating outstanding performance in synthesizing diverse high-quality visuals from natural language text captions. Image generative models have a wide range of applications including content creation, image editing and medical imaging. Although simple and powerful, text prompt alone is insufficient for tailoring the generation process into creating customized outputs. To address this limitation, multiple layout-to-image models have been developed to control the generation process by utilizing a broad array of layouts such as segmentation maps, edges, and human keypoints. In this thesis, we propose ObjectDiffusion, a model that builds on the top of cutting-edge image generative frameworks to seamlessly extend T2I models with object names along with their corresponding bounding boxes. Specifically, we make substantial modifications to the network architecture introduced in ContorlNet to integrate it with the condition processing and injection techniques proposed in GLIGEN. ObjectDiffusion is initialized with pre-training parameters to leverage the generation knowledge obtained from training on large-scale datasets. We fine-tune ObjectDiffusion on COCO2017 training dataset and evaluate it on COCO2017 validation dataset. Our model achieves an AP score of 27.4, an AP50 of 46.6, an AP75 of 28.2, an AR of 44.5, and a FID of 19.8 outperforming the current SOTA model trained on open-source datasets in AP50, AR, and FID metrics. ObjectDiffusion demonstrates a distinctive capability in synthesizing diverse high-quality, high-fidelity images that seamlessly conform to the semantic and spatial control inputs. Evaluated in qualitative and quantitative tests, ObjectDiffusion exhibits remarkable grounding abilities on closed-set and open-set settings across a wide variety of contexts. The qualitative assessment verifies the ability of ObjectDiffusion to integrate multiple grounding entities of different sizes and locations. The results of the ablative studies highlight the efficacy of our suggested weight initialization in harnessing the pre-training knowledge to enhance the conditional model performance.Öğe FFT/IFFT implementations using configurable posit arithmetic with Taylor series approximation for euler formula and hardware synthesis of chunk-based processing(Türk-Alman Üniversitesi, Fen Bilimler Enstitüsü, 30.07.2025) Otlu, Mustafa BurakIEEE floating-point aritmetiği [21], sinyal işleme uygulamalarında sınırlı dinamik aralık ve hassasiyet problemleriyle karşılaşmaktadır. Buna karşılık, posit sayı sistemi [26], daha yüksek doğruluk ve geniş dinamik aralık sunmaktadır. Bu çalışmada, hesaplama verimliliğini ve yapılandırılabilirlik seviyesini artırmak için, Euler formülünün Taylor serisi yaklaşımıyla yaklaşık olarak hesaplanan sinüs ve kosinüs fonksiyonları kullanılarak, posit tabanlı Hızlı Fourier Dönüşümü (FFT) ve Ters Hızlı Fourier Dönüşümü (IFFT) uygulamaları sunulmaktadır. Tasarım, double precision floating point birimlerine ihtiyaç duymayan tamamen posit tabanlı bir veri yoluna sahiptir ve mevcut temel posit FFT uygulamalarının ötesinde çok çeşitli posit konfigürasyonlarını desteklemektedir [33-34]. Diğer çalışmalardan farklı olarak, birden fazla posit konfigürasyonu için Vitis framework kullanılarak donanım sentezi analizi de dahil edilmiştir. Sistem, gecikme süresini ve donanım kaynaklarının kullanımını optimize etmek için 2𝑛 büyüklüğünde parçalara bölünen 32.768 örnekten oluşan giriş sinyallerini işler. Hem ses sinyalleri hem de rastgele verilerle yapılan deneysel değerlendirmeler, single precision IEEE floating-point formatına kıyasla önemli ölçüde iyileştirilmiş sinyal-gürültü oranı (SNR) sağlamış ve donanım kaynak tüketimi açısından karşılaştırılabilir sonuçlar elde edilmiştir. Ayrıca, FFT ve IFFT uygulamaları için bit uzunluğu (N) ve üs boyutu (ES) seçilerek gerekli hassasiyetin, dinamik aralığın ayarlanması ve donanım maliyetinin optimize edilmesi amacıyla posit parametre seçimine dair bir değerlendirme sunulmuştur. Sentezlenen birimlerin, single precision floating point uygulamalarına göre daha fazla donanım kullandığı gözlemlense de, sayısal doğruluktaki önemli artışlar posit sayı sisteminin sinyal işleme hızlandırıcıları için umut vadeden bir alternatif olduğunu göstermektedir. Bildiğimiz kadarıyla, bu çalışma kütüphanesi ile birlikte Vitis kullanılarak tamamen posit tabanlı ilk FFT/IFFT tasarımını sunmaktadır. Elde edilen sonuçlar, yüksek performanslı ve kaynak verimli donanım tabanlı sinyal işleme için posit aritmetiğinin uygulanabilirliğini ve avantajlarını ortaya koymaktadır.Öğe Artificial intelligence based analysis of vital signs for improvement of healthcare services using MIMIC-III waveform database(Türk-Alman Üniversitesi, Fen Bilimler Enstitüsü, 14.07.2025) Olcay, Fırat FuatYapay zeka (YZ) ve makine öğrenimi (MÖ) tekniklerinin yaygın kullanımı, özellikle girişimsel olmayan yaşamsal belirtilerin analizinde sağlık hizmetlerinde köklü değişimlere yol açmıştır. Bu çalışma, MIMIC-III Waveform Veritabanı’ndan elde edilen kalp ritmi, nabız, solunum hızı ve kandaki oksijen doygunluğu (SpO₂) gibi fizyolojik zaman serisi verilerinin etkin bir şekilde analiz edilmesi sorununu ele almaktadır. Bu problemin önemi, erken teşhis süreçlerinin iyileştirilmesi, invaziv izleme cihazlarına olan bağımlılığın azaltılması ve yoğun bakım ünitesi (YBÜ) ile ilgili klinik kararların doğruluğunun artırılması potansiyelinden kaynaklanmaktadır. Bu tezin amacı, yaşamsal belirtiler arasındaki ilişkileri ortaya çıkarabilen, anomalileri tespit edebilen ve hastaları bulundukları YBÜ türlerine göre otomatik olarak sınıflandırabilen bir sistem geliştirmektir. Yöntem olarak, iki saatlik zaman serilerinin ön işlenmesi ve bölütlenmesi, sinyal dönüşümleri (örneğin Fourier dönüşümü ve spektral analiz), öznitelik mühendisliği ve çeşitli makine öğrenimi ve derin öğrenme modellerinin (lojistik regresyon, rastgele orman, XGBoost ve LSTM ağları) eğitilmesi süreçleri uygulanmıştır. Başlangıçtaki korelasyon ve varyans analizleri, özellikle nabız ve kalp ritmi arasında güçlü bir bağıntı olduğunu ve YBÜ türlerine özgü belirgin farklılıklar bulunduğunu ortaya koymuştur. Test edilen modeller arasında CNN-BiLSTM, sınıflandırma doğruluğu açısından en iyi performansı göstermiştir. Elde edilen sonuçlar, korelasyon bilgisi ile zaman serisi modellemenin birleştirilmesinin sınıflandırma başarımını anlamlı ölçüde artırdığını ve veri odaklı klinik karar destek sistemlerinin geliştirilmesine katkı sunduğunu göstermektedir. Tez, yaşamsal belirti bağıntılarının YZ teknikleriyle etkili biçimde kullanılabileceğini ve bu sayede sağlık analizlerinin doğruluğunun artırılabileceğini ortaya koymaktadır.Öğe Real-time machine learning anomaly detection in computer networks(Türk-Alman Üniversitesi Fen Bilimler Enstitüsü, 2024) Demir, Halit CanapIn the rapidly evolving digital world, the need for advanced security measures to protect our data has steadily increased. The growing cyber threats have made it essential to develop sophisticated Intrusion Detection Systems (IDS) that can adapt to modern network environments. In this thesis, to address this need, a system that detects malicious traffic by analyzing network traffic flows using deep learning methods is proposed. Various datasets that could be used for system development were examined, and the CICIDS2017 dataset, which stands out in terms of relevance and scope, was chosen. The CICIDS2017 dataset contains a total of 15 classes, one representing normal network traffic and the others representing different types of attacks. Training the deep learning model with a consistent and balanced dataset directly impacts system performance. Therefore, pre-processing steps such as removing missing or redundant data, eliminating irrelevant features, and balancing the number of examples in different classes were performed. Dense Neural Networks (DNN) and Random Forest (RF), methods commonly used in similar studies, were selected for the proposed model. The models developed could detect network traffic involving different types of attacks with an average accuracy of 98.5%. The main goal of this study is to detect attacks on the network. Accordingly, a version of the dataset consisting of two classes—normal network traffic and attack traffic—was created. Using this dataset, another system was developed that could detect malicious traffic with 98.8% accuracy. The systems developed in this thesis aim to detect attacks in real-time within a network. Therefore, after optimizing performance through experiments with different parameters, the models were tested in a real network environment using the NVIDIA Jetson AGX Orin embedded system. For the sustainability of the developed system, training with current network traffic and attacks is also essential. In this regard, the training of the models on the embedded system was analyzed in terms of time and performance.Öğe Unraveling the capabilities of language models in news summarization performance evaluation and comparative study(Türk-Alman Üniversitesi Fen Bilimler Enstitüsü, 2024) Odabaşı, Abdurrahman; Biricik, GökselGiven the recent introduction of multiple public Large Language Models (LLMs) andthe ongoing demand for improved Natural Language Processing tasks, particularlysummarization, this thesis provides a comprehensive benchmarking of 20 recent LLMson the news summarization task. The study systematically evaluates the capabilityand effectiveness of these models in summarizing news articles across different styles,utilizing three distinct datasets. Specifically, this study focuses on zero-shot and few-shot learning settings, employing a robust evaluation methodology that integratesautomatic metrics, human evaluation, and LLM-as-a-judge. Interestingly, includingdemonstration examples in the few-shot learning setting did not enhance models’ per-formance and, in some cases, even led to worse outcomes. This issue arises mainlydue to the poor quality of the gold summaries used as references, which hinders themodels’ learning process and negatively impacts their performance. Furthermore, ourstudy’s results highlight the exceptional performance of GPT-3.5 and GPT-4, whichgenerally dominate due to their advanced capabilities. However, among the publicmodels evaluated, certain models such as Qwen1.5-7B, SOLAR-10.7B-Instruct-v1.0,and Zephyr-7B-Beta demonstrated promising results. These models showed signifi-cant potential, positioning them as competitive alternatives to private models for thetask of news summarization.











