Gene Hhal_2025 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2025
Symbol
ID	4710378
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2227836
End bp	2228804
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	74%
IMG OID	639856498
Product	mutator MutT protein
Protein accession	YP_001003591
Protein GI	121998804
COG category	[F] Nucleotide transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0352] Thiamine monophosphate synthase [COG1051] ADP-ribose pyrophosphatase
TIGRFAM ID	[TIGR00586] mutator mutT protein [TIGR00693] thiamine-phosphate pyrophosphorylase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.153674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCATACGG CATCGCCCGC CGCGCCGATC CACGTGGCCG CCGCCGTGGT CCGCGGCGAA 
GACCAGCGCG TACTGGTCCA GTGCCGGCCG GATCACCTCG ATCACGGCGG TCTGTGGGAG 
TTCCCCGGGG GCAAGATTGA GCCCGGTGAG TCGGTCGCCG ACGCCTTGGT CCGCGAGCTG 
GACGAGGAGC TGGGTATCCG TGTCCGTCCG GGGGCGCTGC GCATCCGCGT GCCGTGGGAC 
TACGGCCACC GGCGCGTGGT GCTCCACGTC CTCGATGTGA ACGAGTGGAC GGGGCGTCCC 
ATCGGCCGCG AGGGCCAGGC GGTGGACTGG CTCACCCCCG AGGCGATGGC CGAGCGGGCC 
TGGCCCGCCG CCAACTGGCC GATCATCCGT TCGCTGCAGC TCCCCGACCG GTATCTGATC 
ACCCCCGTGG AGCCAGCGGA TGCCGATGCC TGGCTGGCCC GACTGGATGC GGCCCTGGCG 
CGCGGTGTGC GCCTGGTTCA GCTGCGTCGC CCAGATCTCG ACGTGGAGGC CTGGGTGCGT 
CTGGGGCGCG CCCTGCGCCG GCGCTGTGAC GCCCACGGTG CGTGGCTGCT AGCCAACGGA 
CCGGCGGAAC AGGCCCGGGC GGTGGGCGCC GACGGGGTGC ACTGGAGCAG TCGCGTGCTG 
GCCGAGGGGC CGCAACGCCC GGGGTGGGCG CGGTGGGTGG GCGCTTCTTG CCACAACGGC 
GACGAGCTGG AGCGCGCCGC CGCCTGCGGG GCCGATTTCG CGCTGTTGTC ACCGGTGCAG 
TGGACGGCCA GCCATCCGGA ACAGAGCGGC ATGGGGTGGG AGCGTTTCGC CGCCTGGGTG 
GCCGGGGCGC GCCTGCCGGT CTACGCCCTC GGCGGCGTGG GCCCGGCGGA TATCCACCGG 
GCTCGGGCCT GCGGCGGGCA GGGAGTGGCG GCTATCCGCG GCCTGCTGGC GGAGGCGGGC 
CGCCGATAG

Protein sequence

MHTASPAAPI HVAAAVVRGE DQRVLVQCRP DHLDHGGLWE FPGGKIEPGE SVADALVREL 
DEELGIRVRP GALRIRVPWD YGHRRVVLHV LDVNEWTGRP IGREGQAVDW LTPEAMAERA 
WPAANWPIIR SLQLPDRYLI TPVEPADADA WLARLDAALA RGVRLVQLRR PDLDVEAWVR 
LGRALRRRCD AHGAWLLANG PAEQARAVGA DGVHWSSRVL AEGPQRPGWA RWVGASCHNG 
DELERAAACG ADFALLSPVQ WTASHPEQSG MGWERFAAWV AGARLPVYAL GGVGPADIHR 
ARACGGQGVA AIRGLLAEAG RR