Gene Dret_1422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1422
Symbol
ID	8419251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	1652631
End bp	1653848
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	59%
IMG OID	645037997
Product	GTP cyclohydrolase II
Protein accession	YP_003198287
Protein GI	258405545
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II [TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.13009
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.145821
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGTTT GTACGCCAGA GGAAGCCATT GAAGAAATCC GTCAAGGCCG CATGCTCATC 
CTGGTCGACG ACGAAGATCG CGAAAACGAG GGCGACCTGA CCATTGCCGC AGAACATATC 
ACGCCTGAGG CCATCAATTT CATGGCCACC CACGGACGGG GGCTCATCTG CCTTGCCCTG 
GCCCCGGAAT GGGTCGACCG CCTTGAACTG CCGATGCAGC CCCGGCGCAA CGAATCCAAA 
TTCGGCACCG CCTTCACCGT CTCCATTGAG GCCGCTCAGG GAGTGACCAC CGGGATTTCC 
GCACACGACC GGGCCACAAC CATTCAGGCT GCGGTCCAGG AAGATGTCAC CCCGGACGAT 
ATCAGCACAC CGGGACATAT CTTCCCTTTG CGCGCCCGCA ACGGCGGAGT CCTGGTCCGC 
GCCGGTCAGA CCGAGGGCAG TGTCGATCTG AGCAAACTGG CCGGATGCAA ACCAGCCTCG 
GTGATCTGCG AGATCATGCG TGAAGACGGC ACCATGGCCC GGATGCCGGA TCTGGAGGTC 
TTTGCCGAAA AGCACGGCCT GAAGATCGCG ACCATTGAAA GTCTGATCCG CTACCGCTCC 
AAATTCGATT CCCTGGTCAC CGCCGTGGGC GAAGCGCAAT TGCCGACGAA ATTCGGTCAC 
TTCCGGGCTG TCGCCTACGA GAGCGAGATC GAAGACCATA CCCATTTGGC CCTGGTCAAA 
GGGGAAATCC ACGAAGACGA GCCGATCCTG GTCCGGGTCC ACAGCCAATG CCTGACCGGG 
GACATCTTCG GCAGCCTCCG TTGCGACTGT GGCAATCAAC TCCAGAACGC CATGCGCATG 
ATCGAAGAGG AAGGCAACGG CATCCTGCTG TATATGCGCC AGGAAGGCCG GGGGATCGGC 
CTGGGCAACA AAATCCGCGC TTACCACCTC CAGGACCAGG GCAAGGATAC GGTCGAAGCC 
AATCTCGAAC TCGGCTTTGA ACCCGACCTC CGCGATTACG GTATCGGGGC CCAGATCCTT 
GTCGATCTTG GGGTCCAGAA AATGCGTTTG ATGACCAACA ATCCCAAGAA GGTCGTTGGC 
CTGCAGGGTT ACGGGCTGGA GATTACGGAC CGTGTCGGCC TGGAGACCAC GCCCTGTGAG 
GAAAACCTCT GCTACCTGCG CACCAAGCAG GAGAAAATGG GCCATATGTT CACTCAGGAA 
TACGGCACAG GGGAATAA

Protein sequence

MPVCTPEEAI EEIRQGRMLI LVDDEDRENE GDLTIAAEHI TPEAINFMAT HGRGLICLAL 
APEWVDRLEL PMQPRRNESK FGTAFTVSIE AAQGVTTGIS AHDRATTIQA AVQEDVTPDD 
ISTPGHIFPL RARNGGVLVR AGQTEGSVDL SKLAGCKPAS VICEIMREDG TMARMPDLEV 
FAEKHGLKIA TIESLIRYRS KFDSLVTAVG EAQLPTKFGH FRAVAYESEI EDHTHLALVK 
GEIHEDEPIL VRVHSQCLTG DIFGSLRCDC GNQLQNAMRM IEEEGNGILL YMRQEGRGIG 
LGNKIRAYHL QDQGKDTVEA NLELGFEPDL RDYGIGAQIL VDLGVQKMRL MTNNPKKVVG 
LQGYGLEITD RVGLETTPCE ENLCYLRTKQ EKMGHMFTQE YGTGE