Gene Dole_1765 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1765
Symbol
ID	5694604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2126385
End bp	2128004
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	61%
IMG OID	641264362
Product	thiamine-phosphate pyrophosphorylase
Protein accession	YP_001529646
Protein GI	158521776
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0352] Thiamine monophosphate synthase [COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR00693] thiamine-phosphate pyrophosphorylase [TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTTCCTG AAGATCTGAG AAAACACCTG CGGTTCTATT TTATCACCGA TGACAGCGGT 
GGCCCGGCGC CACTTGAACA GGCAAAAGCG GCCATTCTCG GCGGCGCCAC CATGGTTCAG 
TACCGCAACA AGGCCTTTGA CGGCCGGTTT TTTGAAGAGG CCACGGCCAT TTTGCGTCTG 
TGCCGGGTCA ATCAAATTCC TTTTATTGTC AATGACGACC CGGTCCTGGC ACGGGCATTG 
GGTGCTGACG GCGTTCATGT GGGGCAGGCC GACGGCAGCC TGAAGACGGC ACGAAGCATC 
GTGGGAAAAA ACGCGCTGGT GGGGGTGTCG GTCTCCACTC TTGACGAGCT TGCCCGGACC 
CCTGTTGAGT TTTGTGATTA TATCGGCACC GGACCGGTGT TTGCCACGAG CACCAAGCCG 
GACGCCAGCC CGGTGATCGG GGTGGCGGGG CTCAAGGCGG TCATCGACCG GTCGAAAAAG 
CCGGTGGTGG CCATCGGCGG TATCAATGCC GCAAACGCCG CTGCCTGCTT CTCTGCCGGG 
GCTGCGGGCG TGGCCGTGAT CAGTTGCGTG AGCCGTGCTG ACAGTCCCCT TGAAGACGCC 
CGGTTTCTGG CAGGGGCCTG CGGTATTGAG GTTTTTTCTG AAAAGCTGAA TGTGCCGTGG 
AACGATGAGT TCGGCCTGAT CGACAGGCTT CTGGCCGGGG ATAAGAAGGC CAACGCGGCA 
GAAGAGGAAA TTTTGAAGGT GGGACCCGGG GATGACGCGG CCGTGCTGCA TGCCCTGAAA 
ACACCGGTGA TCACCACCGA CGCCCAGGTG GAAAATGTCC ATTTCTCTTT TTCCTGGCAG 
CGGCCCGGGG AGGTGGGGCA AAGGGCCGTG ACCGTGGTGT TAAGCGATCT GGCCGCCGCC 
TATGCCCGTC CGGTGTCCCT GTTTGTCAAC CTGACCCTTC CGCACGACAG GCCCGAGTCT 
TTGGCCATAG ACCTTTACGC GGGGCTGAAG AAAGGACTTG CCGTCTATGA TTGTGCGCTG 
GGCGGTGGCA ATCTATCCGG CGGCCGGGAA GTTTCCCTGA ACCTGTTTGC CGTGGGAGAG 
GCAAGGGCGC CTTTTTATCC GGCCCGCGCC AATGCCCGGC CCGGTGACGA TTTGTATTGT 
ACCGGCCCCC TGGGCCGATC CAGGGCCGGG CTGCTGGCAT TGGCGGCCGG CCTGGAGGGA 
TATGATTCTC TGGTCGAGGC ATTCAAGTTT CCCCGCGCCC GGTTTGACGC GGCTATCGTG 
CTGGCGGATT ACAATGTGCG CTGCGTCATG GATATCAGCG ACGGCCTGGC CGGGGATGCC 
CGCCATATTG CCAGGGCTTC GGGCATTACA CTCTGTTTTG ACGTGGATAC CGCCGTCTGT 
TCCGATGACC TTCAGCGGTT CTGCGAGAAA ACCGGCAACC GGCCCGAAGA GATGATCTTT 
TCCGGGGGTG AAGACTATGA GCTGCTGTTT GCCTGCCCAC CGGAAACGGC CCGGCGCATC 
GGGGATGTCA TGCCTGTTTA CCGTCTGGGC CGCTGCCTTT CTTTTGATGG TGAATACCTG 
CGCAACCTGC CTGAAGGCGT GGCCCCGTTT CAGCATGGCC ATGCCGGTTC CGGAGACTGA

Protein sequence

MLPEDLRKHL RFYFITDDSG GPAPLEQAKA AILGGATMVQ YRNKAFDGRF FEEATAILRL 
CRVNQIPFIV NDDPVLARAL GADGVHVGQA DGSLKTARSI VGKNALVGVS VSTLDELART 
PVEFCDYIGT GPVFATSTKP DASPVIGVAG LKAVIDRSKK PVVAIGGINA ANAAACFSAG 
AAGVAVISCV SRADSPLEDA RFLAGACGIE VFSEKLNVPW NDEFGLIDRL LAGDKKANAA 
EEEILKVGPG DDAAVLHALK TPVITTDAQV ENVHFSFSWQ RPGEVGQRAV TVVLSDLAAA 
YARPVSLFVN LTLPHDRPES LAIDLYAGLK KGLAVYDCAL GGGNLSGGRE VSLNLFAVGE 
ARAPFYPARA NARPGDDLYC TGPLGRSRAG LLALAAGLEG YDSLVEAFKF PRARFDAAIV 
LADYNVRCVM DISDGLAGDA RHIARASGIT LCFDVDTAVC SDDLQRFCEK TGNRPEEMIF 
SGGEDYELLF ACPPETARRI GDVMPVYRLG RCLSFDGEYL RNLPEGVAPF QHGHAGSGD