Gene TM1040_2129 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2129
Symbol
ID	4076443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2234044
End bp	2235168
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	60%
IMG OID	638007449
Product	GTP cyclohydrolase II / 3,4-dihydroxy-2-butanone 4-phosphate synthase
Protein accession	YP_614123
Protein GI	99081969
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTATG AGACGCCCGG TCCAGTCGAG TCTGAGTTGC GCGACGCCAT CAGTCCGATT 
GAAGAGATCA TCGACGCCGC GCGCGCGGGC AAGATGTATA TTCTTGTCGA TCATGAGGAC 
CGCGAAAACG AGGGTGATCT GATCATCCCG GCGGAGTTTG CCGACGCGGA TGCGATCAAC 
TTTATGGCCA CCTATGGGCG TGGACTCATC TGCCTCCCAA TGACGGCCGA GCGCATTGAT 
CGTTTGGGCT TGCCGATGAT GGCGGTGAAC AATTCCTCGC GTCACGAGAC GGCCTTTACC 
GTGTCGATCG AGGCGCGCGA AGGGGTCGAT ACCGGGATTT CCGCCGCGGA TCGTGCGCTG 
ACCGTGGCCA CGGCGATCAA TGAGCAAAAT ACCATGGCGG CGATTGCAAC GCCGGGCCAT 
GTTTTCCCGC TGCGCGCAAA ACGCGGCGGG GTTCTGGTCC GGGCCGGGCA CACCGAGGCC 
TCTGTCGATA TTTCGCGCAT CGCGGGCTGT CACCCATCGG CCGTGATCTG CGAGATCATG 
AAAGACGATG GCACCATGGC GCGACTGCCG GATCTGGTGG AATTTGCAAA AACCCACGAT 
ATGAAAATCG GCACCATCTC GGATCTCATC GCCTACCGCG CCAAGAACGA CAACCTCGTG 
GATGAGACCG CCCGCTCTAC CGTTACCTCG GAATATGGGG GCGACTGGGA GATGCGGATC 
TTCACCGATC AGACCCATGA TGTGGAGCAT GTTGTCCTGA TCAAGGGCGA CATCACCACG 
CCAGAGCCGG TGCTGACTCG CACTCATGCG CTGCATGAGG CGTCCGACTT GCTGGGGCTT 
GGTCCCAAAC CCGCTGGGGA ACTGCCGCGC GCGATGGAAT TGATCGCCGA CGAGGGGCGC 
GGGATCGTCT GCCTGTTCCG CCAGCCGCGC AACGCGCTCT ATGCCTCCGA CGAGGAAGGG 
GTGCGCACCA TCAAACAGAC CGGTCTCGGG GCGCAAATTC TGAATAAACT CGGCGTTGAG 
GAACTGATCC TGCTCACCGA CTCGCCGCAA ACCAAATATG TTGGGCTGGA TGCCTATGGG 
CTGTCGATTG TCGGCACCCG TCCCATCCTG TCCCGAGACA GCTAA

Protein sequence

MSYETPGPVE SELRDAISPI EEIIDAARAG KMYILVDHED RENEGDLIIP AEFADADAIN 
FMATYGRGLI CLPMTAERID RLGLPMMAVN NSSRHETAFT VSIEAREGVD TGISAADRAL 
TVATAINEQN TMAAIATPGH VFPLRAKRGG VLVRAGHTEA SVDISRIAGC HPSAVICEIM 
KDDGTMARLP DLVEFAKTHD MKIGTISDLI AYRAKNDNLV DETARSTVTS EYGGDWEMRI 
FTDQTHDVEH VVLIKGDITT PEPVLTRTHA LHEASDLLGL GPKPAGELPR AMELIADEGR 
GIVCLFRQPR NALYASDEEG VRTIKQTGLG AQILNKLGVE ELILLTDSPQ TKYVGLDAYG 
LSIVGTRPIL SRDS