Gene GWCH70_2237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_2237
Symbol
ID	7978404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	2290355
End bp	2291548
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	44%
IMG OID	644799051
Product	bifunctional 3,4-dihydroxy-2-butanone 4-phosphate synthase/GTP cyclohydrolase II protein
Protein accession	YP_002950211
Protein GI	239827587
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II [TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGACA TGATCGAAGA AGCGATTTAT GAATTGATGC AAGGGAAAGT CATTATTGTA 
TGTGATGACG AGGATCGTGA AAACGAAGGA GATTTTGTCG CATTGGCGGA AAAAGCGACC 
CCAGAAGTGA TTAATTTTAT GATTAAATAC GGACGCGGCC TTGTTTGCGT TCCGATTACG 
GAAGAATTAG CCGATAAGCT TGATTTAGCC CCAATGGTCA ATCATAATAC GGATTCTCAT 
GGCACTGCTT TTACGGTTAG CATTGATTAT AAATCAACGA CAACAGGCAT TAGCGCTTAT 
GAACGTTCGA TGACGATTCA AGCGCTGTTA GATCCGAATG CGAAAGCGAG CGATTTTAAA 
CGTCCTGGGC ACGTTTTTCC ACTTGTGGCG AAAAAAGGAG GCGTATTGCG GCGCGCCGGC 
CATACGGAAG CGGCGGTTGA TTTAGCGCGA TTATGTGGTG CAAAGCCGGC CGGTGTGATT 
TGCGAAATCA TTAAAGAGGA TGGCACGATG GCGCGTGTTT CGGATTTAAG AAAAATCGCT 
GATGAATTTG ATTTGAAAAT GATCACGATT AAAGATTTAA TCGAGTATCG GAGACGAAAA 
GAAAAATTAG TGAAACGCGA AGTAGAAGTG ATGCTTCCAA CAGAGTTTGG CAAGTTTAAA 
GCAATTGGCT ATACAAATAT TGTTGATGGA AAAGAGCATG TTGCTTTAGT CAAAGGCGAA 
ATCATTCCAG ATGAACCGAC GCTTGTTCGG GTTCATTCCG AATGCTTAAC AGGCGATGTG 
TTTGGCTCCT GCCGTTGTGA TTGCGGACCG CAGCTTCATG CGGCGCTCCG CCAAATTGAA 
GAAGAAGGCC GCGGCGTTTT ATTATATATG CGTCAAGAAG GCCGCGGCAT CGGGTTAATC 
AACAAATTGC GCGCGTATAA GCTGCAAGAG CAAGGCTATG ATACGGTGGA AGCAAATGAA 
AGGCTTGGAT TCCCTGCCGA TTTGCGTGAC TATGGGATTG GCGCGCAAAT TTTAAAAGAT 
CTCGGCGTGA CGAAAATGCG ACTATTGACA AATAATCCGC GGAAAATCAC TGGATTAAAA 
GGACACGGCC TTGAAGTCGT CGAGCGTGTT CCACTGCAAA TGCCGGCGAA CAAGGAAAAT 
GAAAAATACT TGCGGACGAA GTATGAAAAA TTAGGACATA TGTTGCATTT TTAA

Protein sequence

MFDMIEEAIY ELMQGKVIIV CDDEDRENEG DFVALAEKAT PEVINFMIKY GRGLVCVPIT 
EELADKLDLA PMVNHNTDSH GTAFTVSIDY KSTTTGISAY ERSMTIQALL DPNAKASDFK 
RPGHVFPLVA KKGGVLRRAG HTEAAVDLAR LCGAKPAGVI CEIIKEDGTM ARVSDLRKIA 
DEFDLKMITI KDLIEYRRRK EKLVKREVEV MLPTEFGKFK AIGYTNIVDG KEHVALVKGE 
IIPDEPTLVR VHSECLTGDV FGSCRCDCGP QLHAALRQIE EEGRGVLLYM RQEGRGIGLI 
NKLRAYKLQE QGYDTVEANE RLGFPADLRD YGIGAQILKD LGVTKMRLLT NNPRKITGLK 
GHGLEVVERV PLQMPANKEN EKYLRTKYEK LGHMLHF