Gene GYMC61_2871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_2871
Symbol
ID	8526748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	-
Start bp	2930438
End bp	2932117
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	57%
IMG OID
Product	dihydroxy-acid dehydratase
Protein accession	YP_003253929
Protein GI	261420247
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGC GGCGCAGCGA CATGATCAAA AAAGGATTCG ACCGCGCCCC GCACCGGAGT 
TTGTTGCGGG CGGCCGGCGT GAAAGAGGAG GATTTTGACA AACCGTTCAT CGCGGTTGTC 
AACTCGTACA TCGACATTAT TCCGGGGCAC GTTCACTTGC AAGAGTTTGG GAGAATCGTG 
AAAGAAGCGA TTCGCGAAGC AGGCGGCGTG CCGTTTGAAA TGAACACGAT CGGCGTTGAT 
GACGGCATCG CCATGGGGCA TATCGGGATG CGCTATTCGC TTCCGAGCCG GGAAATCATC 
GCTGATTCGA TCGAAACGGT CATCTCGGCG CACTGGTTTG ACGGCATGGT ATGCATTCCG 
AACTGCGACA AAATTACGCC AGGGATGATG ATGGCGGCGA TGCGGCTCAA CATCCCGACG 
ATTTTCGTCA GCGGCGGGCC GATGAAAGCT GGTGTGACGA AAGACGGGCG GAAAATTTCG 
CTCTCGTCCG TGTTTGAAGG GGTCGGGGCG TATTTAGGCG GAACGCTCGA TGAGAAAGGG 
CTCGAAGAAC TCGAACGCTA CGGCTGTCCG ACGTGCGGAT CGTGTTCGGG CATGTTTACG 
GCCAACTCCA TGAACTGTCT CGCTGAAGCG CTCGGGCTCG CTTTGCCAGG CAACGGCACC 
ATTTTGGCGG TTGACCCAGC GCGCAAAGAG CTTGTCCGCC AATCGGCAAA GCAGCTGATG 
TATTTGATCG AACATGACAT CAAACCGCGC GACATCGTAA CGGAAAAAGC GATCGACAAC 
GCGTTCGCGC TCGATATGGC GCTCGGCGGC TCGACGAATA CGGTGCTGCA TACGCTTGCG 
ATCGCCAACG AAGCCGGCAT CGACTACTCG CTTGAGCGCA TCAACGAAAT CGCCGCGCGG 
GTGCCGCATT TGGCCAAACT CGCGCCGGCG TCGGATGTGC ATTACATTGA AGACTTGCAC 
GAAGCCGGCG GCGTCTCGGC GGTGTTGAAC GAGCTGGCGA AAAAAGAAGG CACGCTTCAT 
TTAGATACGC TGACCGTCAC CGGCAAAACA CTCGGTGAAA ACATCGCCGG CTGCGAAGTG 
AAAAACTACG ATGTCATCCG CCCGATTGAC AACCCGTATT CGGAAACGGG CGGGCTCGCC 
ATTTTGTTCG GCAACTTAGC GCCGGACGGC GCCGTCATCA AAACCGGCGC GGTCCAAGGC 
GGCATCACGC GCCATGAAGG TCCGGCGATC GTGTTTGATT CGCAGGAAGA GGCGCTTGAA 
GGCATCGCCA GCGGCAAAAT CAAGCCGGGT CATGTCGTCG TCATCCGCTA CGAAGGACCA 
AAAGGCGGCC CAGGGATGCC GGAAATGCTT GCGCCAACGT CGCAAATCGT CGGCATGGGG 
CTCGGTACGA AGGTAGCGCT TGTCACCGAT GGCCGCTTTT CCGGCGCCTC ACGCGGCTTG 
TCCGTCGGCC ACGTTTCACC GGAAGCGGCG GAAGGCGGAC CGATTGCTTT CATCCAAGAC 
GGCGATATCA TCGAGATCGA TACGGTGAAA CGAACGATCA ACGTCAAGCT GTCCGATGAA 
GAGCTCGAAC GCCGGAAAGC GAACTGGAAA GGCTTTGAAC CAAAAGTGAA AACCGGGTAT 
CTCGCCCGCT ACTCGAAACA CGTCACATCG GCGAGCACGG GGGGGATTAT GAAGATTTAG

Protein sequence

MKKRRSDMIK KGFDRAPHRS LLRAAGVKEE DFDKPFIAVV NSYIDIIPGH VHLQEFGRIV 
KEAIREAGGV PFEMNTIGVD DGIAMGHIGM RYSLPSREII ADSIETVISA HWFDGMVCIP 
NCDKITPGMM MAAMRLNIPT IFVSGGPMKA GVTKDGRKIS LSSVFEGVGA YLGGTLDEKG 
LEELERYGCP TCGSCSGMFT ANSMNCLAEA LGLALPGNGT ILAVDPARKE LVRQSAKQLM 
YLIEHDIKPR DIVTEKAIDN AFALDMALGG STNTVLHTLA IANEAGIDYS LERINEIAAR 
VPHLAKLAPA SDVHYIEDLH EAGGVSAVLN ELAKKEGTLH LDTLTVTGKT LGENIAGCEV 
KNYDVIRPID NPYSETGGLA ILFGNLAPDG AVIKTGAVQG GITRHEGPAI VFDSQEEALE 
GIASGKIKPG HVVVIRYEGP KGGPGMPEML APTSQIVGMG LGTKVALVTD GRFSGASRGL 
SVGHVSPEAA EGGPIAFIQD GDIIEIDTVK RTINVKLSDE ELERRKANWK GFEPKVKTGY 
LARYSKHVTS ASTGGIMKI