Gene GYMC61_3041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_3041
Symbol
ID	8526926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	-
Start bp	3098118
End bp	3099416
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	55%
IMG OID
Product	homoserine dehydrogenase
Protein accession	YP_003254083
Protein GI	261420401
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAAC CAATTTTGGT CGGATTGTTA GGATTAGGAA CGGTCGGGAG CGGCGTGGTC 
AAAATTATTG AAAACCACCA AGAAAAATTG ATGCATCAGG TTGGCTGCCC GGTGAAGGTG 
AAAAAAATCC TTGTCCGGGA TGTACAGAAA CCGCGTGATG TCGCCGTTGA CCCGTCGCTC 
CTTACGACGA GTGCGGCTGA GGTGATTGAC GATCCGGACA TTGATGTCAT CATCGAAGTG 
ATGGGCGGCA TTGAGGAGAC AAAAGAGCTG CTATTGCGGG CGCTGCGCCA AGGGAAGCAT 
GTCGTGACCG CCAATAAAGA CTTAATGGCC GTCTACGGGT CGGAGCTGCT TCGGGTGGCG 
GCGGAATACC GCTGCGATTT GTTTTATGAA GCGAGCGTCG CCGGCGGCAT TCCGATTTTG 
CGCAGCTTGG TCGACGGCTT GGCGTCGGAC CGGATTACGA AGCTCATGGG CATTGTGAAT 
GGGACGACGA ACTACATTTT GACGAAAATG TCGCAAAACG GCGCTTCCTA TGAGGACGTG 
CTCGCCGAAG CGCAGGCGCT CGGGTTTGCG GAAGCCGATC CGACGTCAGA CGTCGAAGGG 
CTGGATGCGG CGCGGAAAAT GGCGATTTTG GCCCGCCTTG GCTTTTCAAT GGACATCGAC 
TTGGACGATG TGCAAGTGAA AGGCATCACC CAAGTGACGG AGGAAGACTT GAACTACGGG 
AAGCGGCTCG GCTACACGAT GAAATTGATC GGCATCGCCC AGCGCGACGG GCAGAAGGTC 
GAGGTGAGCG TCCAGCCGAC GTTTTTGCCG GATTCGCATC CGTTGGCGTC CGTGCACAAC 
GAATACAATG CGGTGTACGT ATACGGCGAA GCGGTCGGAG AGACGATGTT TTACGGGCCG 
GGGGCCGGGA GCTTGCCGAC GGCGACGGCG GTTGTCTCCG ACTTGGTCGC GGTGATGAAA 
AATATGCGCC TTGGCGTCAA CGGCCGCTAT GCCGTCGCGC CGCAATATGA AAAGCAGTTG 
AAGACGCCGG CGGAAATTTT CTCGAAATAC TTTTTGCGCA TTCACGTCAA AGACCAGGTC 
GGCGCGTTTG CCAAAATTAC GACGCTGTTT TCGCAGCGCG GGGTGAGCTT TGAGAAAATT 
TTGCAATTGC CGCTGAAAGA GGATGGCCTA GCGGAAATCG TCATCGTCAC GCATGACGCC 
TCGCAGCAAG ACTACGAAGA CATTTTGCAG CAGCTCGGCG ATTTGGAAAT CGTCGAACGG 
GTGCAAAGCT CGTATCGAGT GGAAGGAGAG AAACGGTAA

Protein sequence

MEKPILVGLL GLGTVGSGVV KIIENHQEKL MHQVGCPVKV KKILVRDVQK PRDVAVDPSL 
LTTSAAEVID DPDIDVIIEV MGGIEETKEL LLRALRQGKH VVTANKDLMA VYGSELLRVA 
AEYRCDLFYE ASVAGGIPIL RSLVDGLASD RITKLMGIVN GTTNYILTKM SQNGASYEDV 
LAEAQALGFA EADPTSDVEG LDAARKMAIL ARLGFSMDID LDDVQVKGIT QVTEEDLNYG 
KRLGYTMKLI GIAQRDGQKV EVSVQPTFLP DSHPLASVHN EYNAVYVYGE AVGETMFYGP 
GAGSLPTATA VVSDLVAVMK NMRLGVNGRY AVAPQYEKQL KTPAEIFSKY FLRIHVKDQV 
GAFAKITTLF SQRGVSFEKI LQLPLKEDGL AEIVIVTHDA SQQDYEDILQ QLGDLEIVER 
VQSSYRVEGE KR