Gene GYMC61_1787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_1787
Symbol
ID	8525651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	+
Start bp	1810920
End bp	1812641
Gene Length	1722 bp
Protein Length	573 aa
Translation table	11
GC content	55%
IMG OID
Product	phosphoenolpyruvate-protein phosphotransferase
Protein accession	YP_003252896
Protein GI	261419214
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAGA CGATTCATGG CATCGCCGCT TCAAGCGGCA TCGCCATCGC CAAGGCCTAC 
CGCTTAGAGA CGCCTCATTT GACGGCCGAA AAACGAACGG TCACCGATGT CGAGGCGGAA 
ATTGCGCGGC TTGAGGCGGC GGTCGCGAAA GCGAAAGAAG AGCTGGAAGC CATCAAACAG 
CATGCCTTGG AAAAGCTTGG TGAAGACAAA GCCGCCATTT TTGCCGCCCA CTTGCTTGTG 
CTTGACGACC CAGAACTGCT GAACCCAATT AAGGAAAAAA TCAAAACAGA ACAAGTGAAT 
GCGGAATATG CGCTCCATGA AACGGCATCG TTTTTCATTT CCATGTTTGA AGGCATGGAC 
AATGAGTATA TGAAAGAGCG GGCCGCCGAT ATCCGCGATG TGACAAAGCG CGTCCTCGCC 
CATCTGCTTG GCGTCACGAT CTCGAACCCG AGCCTCATTT CTGAGGAAGT CGTGATCATC 
GCTGAAGACT TGACGCCATC CGATACGGCG CAGCTGAACC GCCAATATGT GAAAGGATTT 
GCCACCGACA TCGGCGGGCG AACGTCGCAC TCGGCCATTA TGGCCCGCTC GCTCGAAATT 
CCGGCTGTCG TCGGCACGAA GGCGGTAACG GCGGAAGTAA AAAACGGCGA CATGGTCATC 
GTCGATGGGC TCGACGGTCA AGTCGTCGTC AATCCGTCCC CGGAGCTGCT TGCGCGTTAT 
GAAGAGAAGC GGGCTCGCTA TGAGGAGCAA AAAGCGGAAT GGGCGAAGCT TGTCGATCAA 
CCGACGGTCA CCGCTGATGG CGTGCACGTT GAGCTGGCGG CCAATATCGG CACGCCGGAC 
GATGTGAAAG GAGCGTTGGC CAACGGGGCA GAAGGGATCG GATTGTATCG CACGGAATTT 
TTATACATGG GACGATCGGA GCTGCCTACG GAAGACGAAC AGTTTGCGGC TTACAAAACG 
GTGCTTGAAC AAATGGGCGG CAAGCCGGTC GTTGTGCGTA CGCTTGACAT TGGCGGCGAC 
AAAGAGCTCC CGTATTTACA CTTGCCAAAA GAGATGAACC CGTTTTTAGG GTTTCGAGCC 
ATTCGGCTTT GTTTGGAAAT GCAAGACATG TTCCGCACCC AGCTGCGCGC CTTGCTGCGG 
GCGAGCGTGC ACGGCAATTT GAAAATCATG TTCCCGATGA TTGCGACGCT CGATGAATTC 
CGCCAAGCGA AAGCGATTTT GCTCGAAGAA AAAGAAGCGC TCCTCCGCCA AGGCGTCCCG 
GTCGCCGATG ACATTGAAGT CGGCATGATG GTGGAGATCC CGGCTGCCGC CGTCATGGCC 
GATCAGTTTG CCAGGGAAGT CGATTTCTTC AGCATCGGAA CGAACGACCT GATCCAATAT 
ACGATGGCGG CCGACCGGAT GAATGAGAGG GTGGCGTATC TATATCAACC GTACAACCCG 
GCTATTTTGC GGCTCATCAG CTATGTCATT GACGCCGCTC ACCGCGAAGG GAAATGGGTT 
GGGATGTGCG GGGAAATGGC CGGCGACCCG ATCGCCATTC CGATTTTGCT TGCTCTTGGC 
CTTGATGAGT TCAGCATGAG CGCCACCTCG ATTTTGCCGG CGCGCGCCCA GCTGAAGCGG 
CTGTCAAAAG AGGATGCGGT CCGCGTGAAA GAGACAGTGC TGTCGCTTGG TACGGCTGAG 
GAAGTAGTGT CGTTTGTCAA ACGAACGTTC CATATGGCTT GA

Protein sequence

MEKTIHGIAA SSGIAIAKAY RLETPHLTAE KRTVTDVEAE IARLEAAVAK AKEELEAIKQ 
HALEKLGEDK AAIFAAHLLV LDDPELLNPI KEKIKTEQVN AEYALHETAS FFISMFEGMD 
NEYMKERAAD IRDVTKRVLA HLLGVTISNP SLISEEVVII AEDLTPSDTA QLNRQYVKGF 
ATDIGGRTSH SAIMARSLEI PAVVGTKAVT AEVKNGDMVI VDGLDGQVVV NPSPELLARY 
EEKRARYEEQ KAEWAKLVDQ PTVTADGVHV ELAANIGTPD DVKGALANGA EGIGLYRTEF 
LYMGRSELPT EDEQFAAYKT VLEQMGGKPV VVRTLDIGGD KELPYLHLPK EMNPFLGFRA 
IRLCLEMQDM FRTQLRALLR ASVHGNLKIM FPMIATLDEF RQAKAILLEE KEALLRQGVP 
VADDIEVGMM VEIPAAAVMA DQFAREVDFF SIGTNDLIQY TMAADRMNER VAYLYQPYNP 
AILRLISYVI DAAHREGKWV GMCGEMAGDP IAIPILLALG LDEFSMSATS ILPARAQLKR 
LSKEDAVRVK ETVLSLGTAE EVVSFVKRTF HMA