Gene ECH74115_2702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2702
Symbol	amyA
ID	6970415
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	2536288
End bp	2537775
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	49%
IMG OID	643386563
Product	cytoplasmic alpha-amylase
Protein accession	YP_002271042
Protein GI	209398533
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.363407
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAATC CCACGCTGTT ACAATGTTTT CACTGGTATT ACCCGGAAGG CGGTAAGCTC 
TGGCCTGAAT TGGCCGAGCG CGCCGACGGT TTTAATGATA TTGGTATCAA TATGGTCTGG 
TTGCCGCCCG CCTATAAAGG CGCATCGGGC GGGTATTCGG TCGGCTACGA CTCCTATGAT 
TTATTTGATT TAGGTGAGTT TGATCAGAAA GGCAGCATCC CTACTAAATA TGGCGATAAA 
GTACAACTGC TGGCCGCCAT TGACGCCCTG AAACGTAATG ACATTGCGGT GCTGTTGGAC 
GTGGTAGTCA ACCACAAAAT GGGCGCGGAT GAAAAAGAAG CTATTCGCGT GCAGCGCGTT 
AATGCTGATG ACCGTACGCA AATTGATGAA GAAATCATTG AATGCGAAGG CTGGACGCGT 
TACACCTTCC CCGCTCGTGC CGGGCAATAC TCACAGTTTA TCTGGGATTT CAAATGTTTT 
AGCGGTATCG ACCATATCGA AAACCCCAAT GAAGATGGCA TTTTTAAAAT TGTTAACGAC 
TACACCGGCG AAGGCTGGAA CGATCAGGTT GATGATGAAC TCGGTAATTT CGATTATCTG 
ATGGGCGAGA ATATCGATTT TCGCAATCAT GCCGTGACGG AAGAGATTAA ATACTGGGCG 
CGCTGGGTGA TGGAACAAAC GCAATGCGAC GGTTTTCGTC TTGATGCGGT CAAACATATT 
CCAGCCTGGT TTTATAAAGA GTGGATCGAA CACGTACAGG AAGTTGCGCC AAAGCCGCTG 
TTTATTGTGG CGGAGTACTG GTCGCATGAA GTTGATAAGC TGCAAACGTA TATTGATCAG 
GTGGAAGGCA AAACCATGCT GTTTGATGCG CCGCTGCAGA TGAAATTCCA TGAAGCATCG 
CGCATGGGAC GCAACTACGA CATGACGCAG ATTTTCACTG GGACGCTGGT GGAAGCCGAT 
CCTTTTCACG CCGTAACCCT CGTTGCCAAC CACGACACCC AACCGTTGCA AGCCCTCGAA 
GCACCGGTCG AACCGTGGTT TAAACCGCTG GCGTATGCTC TAATTTTGTT GCGGGAAAAT 
GGCGTTCCTT CGGTGTTCTA TCCGGACCTC TACGGTGCGC ATTACGAAGA TGTCGGTGGT 
GACGGGCAAA CCTATCCGAT AGATATGCCA ATAATCGAAC AGCTTGATGA GTTAATTCTC 
GCCCGTCAGC GTTTCGCCCA CGGTGTACAG ACGTTATTTT TCGACCATCC GAACTGCATT 
GCCTTTAGCC GCAGTGGCAC CGACGAATAT CCCGGCTGCG TGGTGGTCAT GTCGAACGGA 
GATGATGGCG AAAAAACCAT TCATTTAGGA GAGAATTACG GCAATAAAAC CTGGCGTGAT 
TTTCTTGGGA ACCGGCAAGA GAGTGTAGTA ACCGACGAAA ACGGCGAAGC GACCTTCTTT 
TGCAACGGCG GCAGCGTTAG CGTGTGGGTT ATCGAAGAGG TGCTTTAA

Protein sequence

MRNPTLLQCF HWYYPEGGKL WPELAERADG FNDIGINMVW LPPAYKGASG GYSVGYDSYD 
LFDLGEFDQK GSIPTKYGDK VQLLAAIDAL KRNDIAVLLD VVVNHKMGAD EKEAIRVQRV 
NADDRTQIDE EIIECEGWTR YTFPARAGQY SQFIWDFKCF SGIDHIENPN EDGIFKIVND 
YTGEGWNDQV DDELGNFDYL MGENIDFRNH AVTEEIKYWA RWVMEQTQCD GFRLDAVKHI 
PAWFYKEWIE HVQEVAPKPL FIVAEYWSHE VDKLQTYIDQ VEGKTMLFDA PLQMKFHEAS 
RMGRNYDMTQ IFTGTLVEAD PFHAVTLVAN HDTQPLQALE APVEPWFKPL AYALILLREN 
GVPSVFYPDL YGAHYEDVGG DGQTYPIDMP IIEQLDELIL ARQRFAHGVQ TLFFDHPNCI 
AFSRSGTDEY PGCVVVMSNG DDGEKTIHLG ENYGNKTWRD FLGNRQESVV TDENGEATFF 
CNGGSVSVWV IEEVL