Gene EcSMS35_1254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1254
Symbol	amyA
ID	6142793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1251734
End bp	1253221
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	50%
IMG OID	641616132
Product	cytoplasmic alpha-amylase
Protein accession	YP_001743315
Protein GI	170679614
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.345137
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAATC CCACGCTGTT ACAATGTTTT CACTGGTATT ACCCGGAAGG CGGTAAGCTC 
TGGCCTGAAC TGGCCGAGCG CGCCGACGGT TTTAATGATA TTGGTATCAA TATGGTCTGG 
TTGCCGCCCG CCTATAAAGG CGCATCGGGC GGGTATTCGG TCGGCTACGA CTCCTATGAT 
TTATTTGATT TAGGCGAGTT TGATCAGAAA GGCAGCATCC CTACTAAATA TGGCGATAAA 
GCACAACTGC TGGCCGCCAT TGACGCCCTG AAACGTAATG ACATTGCGGT GCTGTTGGAC 
GTGGTAGTCA ACCACAAAAT GGGCGCGGAT GAAAAAGAAG CTATTCGCGT GCAGCGTGTA 
AATGCTGACG ACCGTACGCA AATTGATGAA GAAATCATTG AGTGCGAAGG CTGGACGCGT 
TACACCTTCC CCGCCCGTGC CGGGCAATAC TCACAGTTTA TCTGGGATTT CAAATGTTTT 
AGCGGTATCG ACCATATCGA AAACCCTGAT GAAGATGGCA TATTTAAAAT TGTTAACGAC 
TACACCGGCG AAGGCTGGAA CGATCAGGTT GATGATGAAT TAGGTAATTT CGATTATCTG 
ATGGGCGAGA ATATCGATTT TCGCAATCAT GCCGTGACGG AAGAGATTAA ATACTGGGCG 
CGCTGGGTGA TGGAACAAAC GCAATGCGAC GGTTTTCGTC TTGATGCGGT CAAACATATT 
CCGGCGTGGT TTTATAAAGA GTGGATCGAA CACGTACAGG AAGTTGCGCC AAAGCCGCTG 
TTTATTGTGG CGGAGTACTG GTCGCATGAA GTTGATAAGC TGCAAACGTA TATTGATCAG 
GTGGAAGGCA AAACCATGCT GTTCGATGCG CCGCTGCAGA TGAAATTCCA TGAAGCATCG 
CGCATGGGAC GCGACTACGA CATGACGCAG ATTTTCACTG GGACGCTGGT GGAAGCCGAT 
CCTTTTCACG CCGTAACCCT CGTTGCCAAC CATGACACCC AACCGTTGCA AGCCCTCGAA 
GCGCCAGTCG AACCGTGGTT TAAACCGCTG GCGTATGCTC TAATTTTGTT GCGGGAAAAT 
GGCGTTCCTT CGGTATTCTA TCCGGACCTC TACGGTGCGC ATTACGAAGA TGTCGGTGGT 
GACGGGCAAA CCTATCCGAT AGATATGCCA ATAATCGAAC AGCTTGATGA GTTAATTCTC 
GCCCGTCAGC GTTTCGCCCA CGGTGTACAG ACGTTATTTT TCGACCATCC GAACTGCATT 
GCCTTTAGCC GCAGTGGCAC TGACGAATAT CCCGGCTGCG TGGTGGTCAT GTCGAACGGG 
GATGATGGCG AAAAAACCAT TCACCTGGGA GAGAATTACG GCAATAAAAC CTGGCGTGAT 
TTTCTTGGGA ACCGGCAAGA GAGTGTAGTA ACCGACGAAA ACGGCGAAGC GACCTTCTTT 
TGCAACGGCG GCAGCGTTAG CGTGTGGGTT ATCGAAGAGG TGATTTAA

Protein sequence

MRNPTLLQCF HWYYPEGGKL WPELAERADG FNDIGINMVW LPPAYKGASG GYSVGYDSYD 
LFDLGEFDQK GSIPTKYGDK AQLLAAIDAL KRNDIAVLLD VVVNHKMGAD EKEAIRVQRV 
NADDRTQIDE EIIECEGWTR YTFPARAGQY SQFIWDFKCF SGIDHIENPD EDGIFKIVND 
YTGEGWNDQV DDELGNFDYL MGENIDFRNH AVTEEIKYWA RWVMEQTQCD GFRLDAVKHI 
PAWFYKEWIE HVQEVAPKPL FIVAEYWSHE VDKLQTYIDQ VEGKTMLFDA PLQMKFHEAS 
RMGRDYDMTQ IFTGTLVEAD PFHAVTLVAN HDTQPLQALE APVEPWFKPL AYALILLREN 
GVPSVFYPDL YGAHYEDVGG DGQTYPIDMP IIEQLDELIL ARQRFAHGVQ TLFFDHPNCI 
AFSRSGTDEY PGCVVVMSNG DDGEKTIHLG ENYGNKTWRD FLGNRQESVV TDENGEATFF 
CNGGSVSVWV IEEVI