Gene EcolC_1048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1048
Symbol
ID	6066394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1135932
End bp	1137773
Gene Length	1842 bp
Protein Length	613 aa
Translation table	11
GC content	37%
IMG OID	641600461
Product	alpha amylase catalytic region
Protein accession	YP_001724044
Protein GI	170019090
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTTCTA TAAAACCAGG ACCCAGAAAT TTACCTATCG ACAACCCCAC ATTGTTATCA 
TGGAACATTA CTGACGGGGA TCTAAATTCC AAATTAAATA CATTAGAATA TCTAAACTGT 
ATAACAAATA TTATTAATTC TTGTGGAGTT TACCCTCAAG GATTAAAAGA CAGAGAAATT 
ATATCAACTT TTCACGCAGA AAAAGTTATT AATGATCTGT TAAAAAACGA TTATAAAATT 
TCCCTTTCTC CAGATACAAC TTATCGAGAG TTGAATAAAG CAGCACAGCG TAGCATTACA 
GCGCCAGACA GGATAGGAGA AGGAAAAACA TGGGTTTATC AACGAGATAC AATGATTGAA 
AGAGGTGATA ACAGCGGTGT TTATCAGTAT GGTCCTGCTG AACACTTCAC CCACATTATA 
TCTGACAAAC CTTCCCCAAA AGATAAATAT GTTGCATATG CTATTAACAT TCCTGACTAT 
GAGCTGGCAG CCGATGTATA TAATATTAAC GTGACGTCAC CTTCCGGACA GCAAGAAACA 
TTTAAAATAT TAATCAATCC AGAACATCTA CGGCAAACAC TTGAGCGTAA ATCTCTTACT 
GCTGTTCAGA AATCACAATG TGAAATCATC ACCCCCAAAA AACCTGGCGA AGCGATTCTT 
CATGCTTTTA ATGCCACCTA CCAGCAGATC AGAGAAAATA TGTCTGAATT TGCACGTTGC 
CATTATGGGT ATATACAAAT CCCTCCAGTG ACAACTTTCC GTGCCGACGG ACCAGAAACT 
CCCGAAGAAG AAAAAGGTTA CTGGTTTCAC GCTTATCAAC CCGAAGATCT TTGTACCATC 
CACAATCCAA TGGGAGATTT GCAGGATTTT ATCGCATTGG TTAAAGATGC TAAAAAATTT 
GGTATCGATA TCATTCCTGA TTATACCTTT AACTTTATGG GAATCGGGGG TAGTGGTAAA 
AATGACCTGG ATTATCCCTC TGCTGATATA CGAGCGAAGA TCAGTAAAGA TATAGAAAGT 
GGTATCCCTG GCTATTGGCA AGGTCAGGTT TTGATTCCAT TTACTATAGA TCCAGTAACA 
AAAGAACGTA AACAAATCCA TCCAGAAGAT ATACATCTCA CTGCAAAAGA CTTCGAAGCA 
AGTAAAGATA ACATCTCTAA GGATGAATGG GAAAACCTCC ATGCATTAAA AGAAAAGCGT 
TTAAATGGAA TGCCTAAAAC AACACCCAAA AGTGACCAGG TTATTATGTT GCAAAATCAA 
TACGTTCGTG AAATGCGAAA ATATGGCGTA CGAGGTTTAC GTTATGATGC GGCAAAACAC 
TCAAAACATG AACAAATAGA AAGATCAATA ACCCCACCGC TTAAAAATTA TAATGAGCGG 
TTACACAATA CTAACTTATT TAACCCAAAA TATCATAAAA AAGCCGTTAT GAATTACATG 
GAATATCTGG TAACTTGTCA GTTGGATGAA CAACAAATGT CATCACTGCT TTATGAAAGA 
GATGATTTAA GCGCCATTGA TTTTTCATTG CTCATGAAAA CGATAAAAGC CTTTTCATTT 
GGTGGAGATC TCCAAACCCT TGCATCAAAA CCGGGTTCCA CAATCTCAAG TATCCCATCA 
GAAAGACGGA TATTGATTAA CATTAACCAC GATTTTCCTA ACAATGGTAA TCTTTTCAAT 
GACTTTCTAT TTAACCATCA ACAAGATGAA CAATTAGCAA TGGCATATAT AGCCGCTCTG 
CCGTTCAGCA GGCCTTTAGT TTACTGGGAT GGCCAAGTAT TAAAATCAAC GACTGAAATT 
AAAAATTATG ATGGGTCCAC GCGTGTCGGC GGTGAGGCGT AG

Protein sequence

MFSIKPGPRN LPIDNPTLLS WNITDGDLNS KLNTLEYLNC ITNIINSCGV YPQGLKDREI 
ISTFHAEKVI NDLLKNDYKI SLSPDTTYRE LNKAAQRSIT APDRIGEGKT WVYQRDTMIE 
RGDNSGVYQY GPAEHFTHII SDKPSPKDKY VAYAINIPDY ELAADVYNIN VTSPSGQQET 
FKILINPEHL RQTLERKSLT AVQKSQCEII TPKKPGEAIL HAFNATYQQI RENMSEFARC 
HYGYIQIPPV TTFRADGPET PEEEKGYWFH AYQPEDLCTI HNPMGDLQDF IALVKDAKKF 
GIDIIPDYTF NFMGIGGSGK NDLDYPSADI RAKISKDIES GIPGYWQGQV LIPFTIDPVT 
KERKQIHPED IHLTAKDFEA SKDNISKDEW ENLHALKEKR LNGMPKTTPK SDQVIMLQNQ 
YVREMRKYGV RGLRYDAAKH SKHEQIERSI TPPLKNYNER LHNTNLFNPK YHKKAVMNYM 
EYLVTCQLDE QQMSSLLYER DDLSAIDFSL LMKTIKAFSF GGDLQTLASK PGSTISSIPS 
ERRILININH DFPNNGNLFN DFLFNHQQDE QLAMAYIAAL PFSRPLVYWD GQVLKSTTEI 
KNYDGSTRVG GEA