Gene EcHS_A1424 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1424
Symbol
ID	5592337
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1417666
End bp	1419345
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	44%
IMG OID	640920579
Product	alpha amylase family protein
Protein accession	YP_001458138
Protein GI	157160820
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAGA AAATTACGGA TTACCTGGAC GAAATCTACG GTGGAACATT TACCGCAACT 
CATTTACAGA AACTTGTAAC GCGTCTTGAG AGTGCGAAAC GATTAATTAC ACAGCGACGT 
AAAAAACACT GGGATGAAAG TGATGTCGTG TTAATTACCT ATGCCGATCA ATTTCACAGC 
AATGATTTAA AACCATTACC CACATTTAAT CAGTTTTACC ATCAATGGCT GCAAAGCATT 
TTTTCACATG TTCATTTGTT GCCGTTTTAT CCATGGTCAT CTGATGATGG CTTTTCGGTA 
ATTGATTATC ATCAGGTCGC CAGTGAAGCG GGGGAGTGGC AGGATATTCA GCAACTCGGT 
GAATGCAGTC ATTTAATGTT TGATTTTGTC TGCAACCATA TGTCGGCAAA AAGTGAATGG 
TTTAAAAACT ATTTACAACA GCATCCAGGT TTTGAAGATT TTTTTATTGC CGTTGACCCG 
CAAACCGATC TCAGCGCCGT CACTCGCCCG CGTGCGTTAC CGTTATTAAC GCCATTCCAG 
ATGCGCGATC ATTCAACGCG CCATTTATGG ACCACCTTTA GTGACGATCA AATTGACCTG 
AATTACCGTA GCCCTGAAGT GTTGCTGGCG ATGGTGGATG TTTTACTCTG TTACCTTGCG 
AAAGGTGCTG AGTATGTCCG CCTGGATGCC GTTGGCTTTA TGTGGAAAGA GCCGGGAACA 
AGCTGCATCC ATCTGGAAAA AACACATCTG ATTATCAAAC TGTTACGGTC GATTATTGAT 
AACGTTGCGC CAGGTACAGT GATCATTACC GAGACCAATG TTCCGCATAA AGACAACATT 
GCTTACTTTG GCGCAGGCGA TGACGAAGCA CATATGGTGT ACCAGTTCTC GCTGCCGCCA 
CTGGTGCTGC ATGCGGTGCA AAAACAGAAC GTTGAGGCGC TTTGTGCGTG GGCGCAAAAC 
CTGACACTAC CTTCCAGCAA CACCACCTGG TTTAACTTCC TCGCCTCTCA CGATGGCATC 
GGGCTAAACC CGCTACGGGG CTTGTTGCCT GAAAGCGAAA TATTAGAGCT GGTCGAGGCG 
TTACAGCAGG AAGGTGCATT AGTAAACTGG AAAAATAATC CCGACGGTAC ACGCAGTCCG 
TATGAAATAA ATGTGACCTA TATGGATGCG TTAAGCCGCC GTGAGAGTAG CGATGAAGAA 
CGTTGCGCCA GGTTTATCCT TGCCCATGCG ATTTTGTTAA GTCTCCCCGG TGTGCCAGCG 
ATATATATTC AAAGTATTCT TGGCTCGCGT AATGATTACG CAGGTGTCGA AAAACTCGGA 
TATAACCGTG CGATTAACCG TAAAAAATAT CACAGTAAAG AGATAACCCG AGAACTGAAC 
GATGAAGCTA CATTAAGGCA TGCGGTATAT CATGAGTTGT CGCGTTTAAT TACACTTCGT 
CGCAGCCATA ACGAGTTTCA TCCGGATAAT AATTTTACCA TTGATACGAT TAATTTATCC 
GTAATGCGTA TTCAAAGAAG TAACGCTGAT GGTAATTGTC TGACTGGATT GTTTAATGTC 
AGTAAAAATA TTCAGCATGT AAATATTACT AATCTGCATG GTCGGGATCT GATTAGTGAA 
GTTGATATAT TGGGTAATGA AATAACGCTG CGCCCCTGGC AGGTTATGTG GATTAAATAA

Protein sequence

MKQKITDYLD EIYGGTFTAT HLQKLVTRLE SAKRLITQRR KKHWDESDVV LITYADQFHS 
NDLKPLPTFN QFYHQWLQSI FSHVHLLPFY PWSSDDGFSV IDYHQVASEA GEWQDIQQLG 
ECSHLMFDFV CNHMSAKSEW FKNYLQQHPG FEDFFIAVDP QTDLSAVTRP RALPLLTPFQ 
MRDHSTRHLW TTFSDDQIDL NYRSPEVLLA MVDVLLCYLA KGAEYVRLDA VGFMWKEPGT 
SCIHLEKTHL IIKLLRSIID NVAPGTVIIT ETNVPHKDNI AYFGAGDDEA HMVYQFSLPP 
LVLHAVQKQN VEALCAWAQN LTLPSSNTTW FNFLASHDGI GLNPLRGLLP ESEILELVEA 
LQQEGALVNW KNNPDGTRSP YEINVTYMDA LSRRESSDEE RCARFILAHA ILLSLPGVPA 
IYIQSILGSR NDYAGVEKLG YNRAINRKKY HSKEITRELN DEATLRHAVY HELSRLITLR 
RSHNEFHPDN NFTIDTINLS VMRIQRSNAD GNCLTGLFNV SKNIQHVNIT NLHGRDLISE 
VDILGNEITL RPWQVMWIK