Gene ECH74115_4424 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4424
Symbol
ID	6970657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4099391
End bp	4100722
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	50%
IMG OID	643388145
Product	serine transporter family protein
Protein accession	YP_002272582
Protein GI	209397781
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0814] Amino acid permeases
TIGRFAM ID	[TIGR00814] serine transporter

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.0207469
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAATTG CATCGAATAA AGGCGTCATT GCAGACGCTT CGACCCCGGC GGGTCGTGCT 
GGAATGAGTG AGAGCGAGTG GCGAGAAGCG ATCAAATTCG ACAGTACTGA CACCGGCTGG 
GTGATTATGA GTATCGGGAT GGCGATTGGC GCGGGGATTG TTTTTCTCCC GGTGCAGGTC 
GGTTTGATGG GATTGTGGGT ATTTTTGCTC TCATCGGTGA TTGGTTACCC GGCAATGTAT 
CTGTTTCAGC GGTTGTTTAT TAATACGCTG GCAGAATCAC CAGAATGTAA AGATTACCCG 
AGCGTCATTA GCGGTTATTT AGGTAAAAAC TGGGGCATCC TGTTAGGTGC ACTCTATTTC 
GTAATGCTGG TGATTTGGAT GTTCGTCTAT TCCACCGCCA TCACCAACGA TAGTGCTTCC 
TACCTGCATA CCTTCGGCGT GACGGAAGGG TTGCTGTCAG ACAGTCCCTT TTATGGTCTG 
GTACTGATTT GCATTCTGGT GGCGATCTCT TCACGCGGCG AGAAATTGTT ATTCAAAATT 
TCGACTGGCA TGGTGCTGAC CAAGCTGCTG GTGGTCGCGG CGCTGGGCGT GTCGATGGTG 
GGAATGTGGC ATCTGTATAA CGTCGGTTCG CTACCGCCGC TGGGGCTGCT GGTGAAAAAC 
GCTATTATTA CGCTGCCGTT TACCCTGACG TCGATTCTGT TTATCCAGAC GTTAAGCCCG 
ATGGTGATCT CTTATCGCTC GCGGGAAAAA TCGATTGAAG TAGCGCGGCA TAAAGCATTG 
CGGGCAATGA ATATCGCGTT TGGCATTTTG TTTATCATCG TCTTTTTCTA CGCCGTGTCG 
TTCACGCTGG CGATGGGACA TGACGAAGCG GTAAAAGCCT ACGAGCAGAA TATTTCCGCG 
CTGGCGATTG CCGCACAGTT TATTAGCGGT GACGGCGCAG CGTGGGTGAA AGTGGTCAGC 
GTCATTCTCA ATATCTTTGC TGTCATGACT GCATTCTTTG GCGTCTATTT AGGTTTTCGC 
GAAGCAACGC AAGGGATCGT AATGAACATC CTGCGTCGCA AGATGCCTGC CGAGAAGATT 
AACGAAAATC TTGTTCAGCG CGGCATCATG ATTTTCGCCA TTTTGCTGGC CTGGAGCGCC 
ATCGTACTGA ACGCACCGGT GTTGAGCTTC ACCTCTATCT GTAGCCCGAT TTTCGGCTTG 
GTAGGGTGCC TGATCCCGGC GTGGCTGGTT TACAAAGTAC CGGCATTGCA CAAATACAAA 
GGGATGTCTC TGTACCTGAT TATCGTCACT GGTTTGTTGC TTTGTGTTTC TCCGTTCCTG 
GCATTTTCTT GA

Protein sequence

MEIASNKGVI ADASTPAGRA GMSESEWREA IKFDSTDTGW VIMSIGMAIG AGIVFLPVQV 
GLMGLWVFLL SSVIGYPAMY LFQRLFINTL AESPECKDYP SVISGYLGKN WGILLGALYF 
VMLVIWMFVY STAITNDSAS YLHTFGVTEG LLSDSPFYGL VLICILVAIS SRGEKLLFKI 
STGMVLTKLL VVAALGVSMV GMWHLYNVGS LPPLGLLVKN AIITLPFTLT SILFIQTLSP 
MVISYRSREK SIEVARHKAL RAMNIAFGIL FIIVFFYAVS FTLAMGHDEA VKAYEQNISA 
LAIAAQFISG DGAAWVKVVS VILNIFAVMT AFFGVYLGFR EATQGIVMNI LRRKMPAEKI 
NENLVQRGIM IFAILLAWSA IVLNAPVLSF TSICSPIFGL VGCLIPAWLV YKVPALHKYK 
GMSLYLIIVT GLLLCVSPFL AFS