Gene ECH74115_5568 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5568
Symbol
ID	6970265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	5206826
End bp	5208175
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	56%
IMG OID	643389207
Product	inorganic anion transporter, sulfate permease (SulP) family
Protein accession	YP_002273604
Protein GI	209398197
COG category	[R] General function prediction only
COG ID	[COG2252] Permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTACGC CATCAGCGCG TACCGGCGGT TCACTCGACG CCTGGTTTAA AATTTCACAA 
CGTGGAAGCA CTGTCCGTCA GGAAGTGGTT GCCGGGTTAA CAACGTTTCT GGCGATGGTC 
TACTCGGTTA TCGTCGTTCC AGGCATGTTG GGTAAAGCGG GCTTCCCGCC TGCGGCAGTT 
TTCGTTGCGA CCTGTCTGGT TGCCGGACTC GGTTCTATCG TGATGGGTCT GTGGGCTAAT 
CTGCCGTTGG CGATTGGTTG CGCCATCTCC CTGACGGCGT TTACCGCATT CAGCCTGGTG 
CTGGGGCAAC ATATTAGCGT ACCTGTCGCG CTGGGTGCCG TGTTCCTGAT GGGTGTGCTG 
TTTACGGTAA TTTCTGCCAC GGGTATCCGT AGCTGGATTT TGCGCAACTT GCCGCACGGT 
GTGGCGCACG GCACGGGGAT CGGTATCGGT CTGTTCCTGC TGCTCATTGC CGCTAACGGT 
GTCGGTCTGG TGATTAAAAA CCCGCTTGAT GGTCTGCCCG TTGCGCTGGG TGATTTCGCG 
ACCTTCCCGG TGATTATGTC ACTGGTAGGT CTGGCGGTGA TCATCGGCCT GGAAAAACTG 
AAAGTCCCTG GTGGCATTCT GCTGACCATT ATCGGTATCT CAATTGTCGG TTTGATCTTC 
GATCCTAACG TCCATTTCTC CGGCGTTTTC GCCATGCCTT CATTGAGCGA TGAAAACGGC 
AATTCACTGA TTGGCAGCCT GGACATTATG GGCGCGCTGA ATCCTGTAGT CCTGCCAAGC 
GTTCTGGCGC TGGTGATGAC GGCAGTATTT GATGCCACCG GAACTATCCG CGCTGTCGCC 
GGCCAGGCGA ACCTGCTGGA TAAAGATGGG CAGATCATCG ACGGCGGGAA AGCACTGACC 
ACTGACTCCA TGAGCAGCGT TTTCTCTGGC CTGGTGGGTG CAGCTCCGGC AGCGGTATAC 
ATCGAGTCTG CGGCGGGTAC GGCGGCGGGC GGTAAAACCG GTTTGACGGC TATCACCGTT 
GGCGTGCTGT TCCTGCTGAT TCTGTTCCTC TCTCCGCTTT CTTACCTCGT TCCGGGGTAT 
GCAACGGCTC CGGCGCTGAT GTACGTTGGC CTGCTGATGC TGAGCAACGT GGCGAAAATC 
GACTTTGCTG ATTTTGTTGA TGCGATGGCG GGTCTGGTTA CGGCGGTATT CATCGTGCTG 
ACCTGTAACA TCGTAACAGG CATCATGATC GGCTTCGCGA CTCTGGTGAT TGGTCGTCTG 
GTTTCCGGTG AATGGCGCAA GTTGAACATC GGTACGGTCG TTATCGCCGT GGCGCTGGTG 
ACATTCTATG CGGGTGGCTG GGCTATCTAA

Protein sequence

MSTPSARTGG SLDAWFKISQ RGSTVRQEVV AGLTTFLAMV YSVIVVPGML GKAGFPPAAV 
FVATCLVAGL GSIVMGLWAN LPLAIGCAIS LTAFTAFSLV LGQHISVPVA LGAVFLMGVL 
FTVISATGIR SWILRNLPHG VAHGTGIGIG LFLLLIAANG VGLVIKNPLD GLPVALGDFA 
TFPVIMSLVG LAVIIGLEKL KVPGGILLTI IGISIVGLIF DPNVHFSGVF AMPSLSDENG 
NSLIGSLDIM GALNPVVLPS VLALVMTAVF DATGTIRAVA GQANLLDKDG QIIDGGKALT 
TDSMSSVFSG LVGAAPAAVY IESAAGTAAG GKTGLTAITV GVLFLLILFL SPLSYLVPGY 
ATAPALMYVG LLMLSNVAKI DFADFVDAMA GLVTAVFIVL TCNIVTGIMI GFATLVIGRL 
VSGEWRKLNI GTVVIAVALV TFYAGGWAI