Gene ECH74115_4174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4174
Symbol
ID	6969772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3869668
End bp	3871035
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	53%
IMG OID	643387920
Product	inorganic anion transporter, sulfate permease (SulP) family
Protein accession	YP_002272359
Protein GI	209396772
COG category	[R] General function prediction only
COG ID	[COG2252] Permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	84
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGGAG ACATCCTACA AACACCGGAC GCACCAAAGC CACAGGGCGC GCTGGATAAT 
TATTTTAAAA TTACCGCTCG TGGCAGTACC GTTCGTCAGG AAGTACTGGC TGGCTTAACG 
ACCTTTCTGG CCATGGTTTA TTCCGTTATC GTCGTTCCGG GAATGCTGGG CAAAGCAGGT 
TTTCCTCCCG CAGCTGTGTT TGTTGCCACC TGTCTGGTCG CGGGCTTCGG CTCGTTGCTG 
ATGGGGTTAT GGGCTAATTT GCCAATGGCG ATTGGTTGCG CGATTTCCTT GACGGCGTTT 
ACCGCATTCA GTCTGGTACT CGGGCAACAA ATTAGCGTTC CTGTCGCACT GGGCGCGGTA 
TTTCTGATGG GCGTCATCTT CACCGCCATT TCCGTAACCG GTGTGCGTAC CTGGATCTTA 
CGTAATTTGC CGATGGGTAT CGCTCACGGT ACAGGTATCG GTATCGGGCT GTTTCTGCTG 
CTGATTGCTG CTAACGGTGT GGGTATGGTT ATCAAAAACC CGATTGAAGG CTTGCCAGTG 
GCGCTCGGTG CGTTTACCTC CTTCCCGGTG ATGATGAGCT TGCTGGGGCT GGCGGTCATC 
TTCGGTCTGG AGAAGTGTCG CGTACCCGGC GGTATCTTGT TGGTGATTAT TGCAATTTCG 
ATCATCGGCT TAATCTTTGA CCCAGCGGTG AAATACCACG GTCTGGTGGC GATGCCAAGC 
CTGACTGGCG AAGATGGTAA GTCTCTGATT TTCAGCCTCG ATATTATGGG CGCACTCCAG 
CCAACTGTAC TTCCGAGTGT ACTGGCATTG GTGATGACCG CAGTGTTCGA CGCTACTGGC 
ACCATCCGTG CCGTCGCCGG TCAGGCGAAT TTGTTGGATA AAGACAACCA GATCATCAAC 
GGCGGCAAAG CCCTGACCAG TGACTCAGTA AGTTCAATAT TCTCCGGCCT GGTGGGCGCA 
GCGCCCGCAG CGGTTTATAT CGAATCAGCG GCAGGAACCG CCGCCGGGGG TAAAACAGGG 
TTAACCGCAA CCGTAGTGGG GGCGTTATTC CTGCTGATTC TGTTCTTATC ACCGCTGTCA 
TTTTTGATCC CTGGTTACGC CACTGCACCC GCTCTGATGT ACGTAGGTTT GCTGATGTTA 
AGTAACGTCT CGAAGCTGGA TTTCAATGAT TTTATTGACG CTATGGCTGG CCTGGTGTGT 
GCCGTGTTCA TCGTTCTGAC TTGTAATATC GTTACCGGTA TTATGCTGGG CTTTGTGACA 
CTGGTCGTAG GCCGCGTCTT TGCACGCGAA TGGCAAAAGC TGAATATTGG TACGGTGATC 
ATTACTGCCG CACTGGTCGC ATTTTACGCG GGTGGTTGGG CAATCTAA

Protein sequence

MSGDILQTPD APKPQGALDN YFKITARGST VRQEVLAGLT TFLAMVYSVI VVPGMLGKAG 
FPPAAVFVAT CLVAGFGSLL MGLWANLPMA IGCAISLTAF TAFSLVLGQQ ISVPVALGAV 
FLMGVIFTAI SVTGVRTWIL RNLPMGIAHG TGIGIGLFLL LIAANGVGMV IKNPIEGLPV 
ALGAFTSFPV MMSLLGLAVI FGLEKCRVPG GILLVIIAIS IIGLIFDPAV KYHGLVAMPS 
LTGEDGKSLI FSLDIMGALQ PTVLPSVLAL VMTAVFDATG TIRAVAGQAN LLDKDNQIIN 
GGKALTSDSV SSIFSGLVGA APAAVYIESA AGTAAGGKTG LTATVVGALF LLILFLSPLS 
FLIPGYATAP ALMYVGLLML SNVSKLDFND FIDAMAGLVC AVFIVLTCNI VTGIMLGFVT 
LVVGRVFARE WQKLNIGTVI ITAALVAFYA GGWAI