Gene ECH74115_5030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5030
Symbol
ID	6967930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4682198
End bp	4683580
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	50%
IMG OID	643388711
Product	putative transporter
Protein accession	YP_002273138
Protein GI	209400014
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID	[TIGR00792] sugar (Glycoside-Pentoside-Hexuronide) transporter

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAGTG AAGTGTTGTC CGTTAAAGAG AAAATTGGTT ATGGCATGGG AGACGCCGCC 
AGCCACATTA TTTTCGATAA CGTAATGTTA TATATGATGT TCTTTTATAC CGATAATTTT 
GGCATACCTG CCGGATTTGT CGGAACCATG TTTTTGGTCG CTCGTGCACT GGATGCGATT 
TCCGATCCTT GCATGGGGTT GTTGGCCGAT CGAACGCGCT CTCGCTGGGG TAAATTTCGT 
CCGTGGGTAC TGTGTGGCGC ACTGCCATTT GGGATCGTCT GTGTACTGGC CTATAGCACG 
CCAGATCTCA GTATGAACGG CAAAATGATC TATGCAGCAA TTACTTACAC CCTACTTACC 
TTACTTTATA CCGTCGTCAA TATCCCTTAC TGCGCATTGG GTGGTGTAAT CACCAATGAC 
CCGACTCAGC GTATCTCGCT GCAATCCTGG CGTTTTGTGC TGGCGACCGC GGGAGGCATG 
CTCTCTACTG TTCTGATGAT GCCACTGGTT AATTTAATTG GCGGTGATAA TAAACCACTC 
GGTTTCCAGG GCGGTATCGC GGTCCTTTCC GTGGTGGCAT TCATGATGCT GGCATTCTGT 
TTCTTCACCA CTAAAGAACG CGTTGAAGCA CCACCTACAA CGACGTCTAT GCGGGAAGAT 
TTACGTGATA TCTGGCAAAA CGACCAGTGG CGGATTGTCG GTTTACTAAC CATTTTCAAT 
ATCCTGGCGG TGTGCGTCCG CGGTGGAGCG ATGATGTATT ACGTCACATG GATTTTGGGT 
ACGCCGGAAG TGTTTGTCGC TTTTCTCACC ACTTATTGCG TGGGTAACCT GATTGGTTCC 
GCACTGGCAA AACCGCTGAC CGACTGGAAA TGTAAAGTCA CTATCTTCTG GTGGACGAAC 
GCCCTGCTGG CAGTGATTAG CCTCGCGATG TTCTTTGTTC CTATGCAGGC CAGCATCACT 
ATGTTTGTCT TCATCTTCGT GATTGGTGTA TTGCATCAAC TGGTGACACC TATCCAGTGG 
GTAATGATGT CCGATACCGT CGACTACGGC GAGTGGTGCA ATGGTAAACG CCTGACCGGG 
ATCAGTTTTG CTGGCACGCT GTTTGTGCTC AAACTGGGGT TGGCCTTCGG CGGCGCTCTT 
ATCGGCTGGA TGCTGGCTTA TGGCGGATAT GATGCGGCAG AAAAAGCGCA GAACAGCGCC 
ACGATTAGCA TCATTATTGC GCTATTCACG ATTGTTCCGG CGATCTGTTA TTTGCTGAGC 
GCGATTATCG CTAAACGCTA CTACTCACTC ACGACGCACA ATCTGAAAAC CGTTATGGAA 
CAGCTGGCCC AGGGCAAACG CCGTTGCCAG CAACAATTCA CCTCTCAAGA AGTGCAGAAC 
TAA

Protein sequence

MKSEVLSVKE KIGYGMGDAA SHIIFDNVML YMMFFYTDNF GIPAGFVGTM FLVARALDAI 
SDPCMGLLAD RTRSRWGKFR PWVLCGALPF GIVCVLAYST PDLSMNGKMI YAAITYTLLT 
LLYTVVNIPY CALGGVITND PTQRISLQSW RFVLATAGGM LSTVLMMPLV NLIGGDNKPL 
GFQGGIAVLS VVAFMMLAFC FFTTKERVEA PPTTTSMRED LRDIWQNDQW RIVGLLTIFN 
ILAVCVRGGA MMYYVTWILG TPEVFVAFLT TYCVGNLIGS ALAKPLTDWK CKVTIFWWTN 
ALLAVISLAM FFVPMQASIT MFVFIFVIGV LHQLVTPIQW VMMSDTVDYG EWCNGKRLTG 
ISFAGTLFVL KLGLAFGGAL IGWMLAYGGY DAAEKAQNSA TISIIIALFT IVPAICYLLS 
AIIAKRYYSL TTHNLKTVME QLAQGKRRCQ QQFTSQEVQN