Gene ECH74115_0874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0874
Symbol
ID	6972120
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	889121
End bp	890554
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	50%
IMG OID	643384899
Product	anion transporter
Protein accession	YP_002269399
Protein GI	209397894
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0471] Di- and tricarboxylate transporters
TIGRFAM ID	[TIGR00785] anion transporter

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAGA AATCGTTATG GAAGCTAATT CTGATATTAG CGATCCCATG TATTATTGGC 
TTTATGCCAG CTCCGGCAGG ATTAAGCGAA CTGGCGTGGG TGCTTTTTGG TATTTACCTG 
GCGGCCATTG TGGGGCTGGT TATCAAGCCT TTCCCGGAAC CTGTCGTACT GTTAATTGCC 
GTTGCTGCCT CCATGGTGGT GGTCGGTAAC TTATCCGACG GTGCGTTTAA GACCACCGCC 
GTATTAAGCG GTTACTCTTC AGGTACTACC TGGCTGGTGT TCTCGGCGTT TACCTTAAGC 
GCCGCATTTG TGACCACCGG TTTAGGTAAA CGTATTGCCT ATCTGCTGAT TGGTAAAATC 
GGTAACACCA CGCTGGGTCT GGGTTACGTT ACGGTATTCC TCGATCTGGT ATTGGCTCCG 
GCAACACCGT CTAACACCGC GCGTGCGGGC GGCATTGTGT TACCGATCAT CAACAGCGTG 
GCGGTGGCTT TGGGGTCCGA ACCGGAAAAA AGTCCGCGTC GTGTCGGACA TTACCTGATG 
ATGTCCATTT ACATGGTCAC CAAAACCACC AGCTATATGT TCTTTACCGC AATGGCGGGG 
AACATTCTGG CGCTGAAAAT GATCAACGAC ATTCTGCACC TGCAAATTAG CTGGGGTGGA 
TGGGCGCTGG CCGCCGGATT GCCGGGCATC ATTATGCTGC TGGTCACCCC GCTGGTGATT 
TACACCATGT ATCCACCAGA AATTAAGAAG GTGGATAACA AAACCATCGC TAAAGCGGGC 
CTTGCCGAAC TGGGACCGAT GAAAATCCGC GAAAAAATGC TGCTCGGTGT CTTTGTGCTG 
GCGCTGCTGG GCTGGATTTT CAGTAAGTCT CTGGGGGTTG ATGAATCTTC AGTGGCTATT 
GTTGTTATGG CGACCATGCT GCTGCTGGGT ATCGTTACCT GGGAAGACGT GGTTAAAAAT 
AAAGGCGGCT GGAATACCTT AATCTGGTAC GGCGGTATTA TCGGCTTAAG CTCCTTATTA 
TCGAAAGTTA AATTTTTCGA ATGGTTAGCT GAAGTCTTTA AAAATAACCT GGCATTTGAT 
GGTCACGGTA ACGTTGCTTT CTTCGTTATT ATTTTCCTCA GCATCATCGT GCGTTATTTC 
TTCGCTTCCG GTAGTGCCTA TATCGTTGCT ATGTTACCGG TATTTGCCAT GCTGGCGAAC 
GTCTCCGGCG CACCGTTAAT GTTAACCGCG CTGGCACTGT TGTTCTCCAA CTCCTATGGC 
GGCATGGTTA CTCACTATGG CGGCGCGGCA GGTCCGGTCA TCTTTGGCGT GGGTTATAAC 
GATATTAAAT CCTGGTGGTT GGTCGGTGCG GTACTGACGA TATTAACCTT CCTGGTGCAT 
ATCACCCTCG GCGTGTGGTG GTGGAATATG CTGATCGGCT GGAACATGCT GTAA

Protein sequence

MNKKSLWKLI LILAIPCIIG FMPAPAGLSE LAWVLFGIYL AAIVGLVIKP FPEPVVLLIA 
VAASMVVVGN LSDGAFKTTA VLSGYSSGTT WLVFSAFTLS AAFVTTGLGK RIAYLLIGKI 
GNTTLGLGYV TVFLDLVLAP ATPSNTARAG GIVLPIINSV AVALGSEPEK SPRRVGHYLM 
MSIYMVTKTT SYMFFTAMAG NILALKMIND ILHLQISWGG WALAAGLPGI IMLLVTPLVI 
YTMYPPEIKK VDNKTIAKAG LAELGPMKIR EKMLLGVFVL ALLGWIFSKS LGVDESSVAI 
VVMATMLLLG IVTWEDVVKN KGGWNTLIWY GGIIGLSSLL SKVKFFEWLA EVFKNNLAFD 
GHGNVAFFVI IFLSIIVRYF FASGSAYIVA MLPVFAMLAN VSGAPLMLTA LALLFSNSYG 
GMVTHYGGAA GPVIFGVGYN DIKSWWLVGA VLTILTFLVH ITLGVWWWNM LIGWNML