Gene ECH74115_0967 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0967
Symbol
ID	6970213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	981316
End bp	982434
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	52%
IMG OID	643384987
Product	citrate transporter family protein
Protein accession	YP_002269487
Protein GI	209399705
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0471] Di- and tricarboxylate transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.276496
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGC CTTTTTTACG CACGCTGCAA GGCGATCGTT TTTTTCAGTT ATTAATTCTT 
GTTGGTATCG GATTAAGTTT TTTCGTGCCC TTTGCACCGA AATCCTGGCC TGCTGCTATC 
GACTGGCACA CCATCATCAC CTTAAGCGGC CTGATGCTGC TGACCAAAGG TGTGGAGTTA 
AGCGGTTATT TTGATGTGCT GGGGCGCAAA ATGGTGCGCC GCTTTGCTAC GGAGCGTCGG 
CTGGCGATGT TTATGGTGCT GGCGGCGGCG CTGCTTTCTA CCTTTCTGAC CAACGATGTC 
ACGCTGTTTA TTGTTGTTCC GCTGACTATC ACGCTAAAAA GGCTGTGTGA GATCCCGGTT 
AATCGGCTGA TTATTTTTGA GGCGCTGGCA GTCAACGCTG GTTCGCTACT GACGCCAATT 
GGCAACCCGC AAAATATTCT TATCTGGGGA CGTTCTGGTC TTTCGTTTGC CGGATTTATT 
GCCCAAATGG CACCGCTGGC TGGCGCAATG ATGCTGACGC TCCTGCTGTT GTGCTGGTGT 
TGTTTCCCTG GAAAGGCACT CCAATACCAT ACGGGGGTGC AAACACCGGA GTGGAAACCG 
CGGCTGGTGT GGAGTTGTCT GGGGCTGTAT ATCGTCTTTC TGACGGCGCT GGAGTTCAAA 
CAAGAGCTGT GGGGACTGGT GATTGTGGCG GCGGGCTTTG CGCTGCTGGC GCGTCGCGTG 
GTGTTGAGTG TGGACTGGAC GCTGCTGCTG GTGTTTATGG CGATGTTTAT CGACGTCCAT 
TTACTGACCC AGCTTCCAGC GTTGCAAGGC GTGTTGGGTA ACGTGAGTCA TTTATCTGAA 
CCCGGATTAT GGTTAACGGC AATCGGTTTA TCGCAGGTGA TCAGTAACGT GCCGAGTACT 
ATATTGTTGC TGAACTATGT GCCGCCGTCT TTATTACTGG CATGGGCGGT AAACGTAGGT 
GGCTTTGGGT TATTACCCGG ATCGCTGGCA AATTTGATTG CGCTACGTAT GGCGAACGAT 
CGCCGCATCT GGTGGCGTTT CCATCTCTAT TCAATACCGA TGCTGTTGTG GGCGGCGCTG 
GTGGGATATG TTTTGTTGGT TATGATCCCG GCCTGGTAA

Protein sequence

MSLPFLRTLQ GDRFFQLLIL VGIGLSFFVP FAPKSWPAAI DWHTIITLSG LMLLTKGVEL 
SGYFDVLGRK MVRRFATERR LAMFMVLAAA LLSTFLTNDV TLFIVVPLTI TLKRLCEIPV 
NRLIIFEALA VNAGSLLTPI GNPQNILIWG RSGLSFAGFI AQMAPLAGAM MLTLLLLCWC 
CFPGKALQYH TGVQTPEWKP RLVWSCLGLY IVFLTALEFK QELWGLVIVA AGFALLARRV 
VLSVDWTLLL VFMAMFIDVH LLTQLPALQG VLGNVSHLSE PGLWLTAIGL SQVISNVPST 
ILLLNYVPPS LLLAWAVNVG GFGLLPGSLA NLIALRMAND RRIWWRFHLY SIPMLLWAAL 
VGYVLLVMIP AW