Gene EcolC_2825 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2825
Symbol
ID	6064698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3091635
End bp	3092753
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	52%
IMG OID	641602231
Product	citrate transporter
Protein accession	YP_001725780
Protein GI	170020826
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0471] Di- and tricarboxylate transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGC CTTTTTTACG CACGCTGCAA GGCGATCGTT TTTTTCAGTT ATTAATTCTT 
GTTGGTATCG GATTAAGCTT TTTCGTGCCC TTTGCACCGA AATCCTGGCC TGCTGCTATC 
GACTGGCACA CCATCATCAC CTTAAGCGGC CTGATGCTGC TGACCAAAGG TGTGGAGTTA 
AGCGGTTATT TTGATGTGCT GGGGCGCAAA ATGGTGCGCC GCTTTGCTAC GGAGCGTCGG 
CTGGCGATGT TTATGGTGCT GGCGGCGGCG CTGCTTTCTA CCTTTCTGAC CAACGATGTC 
GCGCTGTTTA TTGTTGTTCC GCTGACTATC ACGCTAAAAA GACTGTGTGA GATCCCGGTT 
AATCGGCTGA TTATTTTTGA GGCGCTGGCA GTCAACGCTG GTTCGCTACT GACGCCAATT 
GGCAACCCGC AAAATATTCT TATCTGGGGA CGTTCTGGTC TTTCGTTTGC CGGATTTATT 
GCCCAAATGG CACCGCTGGC TGGCGCAATG ATGCTGACGC TCCTGCTCCT GTGCTGGTGT 
TGTTTCCCTG GAAAGGCGCT GCAATACCAT ACGGGGGTGC AAACACCGGA GTGGAAACCG 
CGGCTGGTGT GGAGTTGTCT GGGGCTGTAT ATCGTCTTTC TGACGGCGCT GGAGTTCAAA 
CAAGAGCTGT GGGGACTGGT GATTGTGGCG GCAGGCTTTG CGCTGCTGGC ACGTCGCGTG 
GTGCTCAGTG TGGACTGGAC GCTGCTGCTG GTGTTTATGG CGATGTTTAT CGACGTCCAT 
TTACTGACCC AGCTTCCAGC GTTGCAAGGC GTGTTGGGTA ACGTGAGTCA TCTATCTGAA 
CCCGGGTTAT GGTTAACGGC AATCGGTTTA TCGCAGGTGA TCAGTAACGT GCCGAGTACC 
ATATTGTTGC TGAACTATGT GCCGCCGTCT TTATTACTGG TATGGGCGGT AAACGTAGGT 
GGCTTTGGGT TATTACCCGG ATCGCTGGCA AATTTGATTG CGCTACGTAT GGCGAACGAT 
CGCCGCATCT GGTGGCGTTT CCATCTCTAT TCAATACCGA TGCTGTTGTG GGCGGCGTTG 
GTGGGATATG TTTTGTTAGT TATACTCCCG GCCAACTAG

Protein sequence

MSLPFLRTLQ GDRFFQLLIL VGIGLSFFVP FAPKSWPAAI DWHTIITLSG LMLLTKGVEL 
SGYFDVLGRK MVRRFATERR LAMFMVLAAA LLSTFLTNDV ALFIVVPLTI TLKRLCEIPV 
NRLIIFEALA VNAGSLLTPI GNPQNILIWG RSGLSFAGFI AQMAPLAGAM MLTLLLLCWC 
CFPGKALQYH TGVQTPEWKP RLVWSCLGLY IVFLTALEFK QELWGLVIVA AGFALLARRV 
VLSVDWTLLL VFMAMFIDVH LLTQLPALQG VLGNVSHLSE PGLWLTAIGL SQVISNVPST 
ILLLNYVPPS LLLVWAVNVG GFGLLPGSLA NLIALRMAND RRIWWRFHLY SIPMLLWAAL 
VGYVLLVILP AN