Gene EcolC_2892 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2892
Symbol
ID	6065341
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3152247
End bp	3153680
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	50%
IMG OID	641602297
Product	anion transporter
Protein accession	YP_001725846
Protein GI	170020892
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0471] Di- and tricarboxylate transporters
TIGRFAM ID	[TIGR00785] anion transporter

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.151263
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAGA AATCGTTATG GAAGCTAATT CTGATATTAG CGATCCCATG TATTATTGGC 
TTTATGCCAG CTCCGGCAGG ATTAAGCGAA CTGGCGTGGG TGCTTTTTGG TATTTACCTG 
GCGGCCATTG TGGGGCTGGT TATCAAGCCT TTCCCGGAAC CTGTCGTACT GTTAATTGCC 
GTTGCTGCCT CAATGGTGGT GGTCGGTAAC TTATCCGACG GTGCGTTTAA AACCACCGCC 
GTATTAAGCG GTTACTCTTC AGGTACCACC TGGCTGGTGT TCTCGGCGTT TACCTTAAGC 
GCCGCATTTG TGACCACCGG TTTAGGTAAA CGTATTGCCT ATCTGCTGAT TGGTAAAATC 
GGTAACACCA CGCTGGGTCT GGGTTACGTT ACGGTATTCC TCGATCTGGT ACTGGCTCCG 
GCAACACCGT CTAACACCGC GCGTGCGGGC GGCATTGTGT TACCGATCAT CAACAGCGTG 
GCGGTGGCTT TGGGGTCCGA ACCGGAAAAA AGTCCGCGTC GTGTCGGACA TTACCTGATG 
ATGTCCATTT ACATGGTCAC CAAAACCACC AGCTATATGT TCTTTACCGC AATGGCGGGG 
AACATTCTGG CGCTGAAAAT GATCAACGAC ATTCTGCACC TGCAAATTAG CTGGGGTGGA 
TGGGCGCTGG CAGCCGGATT GCCGGGCATC ATTATGCTGC TGGTCACCCC GCTGGTGATT 
TACACCATGT ATCCACCAGA AATTAAGAAG GTGGATAACA AAACCATCGC TAAAGCGGGC 
CTTGCCGAAC TAGGACCGAT GAAAATCCGC GAAAAAATGC TGCTCGGTGT CTTTGTGCTG 
GCGCTGCTGG GCTGGATTTT CAGTAAGTCT CTGGGGGTTG ATGAATCCAC CGTGGCAATC 
GTTGTTATGG CAACCATGCT GCTGCTGGGT ATCGTTACCT GGGAAGACGT GGTTAAAAAT 
AAAGGCGGCT GGAATACCTT AATCTGGTAC GGCGGTATTA TCGGCTTAAG CTCCTTATTA 
TCGAAAGTTA AATTCTTCGA ATGGTTAGCT GAAGTCTTTA AAAATAACCT GGCATTTGAT 
GGTCACGGTA ACGTTGCTTT CTTCGTTATT ATTTTCCTCA GCATTATCGT GCGTTATTTC 
TTCGCTTCCG GTAGTGCCTA TATCGTTGCT ATGTTACCGG TATTTGCCAT GCTGGCGAAC 
GTCTCCGGCG CACCGTTAAT GTTAACCGCG CTGGCACTGT TGTTCTCCAA CTCCTATGGC 
GGCATGGTTA CTCACTATGG CGGCGCGGCA GGTCCGGTCA TCTTTGGCGT GGGTTATAAC 
GATATTAAAT CCTGGTGGTT GGTCGGTGCG GTACTGACGA TATTAACCTT CCTGGTGCAT 
ATCACCCTCG GCGTGTGGTG GTGGAATATG CTGATCGGCT GGAACATGCT GTAA

Protein sequence

MNKKSLWKLI LILAIPCIIG FMPAPAGLSE LAWVLFGIYL AAIVGLVIKP FPEPVVLLIA 
VAASMVVVGN LSDGAFKTTA VLSGYSSGTT WLVFSAFTLS AAFVTTGLGK RIAYLLIGKI 
GNTTLGLGYV TVFLDLVLAP ATPSNTARAG GIVLPIINSV AVALGSEPEK SPRRVGHYLM 
MSIYMVTKTT SYMFFTAMAG NILALKMIND ILHLQISWGG WALAAGLPGI IMLLVTPLVI 
YTMYPPEIKK VDNKTIAKAG LAELGPMKIR EKMLLGVFVL ALLGWIFSKS LGVDESTVAI 
VVMATMLLLG IVTWEDVVKN KGGWNTLIWY GGIIGLSSLL SKVKFFEWLA EVFKNNLAFD 
GHGNVAFFVI IFLSIIVRYF FASGSAYIVA MLPVFAMLAN VSGAPLMLTA LALLFSNSYG 
GMVTHYGGAA GPVIFGVGYN DIKSWWLVGA VLTILTFLVH ITLGVWWWNM LIGWNML