Gene EcolC_2115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2115
Symbol
ID	6067107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2311582
End bp	2312865
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	47%
IMG OID	641601523
Product	major facilitator superfamily metabolite/H(+) symporter
Protein accession	YP_001725082
Protein GI	170020128
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00883] metabolite-proton symporter

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0135318
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTTCC AGTTATATTC GCTCGGCGCA GCGTTAGTGT TTCATGAAAT ATTTTTTCCT 
GAATCATCAA CGGCAATGGC GTTAATTCTG GCAATGGGAA CCTACGGTGC AGGTTATGTG 
GCGCGTATTG TCGGAGCATT TATTTTCGGC AAAATGGGCG ACAGAATAGG GCGTAAAAAA 
GTGCTCTTTA TTACCATCAC CATGATGGGG ATCTGTACCA CCTTAATTGG TGTGTTACCG 
ACCTATGCAC AGATTGGTGT TTTTGCCCCC ATCTTGCTGG TGACGCTGCG TATTATTCAG 
GGATTGGGTG CAGGTGCGGA AATTTCCGGT GCCGGTACGA TGCTGGCGGA ATATGCGCCA 
AAAGGTAAGC GCGGAATTAT CTCCTCATTT GTGGCTATGG GAACTAACTG CGGAACTTTA 
AGCGCAACGG CAATCTGGGC CTTTATGTTC TTCATTCTCA GTAAAGAGGA ACTGCTGGCG 
TGGGGATGGC GTATACCGTT CCTGGCGAGC GTTGTCGTGA TGGTCTTTGC TATCTGGTTG 
CGTATGAATC TGAAAGAAAG CCCGGTTTTT GAGAAGGTTA ACGACAGCAA CCAACCGACA 
GCAAAACCTG CACCTGCTGG TAGCATGTTC CAGAGCAAAT CCTTCTGGCT GGCAACAGGG 
CTGCGTTTTG GTCAGGCGGG TAACTCAGGT TTAATTCAGA CTTTCCTTGC GGGCTATTTA 
GTGCAGACGT TATTGTTTAA CAAAGCAATT CCAACAGATG CATTGATGAT CAGTTCGATT 
CTCGGCTTTA TGACCATTCC GTTCCTTGGT TGGTTATCCG ATAAAATTGG TCGCCGGATC 
CCGTATATTA TTATGAATAC CTCCGCGATT GTGCTGGCAT GGCCAATGCT TTCTATCATC 
GTAGATAAAA GCTATGCCCC GAGCACCATT ATGGTTGCAC TGATTGTGAT TCATAACTGT 
GCGGTGCTGG GATTATTTGC TCTGGAAAAT ATTACCATGG CAGAAATGTT CGGCTGTAAA 
AACCGCTTTA CCCGGATGGC TATTTCTAAA GAAATTGGTG GTCTTATCGC TTCCGGTTTT 
GGTCCTATCC TGGCGGGTAT TTTCTGCACC ATGACGGAAT CCTGGTATCC GATCGCCATT 
ATGATCATGG CATATTCAGT GATTGGTTTA ATCTCTGCGC TGAAAATGCC AGAAGTGAAA 
GACCGTGATT TAAGTGCGCT GGAAGACGCC GCGGAAGATC AACCGCGTGT TGTAAGAGCT 
GCGCAACCTT CCAGAAGTCT GTAA

Protein sequence

MDFQLYSLGA ALVFHEIFFP ESSTAMALIL AMGTYGAGYV ARIVGAFIFG KMGDRIGRKK 
VLFITITMMG ICTTLIGVLP TYAQIGVFAP ILLVTLRIIQ GLGAGAEISG AGTMLAEYAP 
KGKRGIISSF VAMGTNCGTL SATAIWAFMF FILSKEELLA WGWRIPFLAS VVVMVFAIWL 
RMNLKESPVF EKVNDSNQPT AKPAPAGSMF QSKSFWLATG LRFGQAGNSG LIQTFLAGYL 
VQTLLFNKAI PTDALMISSI LGFMTIPFLG WLSDKIGRRI PYIIMNTSAI VLAWPMLSII 
VDKSYAPSTI MVALIVIHNC AVLGLFALEN ITMAEMFGCK NRFTRMAISK EIGGLIASGF 
GPILAGIFCT MTESWYPIAI MIMAYSVIGL ISALKMPEVK DRDLSALEDA AEDQPRVVRA 
AQPSRSL