Gene EcolC_0941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0941
Symbol
ID	6068413
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1025529
End bp	1026866
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	53%
IMG OID	641600349
Product	major facilitator transporter
Protein accession	YP_001723937
Protein GI	170018983
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACTT CACCGGTGCG AATGGATGAT TTACCGCTTA ACCGTTTTCA CTGCCGCATT 
GCTGCGCTCA CTTTCGGCGC ACACCTGACC GACGGTTATG TTCTCGGCGT CATTGGTTAC 
GCCATTATTC AGCTTACGCC CGCCATGCAA CTGACGCCGT TTATGGCGGG AATGATCGGC 
GGCTCGGCGC TCCTTGGTTT GTTCCTTGGC AGCCTGGTTC TTGGGTGGAT CTCCGACCAT 
ATTGGTCGGC AAAAAATCTT CACCTTCAGC TTTTTGCTGA TTACGCTTGC TTCGTTTTTA 
CAATTTTTTG CCACCACGCC AGAGCATCTT ATTGGACTGC GCATTTTGAT TGGCATTGGT 
CTGGGAGGCG ATTATTCAGT AGGTCACACC TTGCTGGCTG AATTTTCCCC GCGCCGCCAT 
CGCGGTATTT TGCTGGGCGC ATTCAGCGTG GTGTGGACCG TAGGCTATGT GCTGGCAAGT 
ATTGCCGGAC ATCACTTTAT TTCCGAAAAC CCGGAGGCCT GGCGCTGGCT ACTGGCATCG 
GCAGCTCTGC CCGCGTTGTT GATTACGTTA TTACGCTGGG GAACGCCAGA ATCACCACGC 
TGGCTACTGC GCCAGGGGCG TTTTGCAGAA GCTCACGCTA TCGTGCATCG CTATTTTGGT 
CCCCATGTTT TACTGGGCGA TGAAGTGGTA ACGGCGACCC ATAAACACAT CAAAACCTTG 
TTCTCTTCGC GTTACTGGCG GCGCACGGCG TTTAACAGCG TCTTCTTTGT CTGCCTCGTA 
ATCCCATGGT TTGTGATTTA TACCTGGCTG CCAACTATCG CCCAGACTAT TGGTCTGGAA 
GATGCGCTGA CTGCCAGCCT GATGCTTAAT GCGTTGTTAA TTGTGGGCGC GCTGCTGGGA 
TTAGTTCTGA CGCACCTGCT GGCACATCGC AAATTTTTGC TGGGAAGTTT TTTGCTGCTG 
GCGGCAACGC TGGTAGTAAT GGCCTGTTTG CCTTCCGGCA GTTCATTAAC GCTGCTGCTT 
TTTGTTCTCT TCAGCACCAC CATTTCGGCA GTCAGTAATC TGGTGGGCAT TTTGCCTGCG 
GAAAGTTTTC CTACTGACAT TCGCTCGCTG GGCGTCGGTT TTGCCACCGC CATGAGTCGA 
CTTGGCGCGG CGGTAAGTAC TGGCCTGCTG CCGTGGGTGC TGGCGCAGTG GGGAATGCAA 
GTCACCTTAT TGCTCCTGGC GACAGTGTTG TTGGTTGGTT TTGTTGTGAC CTGGCTATGG 
GCACCAGAAA CTAAAGCCCT CCCGCTGGTG GCGGCGGGAA ATGTAGGAGG TGCGAATGAA 
CATTCTGTTA GCGTTTAA

Protein sequence

MNTSPVRMDD LPLNRFHCRI AALTFGAHLT DGYVLGVIGY AIIQLTPAMQ LTPFMAGMIG 
GSALLGLFLG SLVLGWISDH IGRQKIFTFS FLLITLASFL QFFATTPEHL IGLRILIGIG 
LGGDYSVGHT LLAEFSPRRH RGILLGAFSV VWTVGYVLAS IAGHHFISEN PEAWRWLLAS 
AALPALLITL LRWGTPESPR WLLRQGRFAE AHAIVHRYFG PHVLLGDEVV TATHKHIKTL 
FSSRYWRRTA FNSVFFVCLV IPWFVIYTWL PTIAQTIGLE DALTASLMLN ALLIVGALLG 
LVLTHLLAHR KFLLGSFLLL AATLVVMACL PSGSSLTLLL FVLFSTTISA VSNLVGILPA 
ESFPTDIRSL GVGFATAMSR LGAAVSTGLL PWVLAQWGMQ VTLLLLATVL LVGFVVTWLW 
APETKALPLV AAGNVGGANE HSVSV