Gene EcolC_0041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0041
Symbol
ID	6068462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	43228
End bp	44412
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	46%
IMG OID	641599445
Product	sugar efflux transporter
Protein accession	YP_001723055
Protein GI	170018101
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00899] sugar efflux transporter

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAAA CGGCTACCAC TCCATCAAAA ATACTTGATC TCACTGCCGC GGCATTTTTA 
CTTGTCGCCT TTCTGACGGG TATTGCGGGC GCTCTTCAGA CTCCTACCCT AAGTATATTC 
CTCGCAGATG AACTGAAAGC CCGTCCTATA ATGGTAGGTT TTTTCTTCAC CGGTAGCGCT 
ATTATGGGAA TTCTGGTCAG TCAATTTCTG GCAAGGCACT CCGATAAACA AGGCGACCGT 
AAATTACTGA TTCTGCTATG TTGCTTATTT GGAGTGCTGG CCTGCACGCT TTTTGCGTGG 
AATCGCAACT ACTTCATTCT CCTCTCAACG GGCGTACTTC TGAGTAGTTT TGCTTCCACC 
GCAAACCCGC AAATGTTCGC CCTCGCCCGT GAACACGCCG ACAGAACAGG CCGTGAGACG 
GTCATGTTCA GTACATTTTT ACGTGCTCAG ATCTCGCTTG CCTGGGTTAT CGGGCCACCG 
CTCGCTTATG AACTGGCAAT GGGATTTAGT TTTAAAGTGA TGTATCTCAC CGCTGCCATC 
GCATTTGTTG TTTGCGGGCT GATAGTCTGG TTGTTTTTGC CATCAATACA AAGAAATATT 
CCTGTCGTTA CCCAACCCGT AGAAATTTTA CCCTCCACCC ACAGGAAGCG GGATACGCGG 
CTACTTTTTG TGGTCTGTTC AATGATGTGG GCGGCGAATA ATCTCTACAT GATAAATATG 
CCGCTATTTA TTATTGATGA ACTGCATCTA ACCGATAAAC TGGCTGGAGA AATGATTGGT 
ATCGCTGCCG GTCTGGAAAT TCCGATGATG TTAATCGCAG GCTATTACAT GAAACGTATT 
GGCAAGCGAC TATTAATGCT CATTGCTATC GTGAGTGGAA TGTGTTTTTA CGCCAGCGTA 
CTCATGGCGA CGACTCCGGC GGTTGAGCTG GAATTGCAAA TTCTTAATGC CATCTTCCTT 
GGTATTCTCT GTGGTATCGG CATGCTTTAT TTTCAGGACC TGATGCCTGA AAAAATAGGC 
TCTGCGACAA CGTTATATGC AAATACTTCA CGCGTCGGCT GGATTATCGC CGGCTCTGTT 
GACGGAATTA TGGTTGAAAT CTGGAGCTAC CATGCGTTGT TCTGGCTGGC GATAGGGATG 
TTGGGTATTG CGATGATTTG CCTGCTGTTT ATTAAAGATA TTTAG

Protein sequence

MQKTATTPSK ILDLTAAAFL LVAFLTGIAG ALQTPTLSIF LADELKARPI MVGFFFTGSA 
IMGILVSQFL ARHSDKQGDR KLLILLCCLF GVLACTLFAW NRNYFILLST GVLLSSFAST 
ANPQMFALAR EHADRTGRET VMFSTFLRAQ ISLAWVIGPP LAYELAMGFS FKVMYLTAAI 
AFVVCGLIVW LFLPSIQRNI PVVTQPVEIL PSTHRKRDTR LLFVVCSMMW AANNLYMINM 
PLFIIDELHL TDKLAGEMIG IAAGLEIPMM LIAGYYMKRI GKRLLMLIAI VSGMCFYASV 
LMATTPAVEL ELQILNAIFL GILCGIGMLY FQDLMPEKIG SATTLYANTS RVGWIIAGSV 
DGIMVEIWSY HALFWLAIGM LGIAMICLLF IKDI