Gene EcolC_1969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1969
Symbol
ID	6068231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2175569
End bp	2176780
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	53%
IMG OID	641601383
Product	inner membrane transport protein YdhC
Protein accession	YP_001724942
Protein GI	170019988
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00710] drug resistance transporter, Bcr/CflA subfamily [TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000225757
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAACCTG GGAAAAGATT TTTAGTCTGG CTGGCGGGTT TGAGCGTACT CGGTTTTCTG 
GCAACCGATA TGTATCTGCC TGCTTTCGCC GCCATACAGG CCGACCTGCA AACGCCTGCG 
TCTGCTGTCA GTGCCAGCCT TAGTCTGTTC CTTGCCGGTT TTGCCGCAGC CCAGCTTCTG 
TGGGGGCCAC TCTCCGACCG TTATGGTCGT AAACCGGTGT TATTAATCGG CCTGACAATT 
TTTGCGTTAG GTAGTCTGGG GATGCTGTGG GTAGAAAACG CCGCCACGCT GCTGGTATTG 
CGTTTTGTAC AGGCTGTGGG GGTCTGCGCC GCGGCGGTTA TCTGGCAAGC ATTAGTGACA 
GATTATTATC CTTCACAGAA AGTCAACCGT ATTTTTGCGA CCATCATGCC GCTGGTGGGT 
CTGTCTCCGG CACTTGCTCC CCTGTTAGGA AGCTGGCTGC TGGTCCATTT TTCCTGGCAG 
GCGATTTTCG CCACCCTGTT TGCCATTACC GTGGTGCTGA TTCTGCCTAT TTTCTGGCTC 
AAACCCACGA CGAAGGCCCG TAACAATAGT CAGGATGGTC TGACCTTTAC CGACCTGCTA 
CGTTCTAAAA CCTATCGCGG CAACGTGCTG ATATATGCGG CCTGTTCAGC CAGTTTTTTT 
GCATGGCTGA CCGGTTCACC GTTCATCCTT AGTGAAATGG GCTACAGCCC GGCAGTTATT 
GGTTTAAGTT ATGTCCCGCA AACTATCGCG TTTCTGATTG GTGGTTATGG CTGTCGCGCC 
GCACTGCAGA AATGGCAAGG CAAGCAGTTA TTACCGTGGT TGCTGGTGCT GTTTGCTGTC 
AGCGTCATTG CGACCTGGGC TGCAGGCTTC ATTAGCCATG TGTCGCTGGT CGAAATCCTG 
ATCCCATTCT GTGTGATGGC GATTGCCAAT GGCGCGATCT ACCCTATTGT TGTCGCCCAG 
GCGCTGCGTC CCTTCCCACA CGCAACTGGT CGCGCCGCAG CTTTGCAGAA CACTCTACAA 
CTGGGTCTGT GCTTCCTCGC AAGTCTGGTA GTTTCCTGGC TGATCAGTAT CAGCACGCCA 
TTGCTCACCA CCACCAGCGT GATGTTATCA ACAGTAGTGC TGGTCGCGCT GGGTTACATG 
ATGCAACGTT GTGAAGAAGT TGGCTGCCAG AATCATGGCA ATGCCGAAGT CGCTCATAGC 
GAATCACACT GA

Protein sequence

MQPGKRFLVW LAGLSVLGFL ATDMYLPAFA AIQADLQTPA SAVSASLSLF LAGFAAAQLL 
WGPLSDRYGR KPVLLIGLTI FALGSLGMLW VENAATLLVL RFVQAVGVCA AAVIWQALVT 
DYYPSQKVNR IFATIMPLVG LSPALAPLLG SWLLVHFSWQ AIFATLFAIT VVLILPIFWL 
KPTTKARNNS QDGLTFTDLL RSKTYRGNVL IYAACSASFF AWLTGSPFIL SEMGYSPAVI 
GLSYVPQTIA FLIGGYGCRA ALQKWQGKQL LPWLLVLFAV SVIATWAAGF ISHVSLVEIL 
IPFCVMAIAN GAIYPIVVAQ ALRPFPHATG RAAALQNTLQ LGLCFLASLV VSWLISISTP 
LLTTTSVMLS TVVLVALGYM MQRCEEVGCQ NHGNAEVAHS ESH