Gene EcDH1_1980 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1980
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2137356
End bp	2138567
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	53%
IMG OID
Product	drug resistance transporter, Bcr/CflA subfamily
Protein accession	ACX39637
Protein GI	260449215
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.00451664
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACCTG GGAAAAGATT TTTAGTCTGG CTGGCGGGTT TGAGCGTACT CGGTTTTCTG 
GCAACCGATA TGTATCTGCC TGCTTTCGCC GCCATACAGG CCGACCTGCA AACGCCTGCG 
TCTGCTGTCA GTGCCAGCCT TAGTCTGTTC CTTGCCGGTT TTGCCGCAGC CCAGCTTCTG 
TGGGGGCCGC TCTCCGACCG TTATGGTCGT AAACCGGTAT TATTAATCGG CCTGACAATT 
TTTGCGTTAG GTAGTCTGGG GATGCTGTGG GTAGAAAACG CCGCTACGCT GCTGGTATTG 
CGTTTTGTAC AGGCTGTGGG TGTCTGCGCC GCGGCGGTTA TCTGGCAAGC ATTAGTGACA 
GATTATTATC CTTCACAGAA AGTTAACCGT ATTTTTGCGG CCATCATGCC GCTGGTGGGT 
CTATCTCCGG CACTGGCTCC TCTGTTAGGA AGCTGGCTGC TGGTCCATTT TTCCTGGCAG 
GCGATTTTCG CCACCCTGTT TGCCATTACC GTGGTGCTGA TTCTGCCTAT TTTCTGGCTC 
AAACCCACGA CGAAGGCCCG TAACAATAGT CAGGATGGTC TGACCTTTAC CGACCTGCTA 
CGTTCTAAAA CCTATCGCGG CAACGTGCTG ATATACGCAG CCTGTTCAGC CAGTTTTTTT 
GCATGGCTGA CCGGTTCACC GTTCATCCTT AGTGAAATGG GCTACAGCCC GGCAGTTATT 
GGTTTAAGTT ATGTCCCGCA AACTATCGCG TTTCTGATTG GTGGTTATGG CTGTCGCGCC 
GCGCTGCAGA AATGGCAAGG CAAGCAGTTA TTACCGTGGT TGCTGGTGCT GTTTGCTGTC 
AGCGTCATTG CGACCTGGGC TGCGGGCTTC ATTAGCCATG TGTCGCTGGT CGAAATCCTG 
ATCCCATTCT GTGTGATGGC GATTGCCAAT GGCGCGATCT ACCCTATTGT TGTCGCCCAG 
GCGCTGCGTC CCTTCCCACA CGCAACTGGT CGCGCCGCAG CGTTGCAGAA CACTCTTCAA 
CTGGGTCTGT GCTTCCTCGC AAGTCTGGTA GTTTCCTGGC TGATCAGTAT CAGCACGCCA 
TTGCTCACCA CCACCAGCGT GATGTTATCA ACAGTAGTGC TGGTCGCGCT GGGTTACATG 
ATGCAACGTT GTGAAGAAGT TGGCTGCCAG AATCATGGCA ATGCCGAAGT CGCTCATAGC 
GAATCACACT GA

Protein sequence

MQPGKRFLVW LAGLSVLGFL ATDMYLPAFA AIQADLQTPA SAVSASLSLF LAGFAAAQLL 
WGPLSDRYGR KPVLLIGLTI FALGSLGMLW VENAATLLVL RFVQAVGVCA AAVIWQALVT 
DYYPSQKVNR IFAAIMPLVG LSPALAPLLG SWLLVHFSWQ AIFATLFAIT VVLILPIFWL 
KPTTKARNNS QDGLTFTDLL RSKTYRGNVL IYAACSASFF AWLTGSPFIL SEMGYSPAVI 
GLSYVPQTIA FLIGGYGCRA ALQKWQGKQL LPWLLVLFAV SVIATWAAGF ISHVSLVEIL 
IPFCVMAIAN GAIYPIVVAQ ALRPFPHATG RAAALQNTLQ LGLCFLASLV VSWLISISTP 
LLTTTSVMLS TVVLVALGYM MQRCEEVGCQ NHGNAEVAHS ESH