Gene B21_01974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01974
Symbol	mdtD
ID	8114177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	2059699
End bp	2061114
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	56%
IMG OID	644848188
Product	hypothetical protein
Protein accession	YP_002999761
Protein GI	251785457
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGATC TTCCCGACAG CACCCGTTGG CAATTGTGGA TTGTGGCTTT CGGCTTCTTT 
ATGCAGTCGC TGGACACCAC CATCGTAAAC ACCGCCCTTC CCTCAATGGC GCAAAGCCTC 
GGGGAAAGTC CGTTGCATAT GCACATGGTC ATTGTCTCTT ATGTGCTGAC CGTGGCGGTG 
ATGCTGCCCG CCAGCGGCTG GCTGGCGGAC AAAGTCGGCG TGCGCAATAT TTTCTTTACC 
GCCATCGTGC TGTTTACTCT CGGTTCACTG TTTTGCGCGC TTTCCGGCAC GCTGAACGAA 
CTGTTGCTGG CACGCGCGTT ACAGGGCGTT GGCGGCGCGA TGATGGTGCC GGTCGGCAGA 
TTGACGGTGA TGAAAATCGT ACCGCGCGAG CAATATATGG CGGCGATGAC CTTTGTCACG 
TTACCCGGTC AGGTCGGTCC GCTGCTCGGT CCGGCGCTCG GCGGTCTGCT GGTGGAGTAC 
GCATCGTGGC ACTGGATCTT TTTGATCAAC ATTCCGGTGG GGATTATCGG TGCGATCGCC 
ACATTGCTGT TAATGCCAAA CTACACCATG CAGACGCGGC GCTTTGATCT CTCCGGATTT 
TTATTGCTGG CGGTTGGCAT GGCGGTATTG ACCCTGGCGC TGGACGGCAG TAAAGGTACA 
GGTTTATCGC CGCTGACGAT TGCAGGCCTG GTCGCAGTTG GCGTGGTGGC ACTGGTGCTT 
TATCTGCTGC ACGCCAGAAA TAACAACCGT GCCCTGTTCA GTCTGAAACT GTTCCGTACT 
CGTACCTTTT CGCTGGGCCT GGCGGGGAGC TTTGCCGGAC GTATTGGCAG TGGCATGTTG 
CCCTTTATGA CACCGGTTTT CCTGCAAATT GGCCTCGGTT TCTCGCCGTT TCATGCCGGA 
CTGATGATGA TCCCGATGGT GCTTGGCAGC ATGGGAATGA AGCGAATTGT GGTACAGGTG 
GTGAATCGCT TTGGTTATCG TCGGGTACTG GTAGCGACCA CGCTGGGTCT GTCGCTGGTC 
ACCCTGTTGT TTATGACTAC CGCCCTGCTG GGCTGGTACT ACGTTTTGCC GTTCGTCCTG 
TTTTTACAAG GGATGGTCAA CTCGACGCGT TTCTCCTCCA TGAACACCCT GACGCTGAAA 
GATCTCCCGG ACAATCTGGC GAGCAGCGGC AACAGCCTGC TGTCGATGAT TATGCAATTG 
TCGATGAGTA TCGGCGTCAC TATCGCCGGG CTGTTGCTGG GACTTTTTGG TTCACAGCAT 
GTCAGCGTCG ACAGCGGCAC CACACAAACC GTCTTTATGT ACACCTGGCT TAGCATGGCG 
TTGATCATCG CCCTTCCGGC GTTCATCTTT GCCAGAGTGC CGAACGATAC GCATCAAAAT 
GTAGCTATTT CGCGGCGAAA AAGGAGCGCG CAATGA

Protein sequence

MTDLPDSTRW QLWIVAFGFF MQSLDTTIVN TALPSMAQSL GESPLHMHMV IVSYVLTVAV 
MLPASGWLAD KVGVRNIFFT AIVLFTLGSL FCALSGTLNE LLLARALQGV GGAMMVPVGR 
LTVMKIVPRE QYMAAMTFVT LPGQVGPLLG PALGGLLVEY ASWHWIFLIN IPVGIIGAIA 
TLLLMPNYTM QTRRFDLSGF LLLAVGMAVL TLALDGSKGT GLSPLTIAGL VAVGVVALVL 
YLLHARNNNR ALFSLKLFRT RTFSLGLAGS FAGRIGSGML PFMTPVFLQI GLGFSPFHAG 
LMMIPMVLGS MGMKRIVVQV VNRFGYRRVL VATTLGLSLV TLLFMTTALL GWYYVLPFVL 
FLQGMVNSTR FSSMNTLTLK DLPDNLASSG NSLLSMIMQL SMSIGVTIAG LLLGLFGSQH 
VSVDSGTTQT VFMYTWLSMA LIIALPAFIF ARVPNDTHQN VAISRRKRSA Q