Gene B21_01971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01971
Symbol	mdtA
ID	8112764
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	2052251
End bp	2053498
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	55%
IMG OID	644848185
Product	hypothetical protein
Protein accession	YP_002999758
Protein GI	251785454
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGGCA GTTATAAATC CCGTTGGGTA ATCGTAATCG TGGTGGTTAT CGCCGCCATC 
GCCGCATTCT GGTTCTGGCA AGGCCGCAAT GACTCCCAGA GTGCAGCCCC AGGGGCGACG 
AAACAAGCGC AGCAATCGCC AGCGGGTGGT CGCCGTGGTA TGCGTTCCGG CCCATTAGCC 
CCGGTTCAGG CGGCGACCGC CGTAGAACAG GCAGTTCCGC GTTACCTCAC CGGGCTTGGC 
ACCATTACCG CTGCTAACAC CGTTACGGTG CGCAGCCGCG TAGATGGTCA GTTGATGGCG 
TTACATTTCC AGGAAGGCCA GCAGGTCAAA GCAGGCGATT TACTGGCAGA AATTGACCCC 
AGCCAGTTCA AAGTTGCATT AGCACAAGCC CAGGGCCAAC TGGCAAAAGA TAAAGCCACG 
CTTGCCAACG CCCGCCGTGA CCTGGCGCGT TATCAACAAC TGGTAAAAAC CAATCTCGTA 
TCTCGTCAGG AACTGGATGC CCAACAAGCG CTGGTCAGTG AAACCGAAGG CACCATTAAG 
GCTGATGAAG CAAGCGTCGC CAGCGCACAG CTGCAACTCG ACTGGAGCCG CATCACCGCA 
CCAGTCGATG GTCGCGTTGG TCTCAAGCAG GTTGATGTTG GTAACCAAAT CTCCAGTGGT 
GATACCACCG GAATTGTGGT GATCACCCAG ACGCATCCTA TCGATTTGCT CTTTACCCTG 
CCGGAAAGCG ATATCGCTAC CGTTGTGCAG GCGCAAAAAG CCGGAAAACC GCTGGTGGTA 
GAAGCCTGGG ATCGCACCAA CTCGAAGAAA TTAAGTGAAG GCACGCTGTT AAGTCTCGAT 
AACCAAATCG ATGCCACTAC CGGTACGATT AAAGTGAAAG CACGCTTTAA TAATCAGGAT 
GATGCGCTGT TTCCCAATCA GTTTGTTAAC GCGCGCATGT TAGTCGACAC CGAACAAAAC 
GCCGTAGTGA TCCCAACAGC CGCCCTGCAA ATGGGCAATG AAGGCCATTT TGTCTGGGTG 
CTGAATAGCG AAAACAAGGT CAGCAAACAT CTGGTGACGC CGGGCATTCA GGACAGTCAG 
AAAGTGGTGA TCCGCGCAGG TATTTCTGCG GGCGATCGCG TGGTGACAGA CGGCATTGAT 
CGCCTGACCG AAGGGGCGAA AGTGGAAGTG GTGGAAGCCC AGAGCGCCAC CACTCCGGAA 
GAGAAAGCCA CCAGCCGCGA ATACGCGAAA AAAGGAGCAC GCTCCTGA

Protein sequence

MKGSYKSRWV IVIVVVIAAI AAFWFWQGRN DSQSAAPGAT KQAQQSPAGG RRGMRSGPLA 
PVQAATAVEQ AVPRYLTGLG TITAANTVTV RSRVDGQLMA LHFQEGQQVK AGDLLAEIDP 
SQFKVALAQA QGQLAKDKAT LANARRDLAR YQQLVKTNLV SRQELDAQQA LVSETEGTIK 
ADEASVASAQ LQLDWSRITA PVDGRVGLKQ VDVGNQISSG DTTGIVVITQ THPIDLLFTL 
PESDIATVVQ AQKAGKPLVV EAWDRTNSKK LSEGTLLSLD NQIDATTGTI KVKARFNNQD 
DALFPNQFVN ARMLVDTEQN AVVIPTAALQ MGNEGHFVWV LNSENKVSKH LVTPGIQDSQ 
KVVIRAGISA GDRVVTDGID RLTEGAKVEV VEAQSATTPE EKATSREYAK KGARS