Gene B21_03538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03538
Symbol	mdtL
ID	8112816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	3778489
End bp	3779664
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	53%
IMG OID	644849708
Product	hypothetical protein
Protein accession	YP_003001281
Protein GI	251786977
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCGCT TTTTGATTTG TAGTTTTGCC CTGGTTTTAC TTTATCCCGC CGGGATTGAT 
ATGTACCTCG TTGGTTTACC GCGCATCGCC GCCGATCTCA ATGCCAGCGA AGCGCAGTTG 
CATATTGCGT TCTCCGTATA TCTGGCGGGG ATGGCAGCTG CGATGTTATT TGCCGGTAAA 
GTGGCCGATC GTTCAGGGAG AAAGCCGGTC GCCATACCCG GCGCGGCGCT ATTTATTATT 
GCCTCGGTGT TCTGTTCACT GGCTGAAACC AGCACGTTAT TTCTTGCAGG CCGATTTCTA 
CAGGGGTTGG GCGCAGGCTG TTGTTACGTA GTGGCGTTCG CCATTTTGCG CGACACGCTG 
GATGATCGAC GTCGGGCTAA AGTGCTGTCA TTACTCAACG GTATTACCTG CATCATTCCG 
GTGTTAGCGC CAGTGCTCGG ACATCTGATT ATGCTTAAAT TCCCGTGGCA GAGTCTGTTC 
TGGGCGATGG CAATGATGGG CATCGCGGTA CTGATGTTGT CTTTGTTTAT TTTAAAAGAA 
ACGCGCCCAG CGTCCCCCGC TGCTTCGGAC AAACCACGAG AAAATAGCGA GTCGCTGCTT 
AATCGGTTTT TCCTCAGCCG TGTTGTTATC ACCACCCTCA GCGTTTCGGT GATCCTCACT 
TTCGTCAATA CATCGCCGGT ATTGCTGATG GAAATCATGG GTTTTGAGCG CGGAGAATAC 
GCCACCATTA TGGCGTTGAC TGCTGGCGTC AGCATGACCG TTTCATTCTC CACGCCATTT 
GCGCTGGGAA TTTTTAAGCC ACGTACGTTG ATGATCACCT CGCAGGTGTT ATTCCTTGCA 
GCGGGGATCA CCCTTGCCGT TTCACCTTCC CATGCGGTTT CTCTGTTTGG TATCACGCTG 
ATTTGCGCCG GTTTCTCGGT AGGTTTTGGC GTAGCGATGA GTCAGGCGTT AGGACCATTT 
TCATTACGCG CGGGCGTAGC CAGCTCGACC TTAGGTATTG CGCAGGTTTG CGGTTCGTCA 
CTGTGGATTT GGCTGGCAGC GGTGGTTGGT ATCGGCGCAT GGAATATGCT GATCGGGATT 
CTGATTGCCT GTAGCATAGT GAGCCTGTTG CTGATTATGT TCGTCGCGCC TGGACGCCCC 
GTTGCCGCTC ATGAAGAAAT CCATCACCAC GCTTGA

Protein sequence

MSRFLICSFA LVLLYPAGID MYLVGLPRIA ADLNASEAQL HIAFSVYLAG MAAAMLFAGK 
VADRSGRKPV AIPGAALFII ASVFCSLAET STLFLAGRFL QGLGAGCCYV VAFAILRDTL 
DDRRRAKVLS LLNGITCIIP VLAPVLGHLI MLKFPWQSLF WAMAMMGIAV LMLSLFILKE 
TRPASPAASD KPRENSESLL NRFFLSRVVI TTLSVSVILT FVNTSPVLLM EIMGFERGEY 
ATIMALTAGV SMTVSFSTPF ALGIFKPRTL MITSQVLFLA AGITLAVSPS HAVSLFGITL 
ICAGFSVGFG VAMSQALGPF SLRAGVASST LGIAQVCGSS LWIWLAAVVG IGAWNMLIGI 
LIACSIVSLL LIMFVAPGRP VAAHEEIHHH A