Gene Mlg_0653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0653
Symbol
ID	4268265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	711031
End bp	712260
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	74%
IMG OID	638125402
Product	RND family efflux transporter MFP subunit
Protein accession	YP_741497
Protein GI	114319814
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.356164
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.176029
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCCG CCCTGATAAA GGCCCTACGC TGGTGGCTGC CCGCGTTGCT TATCACCGCC 
CTCGGGCTCT ACGCCCTGCA CCTCACCGGC CCCGACGGCG CCGGCCCCGG TCTGACCGGC 
GAGCGTGCGG CGCAACCGGT GGCAGTCGAG ACCGCCCCGC TGACCCGCGG CCCGCTGGAG 
GATGTGCGCC GTTTCACCGG CAGCCTGGAG GCGGCTAATC AGTTCGACCT GGCGGCGCGC 
ACCGGCGGCC GGCTGCGCCA ATTGCGAGTG GACATCGGCG ATACGGTGGA GCACGGCGAA 
CTCATCGCCC GTCTGGACAG CGAGGAGCAG GAACAGGCCG TGGCCGAGGC CCTGGCCGCC 
CGTGACGTGG CCCGGGCCCA GCTCGCCGAG ACCCGCGCCG CGCTGGCCTC CGCGCGCAAG 
GAGCTGGACC GTACCCGCGC CCTGCGCGAG CGTCAGGTGG CCTCCCAGGC GGAGCTGGAG 
GCCGCCGAGG CGCGGGTGGC CGCCGAGCAG AGCCGCGAGC AACTGGCCCG GGCCCAGATT 
GCCCAGCGGG AGGCCGCCCT GGCCGCCGCC CGGGTACGCC TGTCCTGGAC CGAGATCCGC 
GCCGACTGGG AGGGCGGCGG CGAGACCCGG GTGGTGGGCG AGCGCTATCG GGACGAGGGC 
GCCGCGCTGA ACGCCGGCGA CCCGGTGGTC TCGCTGATGG ACACCCGCAC CCTGCGCGCC 
GTGGGCTTCG TCACCGAACG GGACTACGCC CACCTGAACC CCGGCCAGGC CGCCCGTCTC 
CGGGTGGACA CCCATCCCGG CGAGGACTTC CCCGCCACCG TCCACCGGCT GGCACCGCGC 
TTCAGTCCCG GCAGCCGCCA GGCCCGGCTG GAGCTGACCG TCCCCAACCC GGAGGGCCGG 
CTGCAGCCCG GACTCTTCGC CCGTCTCCAC ATCACCGTCG GCGAGACCCG GGACGCCCTC 
TGGGTGCCCC GCGACGCCTT GGTGCGACGT GGCGATGAGG TGGGTATCTT CCTGGTGGAT 
GAGGATGTGG GCGACGACCA GCCGCCGCGG GCCCGTTACC ACACCGTCAC CACCGGGGTG 
CGGGACGGCG ACCGGGTACA GATCCTCAGC CCGGCGTTGC AGGGCAATGT GGTCACCCTC 
GGCCAGCACC TGATCCGGGA CGGCAGCCCG CTGCGGCCGG AACGGCTGAC CGATGCGCTG 
GCCCGCCAGG ACGAGGAGCA GGAAGGGTGA

Protein sequence

MKSALIKALR WWLPALLITA LGLYALHLTG PDGAGPGLTG ERAAQPVAVE TAPLTRGPLE 
DVRRFTGSLE AANQFDLAAR TGGRLRQLRV DIGDTVEHGE LIARLDSEEQ EQAVAEALAA 
RDVARAQLAE TRAALASARK ELDRTRALRE RQVASQAELE AAEARVAAEQ SREQLARAQI 
AQREAALAAA RVRLSWTEIR ADWEGGGETR VVGERYRDEG AALNAGDPVV SLMDTRTLRA 
VGFVTERDYA HLNPGQAARL RVDTHPGEDF PATVHRLAPR FSPGSRQARL ELTVPNPEGR 
LQPGLFARLH ITVGETRDAL WVPRDALVRR GDEVGIFLVD EDVGDDQPPR ARYHTVTTGV 
RDGDRVQILS PALQGNVVTL GQHLIRDGSP LRPERLTDAL ARQDEEQEG