Gene Mlg_2146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2146
Symbol
ID	4269886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2441193
End bp	2442446
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	70%
IMG OID	638126902
Product	RND family efflux transporter MFP subunit
Protein accession	YP_742978
Protein GI	114321295
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0449485
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.0115764
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAAT CGCAACAACC CGATGGCGAA GACCGCTTGC AATCCCTCCA GCGTTCGCTG 
GATAACGCAC TGGCACGTTG GCACGGGCTC AGCTTCCGGC GGCGGACCGC GATTGTCGCG 
GCCGTGCTGT TCGGCGGATT GCTCCTTGCC CTGCTGACCA GCGGCGGGCG ATCACTGCCG 
GACGGCGTGG CGGCGGCCCC TATCGAACCG CGGCCCCTCA ATATGGAGGT GCGCGCCCAG 
GGCACCCTGC GCGCCCACCG GCAGATGAAC GTCTACCCCC GGGTGGCGGG CACCGTGGTC 
GACATCGCCG CGGAGGCCGC GGAGGCCAAC GGCCGGGTGA GCCGGGGCGA GGCCATCGTC 
ACCCTGGACG ACGAGGACAT CCGCATTGAG GTGGAGGACG CGGAGGCCGC GCTCTGGGGG 
GCCAAGGCCG AGCTGGCCTC GGCGCTAGGG CGGTACCAGC GCGCCATCCA ACAGCGGGAC 
CGGGCCGAGC GGCTGTATCG GGAGGATCTG ATCCCCAGGG ACGAACGCGA CCAGGAGCGG 
GCCCACTACG AGGACATGCG GGCTGCCCTG GAAACCGCCC GTGCCCATGT CCGCCAGGCA 
GAGATCCGCC TGGAGCAGGC ACGGGACAAC CTGCAGCACA CCGAGGTCCG CAGCCCCATC 
GACGGCCGCG TGCTCAATAT CGCCGCCGAA CTGGGCGACC GGGTCGCCCC CGGCGGCCAG 
ACACCGGTGT TCACCGTGGC GGCCGGCCTC GAGCCGATGG AGCTCCGGCT CGAGGTCAAC 
GAAGCCGACA TCGGCAAGAT CCGAGCCGGG CAGCGCATCC GTTTCAACGT GGAGGCCTAC 
CGCCAGGAGG ACTTCCATGC CGAGGTCCGG CGCGTCCTGC CGGGCGGTTA CGAGCGCCGC 
GGGGTCCAGG TCTACGAGGT GCGGGCCGAC GCCGAAAATC CGCACCACCG CCTGATGCCG 
GGCATGAGTG TGCAGGCACG CATCCATATC GAACAAACCG AGCCCCGCCC GGCCATCCCT 
CTGCGGGCCC TGGTCTTTGA GCCGGAATCC GAACGCCTCC TGGACCCGCA CCGGGACACC 
CTCCGCGCCT TGCGGGATGA GGGCCGGAGC ATCATCTGGA TCCAGGACCG GTCCGGGGAG 
ATTCGCCCGG CGGGCGTCGA ACTGGGCGAG CAGGACGACG AGTATGCGGT CCTGCGGGAT 
ACCCCCTGGT CCGACGACGA CGCTGACGGT ATTCGAGTCC TCTTCTACGA GTGA

Protein sequence

MSQSQQPDGE DRLQSLQRSL DNALARWHGL SFRRRTAIVA AVLFGGLLLA LLTSGGRSLP 
DGVAAAPIEP RPLNMEVRAQ GTLRAHRQMN VYPRVAGTVV DIAAEAAEAN GRVSRGEAIV 
TLDDEDIRIE VEDAEAALWG AKAELASALG RYQRAIQQRD RAERLYREDL IPRDERDQER 
AHYEDMRAAL ETARAHVRQA EIRLEQARDN LQHTEVRSPI DGRVLNIAAE LGDRVAPGGQ 
TPVFTVAAGL EPMELRLEVN EADIGKIRAG QRIRFNVEAY RQEDFHAEVR RVLPGGYERR 
GVQVYEVRAD AENPHHRLMP GMSVQARIHI EQTEPRPAIP LRALVFEPES ERLLDPHRDT 
LRALRDEGRS IIWIQDRSGE IRPAGVELGE QDDEYAVLRD TPWSDDDADG IRVLFYE