Gene Mlg_2166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2166
Symbol
ID	4270945
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2461026
End bp	2462309
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	68%
IMG OID	638126922
Product	HlyD family type I secretion membrane fusion protein
Protein accession	YP_742998
Protein GI	114321315
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID	[TIGR01843] type I secretion membrane fusion protein, HlyD family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.0862799
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATGAGG GCGCGGTAAC CGGGAAACGG CCGCTCTGGC GCTGGGCCCT GGCCCGGCTC 
TGGCATGGTC CGGATCGCGC AGCCGGCGCT TCGGCACCGG CCTGGTCGGG TGGCATCGGC 
GGCTTGGAGC CGGCGGAGGA CGCAAGGGTG GCCCGGCGGA TCGGGCGTTT TATCGGTCTG 
GTGGGCCTGT TTGTGGGTGC CTTTGTCGTC TGGGCCTATT GGGCGGAACT GGCCGAGGTC 
TCCAGTGGCC AGGCGACGGT GGTACCCAGC CGCGGCACCC AGGTGATCCA GTCCCTGGAG 
GGCGGGATCC TCCAGGAGCT GCTGGTGGCC GAGGGGGAGA TGGTGGAGCC GGGGCAACCG 
CTGGCGCGCC TGGACCCGAC CCGCACCCAG GCCGACATGG ACGAGGTGAT CGCCCGCTAC 
CAGGGGGCGC TGGCGCGAAA GGCGCGGCTG GAGGCGGAAC TGGCCGGTGA GGGCGAGATC 
CGGTTTCCCG AAGAGCTGGA CCTCGCCTCG GAGGTGGTGG CCGCCGAGCG AACCCTGTTC 
GAGGCGCGCC GTGCGCATCT GGAGCGCACT GAGCAGGACA TCCGGACATC GCTGCAGCTG 
GTCGGTAACG AACGCTCGAT CACCGAGGAG CTGGTCCGTG CGGGTGCGGC GAGCGAGGTG 
GAGTTGCTGC AGCTGCGCCG CTCCGAGGCG GATTTGCGCC GGGAGTTGAA TCAATTGCGT 
AACGAGTTCC GGGTGCGCGC GCGCCAGGAC CTGGCAGAGA CCCGCACCGA GGTGGAGGCG 
TTGCGCTCCA GCCTGCGCGG TCACGAGGAC ACCCGTCAGC GCCAGACCCT GCGCTCGCCG 
GTGCGCGGCC GGGTGCAGAA CCTGGCGGTC ACCACCATCG GCGGCGTGCT GGCTCCCAAC 
GGCGAGTTGA TGGAGATCGT GCCCCAGGAC GGGGAGTTGC GGATCGAGGC CCGCATCTCG 
CCCCGGGACA TCGCCTACAT CCACCCCGGT CAGCGCGCCC AGGTGAAGAT CACGGCCTAC 
GATTACGCTA TCTACGGCGG CTTGGAGGGC GAGGTGGTGA ACATCTCACC CGATACCGAG 
CGCGACGAGA TCAACCCCGA GGAGGTCTAT TACAAGGTCT TCATTCACAC CGACAGCGAT 
GAGCTGGTGG TGGAGAACGG TCAGCGTTTC CCCATCTCCC CCGGCATGGT GGCGGAGGTG 
GATATCGAGA CCGGCCAGCG CACGGTCTTG CAGTATATTA TAAAGCCCTT TAACCGGGCG 
CGGGAGGCCT TGCGGGAGCG GTGA

Protein sequence

MHEGAVTGKR PLWRWALARL WHGPDRAAGA SAPAWSGGIG GLEPAEDARV ARRIGRFIGL 
VGLFVGAFVV WAYWAELAEV SSGQATVVPS RGTQVIQSLE GGILQELLVA EGEMVEPGQP 
LARLDPTRTQ ADMDEVIARY QGALARKARL EAELAGEGEI RFPEELDLAS EVVAAERTLF 
EARRAHLERT EQDIRTSLQL VGNERSITEE LVRAGAASEV ELLQLRRSEA DLRRELNQLR 
NEFRVRARQD LAETRTEVEA LRSSLRGHED TRQRQTLRSP VRGRVQNLAV TTIGGVLAPN 
GELMEIVPQD GELRIEARIS PRDIAYIHPG QRAQVKITAY DYAIYGGLEG EVVNISPDTE 
RDEINPEEVY YKVFIHTDSD ELVVENGQRF PISPGMVAEV DIETGQRTVL QYIIKPFNRA 
REALRER