Gene Mlg_2081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2081
Symbol
ID	4269400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2359476
End bp	2360357
Gene Length	882 bp
Protein Length	293 aa
Translation table	11
GC content	69%
IMG OID	638126837
Product	type 4 prepilin peptidase 1. Aspartic peptidase. MEROPS family A24A
Protein accession	YP_742913
Protein GI	114321230
COG category	[N] Cell motility [O] Posttranslational modification, protein turnover, chaperones [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1989] Type II secretory pathway, prepilin signal peptidase PulO and related peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.587572
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGGGCG AACTCAACGC CCTCCTGGCC GACAACGCCC CGCTTGCGGC GGCCCTGGCC 
CTGGTGCTGG GGCTGCTGGT CGGCAGCTTT CTCAATGTGG TCATACTGCG CCTACCGATC 
ATGATGGAGC GGGCGTGGGC ATCCGAGGTG GCGGCCAGCC GGGGTGAGGT GCACGAGGAC 
GCGCAGTCCA CCCCCTTCAA CCTGGTCACG CCCCGCTCCC ACTGCCCGCA GTGCGGGCAC 
ACCCTCTCCG CGCTGGAGAA CATCCCGGTG GTGAGCTGGT TGCTGCTGCG CGGCCGCTGC 
CGAGCCTGTG GCACCCGGAT CAGCGGCCGC TACCCGCTGG TGGAACTGAC CACCGGCCTG 
CTCTCCGCGC TGGTGGTGCT GCAACTGGGC TGGACCCCGG AGACCGCGGC CGCACTGCTG 
CTCACCTGGA CGCTGGTGGC CCTTTCCGGG ATCGACCTCG ATCACCAATT GCTGCCCGAC 
AGCCTCACCC TGCCGCTGCT CTGGGCCGGG CTGCTGGTGA ACAGCACCGG TCTGTTCGCC 
GAACTCACGG ACGCCGTCTG GGGCGCGGCC CTGGGCTATC TGGTGCTGTG GGGGGTATTC 
CATGCCTTCC GCCTGCTCAC CGGTAAGGAG GGTATGGGCT ACGGCGACTT CAAACTGCTC 
GCCGCCCTCG GCGCCTGGCT GGGCTGGCAG GCCCTGCCGT TGATCATTCT GCTCTCGTCC 
CTGGTCGGTG CTGCAGTGGG CATCGCCCTG ATAGCGCTCA AGGGCCGGGG CCGCGAGGTG 
CCCATCCCCT TCGGGCCCTA CATCGCCGCC GCCGGCTTCA TCACCCTGCT CTGGGGAGAG 
GCCCTGGTGC ACTGGTATTT CCGGGCCTCG GGGTTGGCCT GA

Protein sequence

MVGELNALLA DNAPLAAALA LVLGLLVGSF LNVVILRLPI MMERAWASEV AASRGEVHED 
AQSTPFNLVT PRSHCPQCGH TLSALENIPV VSWLLLRGRC RACGTRISGR YPLVELTTGL 
LSALVVLQLG WTPETAAALL LTWTLVALSG IDLDHQLLPD SLTLPLLWAG LLVNSTGLFA 
ELTDAVWGAA LGYLVLWGVF HAFRLLTGKE GMGYGDFKLL AALGAWLGWQ ALPLIILLSS 
LVGAAVGIAL IALKGRGREV PIPFGPYIAA AGFITLLWGE ALVHWYFRAS GLA