Gene Mlg_0413 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0413
Symbol
ID	4269452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	462504
End bp	463862
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	71%
IMG OID	638125143
Product	microcin-processing peptidase 1
Protein accession	YP_741257
Protein GI	114319574
COG category	[R] General function prediction only
COG ID	[COG0312] Predicted Zn-dependent proteases and their inactivated homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0570132
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.116989
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAATA CCGTCACGCA CAGCAGTCGT ACCTCAGGCC TCCCCGCCAG CGCCGACATG 
GAGGCCCTCA TCCAACAGGC CCTGGACACC GCCCGCACCC TGGGCGCCAC CGGCGCCGAG 
GCCGGCCTCG CCTTCGATCT CGGCCTCTCC GTCAACGTCC GCAAGGGCGA AGTCGACACC 
TTGGAACACC ACCGGGACCG CGGCCTCAGC GTCACCGTCT ACTTCGGCCA GCGCAAGGGC 
AGCGCCAACA CCGCCGACTT CCGCCCCGAA TCCATCCGCG AGACCGTCCA GGCCGCCTGC 
GACATCGCCC GCTACACCTC CGAGGACCCC GCCCACGGCC TCGCCGACCC CGAACTCATG 
CCCCGCCAGG TCCCCGAGCT GGACCTGGAA CACCCCTGGG CCCTGAACCC GGAAGAGGCC 
ATCGACCTCG CCCGCCGCTG CGAAGCCGCC GGGCTGGCGG AAAAAGGCAT CACCAACTCC 
GAGGGCGCGG GCGTGGCCAC CCACCACACC CTCCGGGTCT ACGGCAACAG CCACGGCTTC 
CTCGGCCACT ACGCCGGCAC CCGCCACAGC ATGAACTGCG TCATGGTCGC CGGCGAGGGC 
GACCACATGC AGCGGGACTA CTGGTACACC GTCGACCGCG TCCCCGAGGC CCTGGAACGG 
GCCGAGGACG TCGGTCGCGA GGCGGCCCGG CGCACCCTGG CGCGAATGGG CGCCCGCCAA 
CTGGGCACCC GGCGGGTGCC GGTCCTGTTC GCCCCGCCCA TGGCCCGGGG ACTCATCGGC 
CACTTTATCG GCGCCATTCG CGGCGGCGCC CTCTACCGCA AGGCCTCCTT CCTGCTCGAC 
CAGTTGGGCC AGCCGGTCTT CCCGGACTTC GTGCAGATGC GGGAAGAGCC CCACCGCCCG 
CGTGGCCTGG GCAGCGTGCC CTTCGACCAT GAGGGCGTGG CCACCCGCGA GCGGACATTG 
GTGCGCGACG GCGTGCTGCA GGGCTACGTG CTGGACAGCT ACTCCGCCCG CCGCCTGGGC 
ATGCAGACCA CCGGCAACGC CGGCGGCGTG CACAACCTGG TGGTGGAACC AGGCCCCGAC 
GACCAGGCCG CCCTGCTCAA GCGCATGGGG ACCGGGCTAC TGGTCACGGA GATGATGGGG 
CAGGGGGTTA ACCCGGTCAC CGGCGACTAC TCGCGGGGGG CTACCGGCTT CTGGGTCGAG 
GATGGCGAGA TCGCCCACCC GGTGCAGGAG ATCACCGTGG CCGGCAATCT GCGGGAGATG 
TACGCCGGAC TCACCGCGGT GGGTTGCGAC GTGGACCGGC GCGGCAACAT CCACACCGGC 
TCGCTGCTGG TGGATGCGAT GACCGTCGCC GGCGAATGA

Protein sequence

MTNTVTHSSR TSGLPASADM EALIQQALDT ARTLGATGAE AGLAFDLGLS VNVRKGEVDT 
LEHHRDRGLS VTVYFGQRKG SANTADFRPE SIRETVQAAC DIARYTSEDP AHGLADPELM 
PRQVPELDLE HPWALNPEEA IDLARRCEAA GLAEKGITNS EGAGVATHHT LRVYGNSHGF 
LGHYAGTRHS MNCVMVAGEG DHMQRDYWYT VDRVPEALER AEDVGREAAR RTLARMGARQ 
LGTRRVPVLF APPMARGLIG HFIGAIRGGA LYRKASFLLD QLGQPVFPDF VQMREEPHRP 
RGLGSVPFDH EGVATRERTL VRDGVLQGYV LDSYSARRLG MQTTGNAGGV HNLVVEPGPD 
DQAALLKRMG TGLLVTEMMG QGVNPVTGDY SRGATGFWVE DGEIAHPVQE ITVAGNLREM 
YAGLTAVGCD VDRRGNIHTG SLLVDAMTVA GE