Gene Mlg_0439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0439
Symbol
ID	4270383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	493783
End bp	495084
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	68%
IMG OID	638125174
Product	putative aminopeptidase 2
Protein accession	YP_741283
Protein GI	114319600
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1362] Aspartyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.773817
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.534448
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAAG TACAGGATAT GCAGCAGGCG CAGGAACTAC TGGACTTCAT CGACGACAGC 
CCGAGCCCAT GGCATGCGGT CGCCAATATG GCGGAAATGC TGCAGGCGGC GGGCTTTGTC 
GAGCTGCGCG AGGATGAGCC CTGGCATCTG AATCCCGGGG ATGCGGCCTA TGTGATCCGC 
GAGGAGGCGA GCCTGGTGGC CTTCCGGGTC GGCAGCCGGG CGCCGGAGGC GGCCGGCTTT 
CGGGTGTTGG CGGCGCATAC CGATTCCCCT GGGCTGCGGG TCAAGCCGGG GGGCGCTCAC 
CGCGCCGGAC CCTTTCTGCG CCTTGGGGTG GAGGTGTATG GCGGCCCGAT CCTCGCGACC 
TTCGCCGACC GGGACCTGAC CCTGGCCGGG CGTGTGGCGG TGCGGGGCGA GGTCGGTATC 
GACTCGGTGC TTGTGGACTT TCCCGAGGCC CTGGCGCGTC TGCCCACGCC AGCGATCCAC 
CTGAATCGGG AGGTGAACGA GCAGGGCCTG AAATTCGACC GTCAGAAGGA GCTGCCGCTG 
ATCTTCAGCC TGCCGGACGA CGATGAGCCC TCACCGGAGG CGTTCCGGCA GCTGCTGGCC 
ACGCGCGCTG GCGTCGAGCT GGACGACCTG CTGGGCTGGG ATCTGGCGGT GAGCGATACC 
CAGCCGGGGG CCTTCTTCGG CGCGGACCGG GAGTTCCTGG CCGCCCCCCG AATCGATAAT 
CTCGCCTCCT GCCATGCCGC GATCAAGGCC CTGTTGGCCG TCGAGCAGCC GACGGCGACG 
GCGGTGTGTG CGCTCTTTGA CCACGAGGAG ATCGGCAGCA CCACCTATCG GGGAGCGGCC 
GGCACGTTGC TGCCCAATGT GTTGGAGCGC CTGGGCGGTG CCGGTGAAGA ATTGCACCAG 
GCCAAGGCGC GCAGTCGGCT GGTCAGCGTG GATATGGCCC ATGCCTGGCA CCCGAACTTT 
CCCCATTTCT ACGAGGACGA GCACAAGGCG CACGTCAACC ACGGACCGGT GATCAAGGTG 
AACGCCAACC AGCGCTACAC CAGTGAGTCC ACCGGCGGGG CCTGGTTCGC CGAGCTTTGC 
CGCGGGGCGG GGGTGCCCTG GCAGACCTAT GTGCACCGGA CCGATCTGCC GTGCGGGAGT 
ACGATCGGTC CGGTCACCGC GGCTCGGCTC GGGCTACCGG TGATTGATGT GGGCAACGCC 
ATCTGGTCCA TGCACAGTGC GCGCGAGAGC GCGGGGGCGA AGGACCACGC CTGGATGACG 
GGCGCCCTGT CGGCCTTCCT GGCCGTGCCA CAGTTGCCAT GA

Protein sequence

MSEVQDMQQA QELLDFIDDS PSPWHAVANM AEMLQAAGFV ELREDEPWHL NPGDAAYVIR 
EEASLVAFRV GSRAPEAAGF RVLAAHTDSP GLRVKPGGAH RAGPFLRLGV EVYGGPILAT 
FADRDLTLAG RVAVRGEVGI DSVLVDFPEA LARLPTPAIH LNREVNEQGL KFDRQKELPL 
IFSLPDDDEP SPEAFRQLLA TRAGVELDDL LGWDLAVSDT QPGAFFGADR EFLAAPRIDN 
LASCHAAIKA LLAVEQPTAT AVCALFDHEE IGSTTYRGAA GTLLPNVLER LGGAGEELHQ 
AKARSRLVSV DMAHAWHPNF PHFYEDEHKA HVNHGPVIKV NANQRYTSES TGGAWFAELC 
RGAGVPWQTY VHRTDLPCGS TIGPVTAARL GLPVIDVGNA IWSMHSARES AGAKDHAWMT 
GALSAFLAVP QLP