Gene Msil_2221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2221
Symbol
ID	7091343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2400882
End bp	2402501
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	68%
IMG OID	643465542
Product	Leucyl aminopeptidase
Protein accession	YP_002362517
Protein GI	217978370
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0260] Leucyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.258541
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCAT CCGTAAAAAT TCAGTTCGCG CCTTTGGACA AGCTGGCGTT GGCCGCGCCC 
GGCGCGAGCG GAGCCCCGAG CGATTCGGCC AAATCGGCGC AAACGCTGGT GATCTTCGCC 
GGGCCCGATC TGAAGCTCGG GGCGGCAACG CTGAAGCTTA TCGGCGCGGA GGCGGAGGCG 
CTGATCCGGC GCGGCGCGGC CACGGCCAAA TTCAAGGGAA AAGTCTCCTC GGCGCTGGAT 
CTGATCGCGC CGGCGGGCAT TGCCGCCGAC CGGCTGCTGG TGATCGGCGC GCCAGGCGAG 
GAGGCCGCCG AGCAGAAGAC GCCCGAGGCC GGCAAGCCTG AGGCGGCGGC TCCCGCGAAA 
CCGGCAGCCC CGCCGACCCT CTCCGATTAC GCCAACCTCG GCGGCGTCGT CGGCGGCAAG 
CTTGGACGCG GCGCCGCGGC GACGATTGTG TTCGACCTGC CGCGCGCCCC CGAGGACGCC 
GCGGCGGCGG CGGCGGAATT CGCGCTTGGC CTGCAACTGC GCGACTATCG CTTCGACCGC 
TACAAGACCA AGAAAAAGGA CGACGCCGAC GAGAATGGCG TCAGCGAGAT CGTCGTCGCG 
CTTGCCGATC CCGAGGCGGC GCGTGAAAAG GCCGCAGGCC GGGAAGCGGT CGCCGCGGGC 
GTCATCACCG CCCGTTCGCT GGTCAATGAG CCGGCCAATA TTCTCTTTCC CGAAGAATTC 
GCCGCGCGCG CCAAGGAGCT CGAAAAGCTG GGCGTCGAGG TCGAGATTCT CGACGAGCCG 
GCGATGCAGG CGCTCGGCAT GGGCGCCCTG CTCGGCGTCG GTCAGGGCTC GTCGAGGCAA 
AGCCGGGTCG TCGTCATGCG CTGGCGCGGC GCCGGCGAGG GCGGCGACTC GAAGCCGATC 
GCCTTCGTCG GCAAAGGCGT CACCTTCGAC ACCGGCGGCA TTTCGATCAA GCCGGCCGCC 
GGCATGGAGG ACATGAAGGG CGATATGGCC GGCGCCGCCT GCGTCGTCGG GCTGATCGAG 
GCGCTTGCCG CGCGCAAGGC CAAGGTCGAC GCCATCGGCG CCATTGGCCT CGTCGAGAAC 
ATGCCGGGGC CGGACGCGCA GCGTCCGGGC GACATCGTCA AATCCATGTC GGGCCAGACC 
ATCGAAATCA TCAACACCGA CGCGGAAGGG CGCCTCGTGC TTGGCGACGT GCTCTGGTAT 
GTGCAAGACC GCTTCAAGCC GAAATTTATG ATCGACCTTG CGACCTTGAC CGGCGCCGTG 
CTCGTCGCGC TCGGCCAAGA GCACGCGGGG CTCTTCACCA ATGACGACGA CCTTGGCGAA 
AAGCTCCTCG CCGCCGGCAA GGCGACCGGC GAAAAGCTCT GGCGCCTGCC GCTCGCCCCC 
GCATATGACA AGATGATCGA TTCGAAATTC GCCGACATGA AGAACACGGG CGGGCGCCAC 
GCCGGCTCGA TCACGGCGGC GCAGTTCCTG CAGCGCTTCG TCAACGGGAC GCCCTGGGCT 
CACCTCGATA TCGCCGGCAC GGGCATGAGC TCGCCGTCGA GCGACGTCAA TCAGAGCTGG 
GGCTCGGGCT TTGGCGTGCG GCTGCTCGAC CGTCTCGTCT CGGACAATTA CGAATCCTGA

Protein sequence

MPPSVKIQFA PLDKLALAAP GASGAPSDSA KSAQTLVIFA GPDLKLGAAT LKLIGAEAEA 
LIRRGAATAK FKGKVSSALD LIAPAGIAAD RLLVIGAPGE EAAEQKTPEA GKPEAAAPAK 
PAAPPTLSDY ANLGGVVGGK LGRGAAATIV FDLPRAPEDA AAAAAEFALG LQLRDYRFDR 
YKTKKKDDAD ENGVSEIVVA LADPEAAREK AAGREAVAAG VITARSLVNE PANILFPEEF 
AARAKELEKL GVEVEILDEP AMQALGMGAL LGVGQGSSRQ SRVVVMRWRG AGEGGDSKPI 
AFVGKGVTFD TGGISIKPAA GMEDMKGDMA GAACVVGLIE ALAARKAKVD AIGAIGLVEN 
MPGPDAQRPG DIVKSMSGQT IEIINTDAEG RLVLGDVLWY VQDRFKPKFM IDLATLTGAV 
LVALGQEHAG LFTNDDDLGE KLLAAGKATG EKLWRLPLAP AYDKMIDSKF ADMKNTGGRH 
AGSITAAQFL QRFVNGTPWA HLDIAGTGMS SPSSDVNQSW GSGFGVRLLD RLVSDNYES