Gene Namu_3898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3898
Symbol
ID	8449517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4298061
End bp	4299389
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	72%
IMG OID	645042944
Product	Peptidase M23
Protein accession	YP_003203180
Protein GI	258654024
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.0247447
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0868297
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCTCC TGCCGCGACG CCTGCTGCTC GCGCTGTCCG CCGCCGCGTC CGTCGCGCTG 
GTGGCCGGTT GCACCTCCGG GACCGAATCC GGTTCCGGCT CCAGTCACGA CGAGGGCGGC 
TCGGCCGCCG CCACGGCCAC ATCGTTGACG ACATCTTCGG CGGCGCCGGT GGTCTCGCCG 
GCGGAGGCCG AGCTGACCCC GGTGGTCGGC ACCGTGACCA CCGAACCGGC TCCGGTGATG 
GGCAGCGACG GCAACGTGTA CCTGGCCTAC GAGCTGTCGA TCGTGAACGC CGCCGGGGCC 
CCCGTGGTGA TCAAGGGCGT GCGCGTGCGC GACGCCGACA CCGGTGAGGT GGTCCAGGAA 
CGCTCCGGCG CCGCACTGCT GTCGACGTTC AAGGCGACCG GCGCCGGGGC CGCCACGACG 
GCGCCGACCG AGGCCACCCT CAACGGTGGG CAACACGGGT TCATCTGGCT CTCGCCCTCT 
TTCGACCCGA CCCAGGCGGT GCCGCACGCC CTGGTGCACG AGCTCGAGCT CAGCTACGCC 
AACCCGCCGA ACGCGTTGAT CGCCCCCTCG TCCACCGAGA CCATCGCGCC GACCCCGGTG 
CGGTCCAAGC CGGCTCCGGT GATCGCCCCG CCGCTGCAGG GCGACAACTG GTTCGACGGC 
AACGGATGCT GCGACGAGGT GACCCCGCAC CGCGGGGCGG CCAACCCGGT CGACGGGCAG 
TTCTACTTCG CCGAGCGGTT CGGCGTCGAC TGGGTGCAGC TGGACGCGCA GGGCCGGTTG 
CTCGTCGGCG ATCCGACCTC CCTGTCCAGT TACCCGTACT ACGGCGCCCC GATCACCGCG 
GTGGCCGACG GCGAGATCGT GGCCGTGCAC GACGGCGAGG TGACGCAGAC GCCGGGTTCG 
TCACCGGCGG TGGGATCGCT GCAGGTGACC CAGTACGGCG GCAACTACGT GGTGCAGCGC 
TTCACCCAGG GCGGCGAGAT CTACTACGCC TTCTACGCGC ACCTGGAACC GGGCAGCATG 
GACGCCTTGC AGGTCGGCCA GCAGGTCGCC ACCGGCGGTG CGATCGGCAA GCTGGGCAAC 
ACCGGCAACA CCGACTCCCC GCACCTGCAC TTCCACGTGA TGGACGGCCC GGATCCGTTG 
GCCAGCAACG GGTTGCCGTA CCGGTTCAGC TCGTTCCAGC TGGTCGGCCG GGCCACCGGC 
GACGATGCGC TGCTGCCGCT GTTCACCGGC GGCGCGCTGA CCCTGGCGCC CGGCGCGGCG 
TCCGGGCCGC GCACCGACGA TCTGCCGCTG TACCTTGATC TGGTCGACTT CCCGGCCCCG 
ACCGGCTGA

Protein sequence

MSLLPRRLLL ALSAAASVAL VAGCTSGTES GSGSSHDEGG SAAATATSLT TSSAAPVVSP 
AEAELTPVVG TVTTEPAPVM GSDGNVYLAY ELSIVNAAGA PVVIKGVRVR DADTGEVVQE 
RSGAALLSTF KATGAGAATT APTEATLNGG QHGFIWLSPS FDPTQAVPHA LVHELELSYA 
NPPNALIAPS STETIAPTPV RSKPAPVIAP PLQGDNWFDG NGCCDEVTPH RGAANPVDGQ 
FYFAERFGVD WVQLDAQGRL LVGDPTSLSS YPYYGAPITA VADGEIVAVH DGEVTQTPGS 
SPAVGSLQVT QYGGNYVVQR FTQGGEIYYA FYAHLEPGSM DALQVGQQVA TGGAIGKLGN 
TGNTDSPHLH FHVMDGPDPL ASNGLPYRFS SFQLVGRATG DDALLPLFTG GALTLAPGAA 
SGPRTDDLPL YLDLVDFPAP TG