Gene Nmul_A2537 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2537
Symbol
ID	3784042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2904338
End bp	2905846
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	56%
IMG OID	637812628
Product	peptidase M48, Ste24p
Protein accession	YP_413218
Protein GI	82703652
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.606815
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTGC GCCACATATT GCTTTTTTTG CCGGCACTAT TCACGGCGAA TGCCCATGCC 
GAAGGCCTGC CGGACCTGGG CGATGTATCT CAAGCAACCA TATCTCCAAG AGAAGAGCGG 
GAGCTTGGGC TGAAAATAAT GTCCGAGATC CGTTCGGACC CCAGCTACCT GAACGACGCG 
GAAATTGACG CCTACCTCAC CCGTCTCGGC AGTCGTCTGA TTTCAGGTTC CACTGAGGCG 
CGCCCCGAAC AGGAGTTCGA GTTTTTTGCC CTCCAGGACC CGGCTCTCAA TGCATTTGCA 
TTACCGGGAG GTTTCATGGG ATTCAATAGC GGCCTGATTC TCGCGGCGCA GTCGGAATCC 
GAATTGGCAG GAGTGATGGC ACACGAAATC GCGCATGTCA CGCAGAAGCA TCTCGCGCGC 
ATGATCGCCG GGCAAAAGTA CAGCATGCTG ACTTCCCTCG CCTCGATGGC GGTAGCTATC 
CTGGCTTCTC GCGCCAATCC CCAGGCGGGG CAGGCTATTC TCGTGGCCTC GCAGGCAGGG 
CAGATTCAGA AACAATTGAA CTTCACCCGA GAGCATGAAA AAGAGGCGGA TAGAATCGGC 
CTCGGTATAT TGACCGGGGC GGGACTTGAT CCACGGGGTA TGGCCGATTT TTTCGAGCGC 
ATGCAGAGAG CAACCCGCTT TCTTGAAAAC GGCGCCCCTT CATATCTGCG CACTCATCCC 
GTTACATTCG AACGCATCGC TGATATCGAA GGCCGCACGC AGAGCTTGCC CTACCGACAG 
GTACCGGACA GTCTGGATTT CCAGTTGGTG AGGGCCAAAT TACGGGCCTC CATAGAGAAA 
CCCGCCGATG CCGTTAACTA TTTCGAATCG ATTCTGCGTG AAAAACGATA CACCAATGAG 
ACGGTGGAAC GGTATGGACT CGTAACAGCC CTGCTGCGGA GCAGAGAGTA CCAACGCGCA 
GACAAGGAAC TGCTGCGCCT GTATGACAGC CTGCAGCCCG AGGGCGCAGG GACCCTCCAG 
AATCATCGAC TCGGAGCTTC CATTCGGATT CAGCGCAGCA TGCCCCCCTC CAGTCCCATG 
GTGGAAACCC TGGCGGCCCG TGTCAAACTC GCCGCCGGGC AGACCGCCGA AGCCTTGGAT 
ATCTATCAAG CCGCGCTAGC GATATTCCCG CAGCACCGCG CGTTAATCTA CGATTACATC 
GAGGCGCTTC TGAGCAAAGT CAGTGCGCAG GATGCGCTCG ACTTCATCAA CCGGCAATTA 
CAGTTCGACC CGAATGACGT GCGCCTCTAT AGATTGCAGG CGCAAAGCCA TGAAGCCCTG 
GGAAACGCTC TGTTGCAACA TCAGGCGCTG GCCGAAGTGT ATTCCCGCCA GGGTAATTAC 
CCTGCAGCAA TCGAGCAGTT GCAGATCGCG CTTAAAACAG ATGAGGGCGA CTTCTACCAG 
ATGTCGAGCG TGGAAGCACG TCTCCGGGAA TTGCGGGAAC TGGCTGCCAA CGAATCCAAA 
AAAAAATAG

Protein sequence

MKLRHILLFL PALFTANAHA EGLPDLGDVS QATISPREER ELGLKIMSEI RSDPSYLNDA 
EIDAYLTRLG SRLISGSTEA RPEQEFEFFA LQDPALNAFA LPGGFMGFNS GLILAAQSES 
ELAGVMAHEI AHVTQKHLAR MIAGQKYSML TSLASMAVAI LASRANPQAG QAILVASQAG 
QIQKQLNFTR EHEKEADRIG LGILTGAGLD PRGMADFFER MQRATRFLEN GAPSYLRTHP 
VTFERIADIE GRTQSLPYRQ VPDSLDFQLV RAKLRASIEK PADAVNYFES ILREKRYTNE 
TVERYGLVTA LLRSREYQRA DKELLRLYDS LQPEGAGTLQ NHRLGASIRI QRSMPPSSPM 
VETLAARVKL AAGQTAEALD IYQAALAIFP QHRALIYDYI EALLSKVSAQ DALDFINRQL 
QFDPNDVRLY RLQAQSHEAL GNALLQHQAL AEVYSRQGNY PAAIEQLQIA LKTDEGDFYQ 
MSSVEARLRE LRELAANESK KK