Gene Nmul_A0554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0554
Symbol
ID	3784737
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	640663
End bp	642036
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	58%
IMG OID	637810636
Product	peptidase M23B
Protein accession	YP_411254
Protein GI	82701688
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0864407
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGGCA ACAAGCAGAC ATGGGCGCGC AAAAAAAACA GATTACATTG GCTCCTTTAT 
GAGGGACTTG AGATAGTGAG TAACAGCCAG GCTTTTACAC TTACAAGAAA AACCCTGCGC 
GGCCTGATAC TGTTATCGAG CATTCCGTTG TTTGGAATGG TGGCAGCCTT CGGTATTGCC 
CCCGATACTG CGGTGGAAGA CGTACCGGTC GAGCAGGTTG TCCTCGGTCT GGAGATTCCG 
GAGATTCGCT CGAGGCCGGC GGAGGGGATG ACTTTTTGGC GTCATGAACG TATCCAGCAG 
GGCGATACAA TCGGGAGCCT GCTTTCCCGG CTTGAAGTGA ATAATCAGGA CGTGGCACGC 
CTCATTCGGG ATACCTCCGA GCTGAAGGCC TTGCATCCGC TGGCCGCGGG CAGAATGGTG 
CATGCCGAAA CCAGCGCCGC GGGCGAATTG CTGCTGCTGC GCTACTTCCC CGGCGGCAGC 
GATCAGGTGG TGCTGGAAAA ACGCGACGGC AGCTATGTGG TGAGCGACAG GCCGGCATTG 
CTGGAAACCC ATATCCAGAT GAAATCAGGC GTGATCGAAA GCTCGCTTTT TGCCGCGATC 
GACCGCGCGG GGATTCCGGA CAGCATAGCT TCCCAGATCG TCGATATCCT GTCTTCCCAA 
ATAGATTTCC ACCGTGATCT GCGCAAGGGT GACCGTTTTA CAGTGGTGTA CGATTCCCTC 
TACGGCAACG GGGAACCGAC GAGAGCCGGC CGGGTGCTGG CGGTGGAGTT CGTCAACCAG 
GGAGTGCCTT ACCGGGGAGT ATATTTCCCC GGAAGCGACG GTGGAGAAGG CGGCTATTAC 
ACGCCGGACG GCAAGAACCT GCGCAGGGTA TTTCTGCGCT CGCCGCTGGA ATTTTCCCGC 
ATCAGTTCCG GCTTTTCCAG CGGCCGCTTC CATCCCATCC TGAAAAAATG GCGGGCCCAT 
AAGGGCATCG ACTACGTGGC GCCCACCGGC ACGGGGGTAA AGGCGGTTGC CGATGGCGTC 
GTGGCGGTAG CGGGATGGGA AGCGGGATAT GGAAATTTCA TCATCCTCGA GCATGAAGGA 
TCGTATGCCA CGGTCTACGG CCACCTGTCG GCTTTCGCCA AAGGGTTGCG CAAGGGTCAG 
CGTGTCCGTC AGGGATATGT CATTGGCCGG GTGGGAGCCA CCGGCTTGGC GAGCGGGCCT 
CATCTGCACT TTGAGTTCCG TGTCAACGGC ATTCAACGCG ATCCTCTGAA GGAGCCGATG 
CCGGAAGGAA AACCGATCGC TCCCGCGCAC CTCGCGGCAT TTTACGAATC CACGAAATCA 
TCGATGGCGA GGCTCGATAT GCTGCACGGC ACCAATCTCG CATTGCTGGA TTAA

Protein sequence

MPGNKQTWAR KKNRLHWLLY EGLEIVSNSQ AFTLTRKTLR GLILLSSIPL FGMVAAFGIA 
PDTAVEDVPV EQVVLGLEIP EIRSRPAEGM TFWRHERIQQ GDTIGSLLSR LEVNNQDVAR 
LIRDTSELKA LHPLAAGRMV HAETSAAGEL LLLRYFPGGS DQVVLEKRDG SYVVSDRPAL 
LETHIQMKSG VIESSLFAAI DRAGIPDSIA SQIVDILSSQ IDFHRDLRKG DRFTVVYDSL 
YGNGEPTRAG RVLAVEFVNQ GVPYRGVYFP GSDGGEGGYY TPDGKNLRRV FLRSPLEFSR 
ISSGFSSGRF HPILKKWRAH KGIDYVAPTG TGVKAVADGV VAVAGWEAGY GNFIILEHEG 
SYATVYGHLS AFAKGLRKGQ RVRQGYVIGR VGATGLASGP HLHFEFRVNG IQRDPLKEPM 
PEGKPIAPAH LAAFYESTKS SMARLDMLHG TNLALLD