Gene Nmul_A0448 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0448
Symbol
ID	3785916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	497199
End bp	498200
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	54%
IMG OID	637810524
Product	cytochrome-c peroxidase
Protein accession	YP_411148
Protein GI	82701582
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATATTGC GGGCATTAAT AACGTCGCTG CTAGCTGTTG GAACGATTGT CGCTCCGCCT 
GCCCAGGCGG CTGCCGCCGA CGAACCCATA AAACCGATCG AGGCAGCCAA GCCCAAGAAT 
GAAAACAAGG TGGAACTGGG CAAAATGCTT TTTTTTGATC CCCGTCTTTC CAAATCCGGC 
TTCATCTCGT GCAACTCCTG TCACAACCTG AGTATGGGGG GATCCGACAA TCTCCCCTCA 
TCCATTGGCC ACAAATGGCA CCAGGGTCCG ATCAATTCGC CCACGGTATT GAATTCCAGC 
CTGAGTCTGG CCCAATTCTG GGACGGTCGC GCCAAGGACC TGAAAGATCA GGCGGGCGGT 
CCCATTGCCA ATCCGGGGGA AATGGCATTC AGCCATGAAT TGGCAGTGGG CGTGCTGCAA 
TCCATTCCCC AGTACAGGGC GCGCTTCAAG CAGATATACA GTTCGGACAA GGTCGATATA 
GGCATGGCAA CGGACGCGAT CGCTGCCTTC GAAGAAACAC TGGTAACGCC GGATTCCCGT 
TTCGACAAAT GGCTCAAAGG CGACAAGAAC GCCATCAACA AGACGGAACT CGAAGGGTAC 
AAACTGTTCA AGGACGCGGG CTGCACAGGT TGTCACAACG GACCGGCCGT AGGCGGGGCA 
TCGTTTCAGA AAATGGGCGT ACTTGAACCC TATAAAACCC AGAGCAAGGC TGAAGGCCGT 
TTTGCCGTAA CCGGCAAAGA GGAGGACCGC CTGTTCTTCA AAGTGCCTAC ATTGCGAAAT 
GTGGAATTGA CCTACCCCTA TTTCCATGAC GGGGCCGCGG CAACCCTGGA AGACGCGGTA 
AATACCATGG GCCGGATACA ATTGGGGCGT AATTTCACCA AGGACGAAAA TGCCAAAATC 
GTGGCATTTC TGAAGACATT GACCGGCAAA CAACCCCATC TCACCTTGCC TATTCTCCCC 
CCCTCGAGCA AGGATACACC CAAACCTCAT CCGTTCGATT GA

Protein sequence

MILRALITSL LAVGTIVAPP AQAAAADEPI KPIEAAKPKN ENKVELGKML FFDPRLSKSG 
FISCNSCHNL SMGGSDNLPS SIGHKWHQGP INSPTVLNSS LSLAQFWDGR AKDLKDQAGG 
PIANPGEMAF SHELAVGVLQ SIPQYRARFK QIYSSDKVDI GMATDAIAAF EETLVTPDSR 
FDKWLKGDKN AINKTELEGY KLFKDAGCTG CHNGPAVGGA SFQKMGVLEP YKTQSKAEGR 
FAVTGKEEDR LFFKVPTLRN VELTYPYFHD GAAATLEDAV NTMGRIQLGR NFTKDENAKI 
VAFLKTLTGK QPHLTLPILP PSSKDTPKPH PFD