Gene Nmul_A2280 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2280
Symbol
ID	3785442
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2592670
End bp	2593959
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	57%
IMG OID	637812368
Product	cytochrome c, class I
Protein accession	YP_412964
Protein GI	82703398
COG category	[C] Energy production and conversion
COG ID	[COG2010] Cytochrome c, mono- and diheme variants
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATACG GCTTCGTCAC AATCCTGATC GCCGGGTTTA CCGGCCTGAG CATTTTGCTG 
GTCCCCCCCG TTACGCTGTC ACCCGCAGCT GAAAAGCCGG AGGTAGCGGG GATACGCGAT 
ACTGCCGAAA TCGAGGCGCA ACGAGCACGC GGTGCTTATC TGGCCCGCAT TGGGAACTGT 
CTAGGTTGTC ACACGGCCTA TAGCGGACTC CCATACGCTG GAGGACACCT CCTCGATACT 
TCGATCGGCG TATTCATCAC GCCTAATATC ACATCTGATA AAGAAACGGG TATCGGCCTC 
TGGAGCGAGG AAGATTTCTG GCGGGCTCTC CATAATGGGA GGGGGCGCGA TGGAAATCTC 
CTGTACCCGG CATTTCCGTA TTCGGAATAT ACCAAGGTAT CGCGCGAAGA TTCCGATGCC 
ATCTTTGCCT ACCTTCAATC ACTTCCACCC GTGAGGCAGC GCAATGCGCC CAACCGCATC 
AATTTCCCCT TCAACTGGCG TCCACTGCTG CAGGTCTGGC AGCTTATTTA TTTTTCTCCC 
GGCATATATC TTCCCGATAC GCTGCAGGAT GACGAATGGA ACCGGGGGGC CTACCTCGTG 
CAGGGGCTCG GGCATTGCAA CGCATGTCAT ACCCGGCGCA ACTTGTTGGG AATAAGCAAA 
GGAGATATCC TGGGAGGAGG TCAGCTGATG GGTTCAAACT GGTATGCGCC ATCACTGACT 
TCCCTGCAGG AAGCCAGTAC CGCGGATTGG CCGATCGAAG ACATTACGCG ATTGCTGAAA 
ACCGGATCCG CTTCGCGGGC TGTAACTACC GGACCGATGG CGAATGTCGT CAGCCAGAGT 
CTCCAGTTCC TGACAGAAGA CGACGCACGG GCGGTGGCGA AATATTTGAA GTCTTTGCCC 
GAAACCGAGC CTCGCTCCCG TGGAACCGCC CCTCCTCTTA CCGAAGAAGT CGACAAGCAG 
CTTAAAAAAG GGGGACAGAT TTACGAAACC TATTGCCAGG ACTGTCATGG AAATCTGGGG 
GAAGGTGCCC CGGGAAGCTA TCCGGCGCTT GCCGGCAACC GTGGGGTGAC AATGGCATCC 
CCGACCAACG CGATCCGCAG CGTTCTCAAT GGCGGATATG CTCCTGTCAC CGAGGTCCAG 
CGGCGTCCCT ACGGAATGCC GCCATTTGCG CAAGTGCTAC CCGACAAGGA GATTGCACTG 
GTGCTATCGT ATATCCGTAA CTCATGGGGC AACCGGGGAA GCCTCGTTAC CCCGGAACAG 
GTGGACCGAA GCCGAAAAGG CGCACAGTAG

Protein sequence

MRYGFVTILI AGFTGLSILL VPPVTLSPAA EKPEVAGIRD TAEIEAQRAR GAYLARIGNC 
LGCHTAYSGL PYAGGHLLDT SIGVFITPNI TSDKETGIGL WSEEDFWRAL HNGRGRDGNL 
LYPAFPYSEY TKVSREDSDA IFAYLQSLPP VRQRNAPNRI NFPFNWRPLL QVWQLIYFSP 
GIYLPDTLQD DEWNRGAYLV QGLGHCNACH TRRNLLGISK GDILGGGQLM GSNWYAPSLT 
SLQEASTADW PIEDITRLLK TGSASRAVTT GPMANVVSQS LQFLTEDDAR AVAKYLKSLP 
ETEPRSRGTA PPLTEEVDKQ LKKGGQIYET YCQDCHGNLG EGAPGSYPAL AGNRGVTMAS 
PTNAIRSVLN GGYAPVTEVQ RRPYGMPPFA QVLPDKEIAL VLSYIRNSWG NRGSLVTPEQ 
VDRSRKGAQ