Gene Nmul_A1719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1719
Symbol
ID	3786196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1961695
End bp	1963008
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	57%
IMG OID	637811806
Product	cytochrome c, class I
Protein accession	YP_412409
Protein GI	82702843
COG category	[C] Energy production and conversion
COG ID	[COG2010] Cytochrome c, mono- and diheme variants
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.444977
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTG CTGTCATCGC TGCCGCAGTG GCAGTTCTTG CGGGTATCGG CCTATCTCCT 
GAAATAGTTG GCGCACCTTC TCCGAAAAAG GAAGCAAAGG CAGAAAAGAA TGCTACGCCG 
TTATCATCGG TTCTTTTGCA ACAGCGGCGA GCGCGCGGAG CATATCTTGC ACGAGCCGGA 
AATTGCATAG GATGCCATAC AGCTCAAGGT GGAGGCGCCT ATGCCGGCGG CAGGAAGCTT 
TCGACTCCAT TTGGCACGTT CGTTACATCC AATATCACGC CGGATAAGGC AACCGGAATC 
GGTGACTGGG ATGAAGACGA TTTCTGGAAA GCGCTGCACG AGGGTAAATC GCGCGATGGG 
AGGCTTCTGT ATCCCGCGTT TCCGTATACC GAATATACGA AAGTCACGCG CGAGGATTCC 
GATGCGATTT TTGCCCATCT TCAAGCCCTC GAACCCGTCG TTCAACAGAA TCCGCCAAGC 
CAGGTTGCTT CCCGATACGA TTTCCAGCCA TTGCTGACTC TTTGGCGTGC CGCTTATTTC 
AAGCCGGGCG TGTATCAGGC TGATCCCGCC AAAAGCACTG AGTGGAACCG GGGTGCTTAC 
CTGGTGCAGG GGCTTGGTCA TTGCAGCGCC TGCCATGCCG AGCGGAATCC ACTGGGTGGC 
ATGATTGGCC GCAAGGGAGA TGATAAGCTG GGAGGTGGGC AGATCATGGG CTCCAACTGG 
TACGCGCCAT CGCTGACTTC GAGTCTGGAG GCAAGTACGG CTGGCTGGCC GGTCGAAGAA 
ATTGTCCAAC TGCTGACCAC CGGGATTTCA CCCAGGGCGA CGACGTCAGG ACCGATGGCC 
GAAGTTGTCA GTCAGAGCCT CCAGCATCTG ACAAAAGAGG ATGCCCGGGC AATGGCGATC 
TACCTCAAAT CACTGCCTGA AACACAATCG CACCAACAGG TAAATTCTCC CGCACAGACG 
GAACAGGTGC AGGCCTGGTT GCGGTACGGG GCACGGATAT ACAAGGAACA CTGCCAGGAT 
TGCCATGGCG ACTCGGGGCA GGGCGCCCCG GGAATTTACC CCCCCTTGGC CGGTAACCGA 
AGCGTTACCC TTACACCCCC TACGAATGTC ATTCGCAGCG TGCTCAATGG AGGTTATCCC 
CCGTCCACTG CAGGCAATTC CCGCCCCTAC GGCATGCCCC CATTCGCACA GGTTTTACGC 
GATGGCGAGG TTGCGCTGGT TCTGTCGTAT ATCCGCAACG CGTGGGGCAA TCGCGCCAGT 
CTGGTGACAA CTGCTCAAGT CGACAAGAGT CGCGAAGGGA TAACGGAACG CTGA

Protein sequence

MKIAVIAAAV AVLAGIGLSP EIVGAPSPKK EAKAEKNATP LSSVLLQQRR ARGAYLARAG 
NCIGCHTAQG GGAYAGGRKL STPFGTFVTS NITPDKATGI GDWDEDDFWK ALHEGKSRDG 
RLLYPAFPYT EYTKVTREDS DAIFAHLQAL EPVVQQNPPS QVASRYDFQP LLTLWRAAYF 
KPGVYQADPA KSTEWNRGAY LVQGLGHCSA CHAERNPLGG MIGRKGDDKL GGGQIMGSNW 
YAPSLTSSLE ASTAGWPVEE IVQLLTTGIS PRATTSGPMA EVVSQSLQHL TKEDARAMAI 
YLKSLPETQS HQQVNSPAQT EQVQAWLRYG ARIYKEHCQD CHGDSGQGAP GIYPPLAGNR 
SVTLTPPTNV IRSVLNGGYP PSTAGNSRPY GMPPFAQVLR DGEVALVLSY IRNAWGNRAS 
LVTTAQVDKS REGITER