Gene Nmul_A1206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1206
Symbol
ID	3786137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1391884
End bp	1393194
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	57%
IMG OID	637811291
Product	hypothetical protein
Protein accession	YP_411901
Protein GI	82702335
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4235] Cytochrome c biogenesis factor
TIGRFAM ID	[TIGR03142] cytochrome c-type biogenesis protein CcmI

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTCAT TCTGGATTGT AGCCGGCATA TTTATTGTCG GCGCCCTGCT GTTCGTGTTG 
CCTACATTGT GGAGCAAGAA GGATCGCGAG GCCGGCGTCG AACGGGATGC CACCAATATC 
GACGTTTATC GGGATCAGTT GGCGGAACTC GACAGCGATC TGCGCAGCGA CATCCTGACG 
CGGGAACAAT ACGAGCAAAG CAAGCGTGAG TTGCAGCAAA GAATGCTGCA GGATATTCCC 
GAAGATGGCA ATACGACGAC CATGATAATG GGTGGAAGGC ACAACGTGGC AACCATGACT 
GTCACCGCGC TCGTCCTGCC TGTCCTCGCG GTTTCCCTTT ACTTGGCGAT AGGCAACACC 
AAGGCGTTGC TGCCGCAGCC TGCCGCGGAG CATCCATCGA TGTCGTCCGA GCAAGGACAA 
GGAGGCCATC CCGATTTTTC CTCGGTGATG GAAAACCTCA TTGCGAAGCT TGAGGACAAT 
CCCGACAACG TCGAGGGATG GCTTATGCTT GGTCGGACCT ACGCAATGAT GCAGCGGTTC 
AACGAGGCAA AGGAAGCTTA TGAAAAGGCG CTTGCCTTGA CGCCCGACGA CTCCGCCATC 
ATCACGGATT ACGCCGATAT CGTGGCGATG ACGAACAATG GCAGTCTGGT CGGGAAGCCG 
ACGGAACTGA TCAAAAAGGC ATTGAGCCTG GACCCCAATA ACCCCAAGGC GCTGGCCTTG 
GCAGGCACAG CCGAATTCGA GGAGAAGAGA TACAAGGAGG CTGCCAGATA TTGGGAAAAA 
CTGGCAGCGC TGATTCCGCC ATCCGAGGCT GAGCTGGTGC AATCCGTTAA CGCCAGCATC 
GCAGAAGCAA AATCGCTGGC AGCAGGAAAA GGCAGCTTGG TGGCTAGAGC GCCAGACCAG 
CCGGGTACTC AGACACCTCC TCCTGCAAAT AAACAGGGAT CAGCCTCGGG CGCGGGAGGC 
GCTACCTCCG GCACACTTTC CGGCAAGGTA ACACTCAGCC CCGGCCTCGC AAGCAAGGCC 
TCCCCCGGCG ACAGCCTGTA TATTTTTGCC CGTGCCAAAG TGGGACCAAA GGCACCCCTT 
GCGACCCTGC GTCTGCAAGT CAAGGATCTC CCGGCAAGCT TTTCACTGAA CGACTCCATG 
GCTCGGTCCG GCGTGCAGTT ATCCACTTTC CCTGCCGAGG TGGTAGTAGG CGCCCGGATT 
TCGAAATCGG GATCCCCAAT GCCGCAAAGC GGCGACCTGC AAGGTTTGAG TCAGCCGGTA 
ATGGTCGGCG CCAGCGGGAT TAGCGTGGTT ATCGATCAGC AGTTGCCTTA G

Protein sequence

MTSFWIVAGI FIVGALLFVL PTLWSKKDRE AGVERDATNI DVYRDQLAEL DSDLRSDILT 
REQYEQSKRE LQQRMLQDIP EDGNTTTMIM GGRHNVATMT VTALVLPVLA VSLYLAIGNT 
KALLPQPAAE HPSMSSEQGQ GGHPDFSSVM ENLIAKLEDN PDNVEGWLML GRTYAMMQRF 
NEAKEAYEKA LALTPDDSAI ITDYADIVAM TNNGSLVGKP TELIKKALSL DPNNPKALAL 
AGTAEFEEKR YKEAARYWEK LAALIPPSEA ELVQSVNASI AEAKSLAAGK GSLVARAPDQ 
PGTQTPPPAN KQGSASGAGG ATSGTLSGKV TLSPGLASKA SPGDSLYIFA RAKVGPKAPL 
ATLRLQVKDL PASFSLNDSM ARSGVQLSTF PAEVVVGARI SKSGSPMPQS GDLQGLSQPV 
MVGASGISVV IDQQLP