Gene NmulC_2789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NmulC_2789
Symbol
ID	3786789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007616
Strand	+
Start bp	9223
End bp	10275
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	50%
IMG OID	637812898
Product	hypothetical protein
Protein accession	YP_413485
Protein GI	82703921
COG category	[L] Replication, recombination and repair
COG ID	[COG5534] Plasmid replication initiator protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGTCA ACGAAACCAC GAATATTAAA AAGAATGAGC GATCGGTCTT GTTGCCGGAA 
CGCCATCCCA ATCACGAGCT GTTCATCTGC GATGTGCTTG AGGCCATCCC CAAGGATGAC 
TTGGCAAGCA TGGAACACCC CGTATTCTCC CTGGCAACCA AACCAGATAC ACGGACCCTG 
ATTTATGAGC ACAGGGATGT AAAAATCCAG ATCACGCCAA GCGTTAAGGG GTTGGCGACG 
ATTTTCGATA AGGATTTATT GATTTTCTGC ATCTCCCAAA TGATCGCAAA AAAGAATAGG 
GGAGAGCCTC TATCGCAAAA TGTACGCCTC CATGCATACG ATCTTTTGAT ATGGACGAAC 
CGGGAAACAA GCGGCGATGC TTACCGGCGC CTCATAGAAG CATTTGAGCG GCTACGCGGG 
ACCACAATCG TGACAAACAT CAAAGCAGAC GGTGAGGAGA TAACCACAGG TTTTGGCCTT 
ATCGATAGTT TCAAGGTTGT TCGTCATACC GCCACCGGGC GCATGAGTGA GCTGGAAGTC 
CGGATCTCGG ACTGGATGTT TAAAATCATT CAGGGTTCAC AGGTGCTGAC GCTGAGCCGG 
GATTATTTCC GGCTTAGAAA ACCCATCGAA CGGCGGATTT ACGAGATAGC ACGTAAGCAT 
TGCGGGGAGC AGGACGAATG GCGGATTTCT ATCGAACTGC TCCAGAAAAA AACTGGAGCC 
AGCAGTCACG AACGGGCGTT TAAAGCCATG GTGCGGGAGC TGGTCAAATG CGACCATTTG 
CCCGACTACA GCGTCACATT GGAAGACGAT ATGGTAATTT TTTATAACCG GGCGGGCTTA 
TCGGAGAAAA TTCCTCTTAC CGCGTTTCCT CAGCTCAATG CTGAAACTTA CAACGATGCT 
CGTACCGTGG CCCCAGGTTA TGACGTCTAT TATCTCGAAC AAGAATGGCG GGACATGTGG 
GTTGATACCG GAATGCCGCT ACTCCACAAT CCCGACAAAG CTTTTATAGC TTTTTGCAAA 
TCCCGGGCAA AACGTCGCCC AATGGGTCGG TAA

Protein sequence

MSVNETTNIK KNERSVLLPE RHPNHELFIC DVLEAIPKDD LASMEHPVFS LATKPDTRTL 
IYEHRDVKIQ ITPSVKGLAT IFDKDLLIFC ISQMIAKKNR GEPLSQNVRL HAYDLLIWTN 
RETSGDAYRR LIEAFERLRG TTIVTNIKAD GEEITTGFGL IDSFKVVRHT ATGRMSELEV 
RISDWMFKII QGSQVLTLSR DYFRLRKPIE RRIYEIARKH CGEQDEWRIS IELLQKKTGA 
SSHERAFKAM VRELVKCDHL PDYSVTLEDD MVIFYNRAGL SEKIPLTAFP QLNAETYNDA 
RTVAPGYDVY YLEQEWRDMW VDTGMPLLHN PDKAFIAFCK SRAKRRPMGR