Gene Nmul_A1947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1947
Symbol
ID	3785124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2238686
End bp	2240098
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	55%
IMG OID	637812034
Product	replicative DNA helicase
Protein accession	YP_412634
Protein GI	82703068
COG category	[L] Replication, recombination and repair
COG ID	[COG0305] Replicative DNA helicase
TIGRFAM ID	[TIGR00665] replicative DNA helicase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGTAA CGTCACGTAA CTCCATGCCT CAATTTGTAA CGGCAGCTTC AAACGAGCAA 
TTACTCGAAT CATACAAATT GCCCCCGCAT TCGGTTGAAG CAGAGCAATC GGTATTGGGC 
GGATTGATGC TGGACAATCA CGCATGGGAT AAGGTAGCGG ACGTGATCAC GGAAGATGAC 
TTCTACCGGC AGGATCACAA GCTCATCTAC CGCCATATCT GCAAACTGGT CGAGCACAGC 
AAACCGGCCG ATGTCATCAC GGTAGCGGAA TCACTTGAAA TATCCGCGGA ATTGCAGGGG 
GCTGGGGGGC TCGCTTACGT GGGGATCCTC GTACAGAATA CGCCTTCGGC TGCAAATATC 
CGCCGCTATG CGGAAATCGT GCGCGAGCGC GCAATCATGC GCAAGCTTGC CCAGGTGGGG 
ACCGACATCA CGGATTCGGC ATACAACCCT GCTGGGCGTT CAGCCGCCAC GCTGCTGGAT 
GAAGCCGAGG CCAGGGTTTT TGAAATTGCC GAGGCAGGTG CGCGAGGCAA GCAGGGTTTT 
ATCGACATTC AGCCGCTGCT GAAGGAGGTC GTGGAGCGTA TAGAGACGCT CTACAACCAG 
GATAATCAAA GCGATGTTAC CGGAATCGCA ACCGGCTTCC ATGATCTGGA TGAAAAGACT 
TCGGGCTTTC AGCCGGGGGA TCTTGTCATT GTTGCGGGTC GGCCATCGAT GGGCAAAACC 
GCCTTTTCGC TCAATATTGC CGAACATGTT GCACTCACGC TCCAAAAACC GGTAGCGGTA 
TTCAGCATGG AAATGGGAGG CGCGCAACTG GCGATGCGTA TGCTGGGCTC CGTCGGAAAG 
CTGGATCAGC ACAAGGTGCG TACCGGCCGC CTGCTGGACG AGGATTGGTC CCGCCTGACG 
CATGCGCTTG GCAAGCTGAA CGACGCTCCG CTTTTTATTG ACGAAAGTGC CGCTTTGAAT 
GCCCTGGAAT TAAGGGCGCG CGCGCGCCGG CTGCATCGCC AGCATGGGGA ACTGGGCTTG 
ATCGTGGTGG ATTATCTCCA GTTGATGTCC GCCGCCGGCC AGGGCGAGAA CCGCGCAACG 
GAGATTTCCG AAATATCCCG CTCCCTCAAG GCACTGGCAA AAGAACTGCA TGTGCCCGTT 
GTCGCGTTAT CCCAGTTGAA TCGAAGTCTT GAGCAGCGTC CGAACAAGCG TCCCGTTATG 
TCCGATCTGC GCGAGTCCGG TGCGATCGAA CAGGATGCCG ATCTGATTCT TTTCATCTAT 
CGGGACGAAG TTTATAACCC GGAGACACCG GACAAGGGAA TCGCCGAAAT CATTATAGGA 
AAGCAGAGGA ATGGACCGAT CGGCAAGGTC GATCTGACTT TTCTGGGCGA ATATACCCGA 
TTCGAAAGCT ACGCCAGAGC AGGTCATTAT TGA

Protein sequence

MPVTSRNSMP QFVTAASNEQ LLESYKLPPH SVEAEQSVLG GLMLDNHAWD KVADVITEDD 
FYRQDHKLIY RHICKLVEHS KPADVITVAE SLEISAELQG AGGLAYVGIL VQNTPSAANI 
RRYAEIVRER AIMRKLAQVG TDITDSAYNP AGRSAATLLD EAEARVFEIA EAGARGKQGF 
IDIQPLLKEV VERIETLYNQ DNQSDVTGIA TGFHDLDEKT SGFQPGDLVI VAGRPSMGKT 
AFSLNIAEHV ALTLQKPVAV FSMEMGGAQL AMRMLGSVGK LDQHKVRTGR LLDEDWSRLT 
HALGKLNDAP LFIDESAALN ALELRARARR LHRQHGELGL IVVDYLQLMS AAGQGENRAT 
EISEISRSLK ALAKELHVPV VALSQLNRSL EQRPNKRPVM SDLRESGAIE QDADLILFIY 
RDEVYNPETP DKGIAEIIIG KQRNGPIGKV DLTFLGEYTR FESYARAGHY