Gene Nmul_A1386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1386
Symbol
ID	3784481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1578235
End bp	1579341
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	55%
IMG OID	637811474
Product	DNA polymerase III, delta prime subunit
Protein accession	YP_412081
Protein GI	82702515
COG category	[L] Replication, recombination and repair
COG ID	[COG0470] ATPase involved in DNA replication
TIGRFAM ID	[TIGR00678] DNA polymerase III, delta' subunit

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.128473
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAATA TTTATGGATG GCAGGAAGAA GTCTGGCGGA AACTTACGGG CGCGTTGGGG 
CACGCCCTGC TGTTACGAGG CAGAAAGGGA CTGGGCAAGC TTGCATTTGC CCGCTATCTG 
GCGAAGTCCA GACTCTGTGA AAATCGCTCC GTCGAAGGAA AGGCGTGCGA GGTCTGTGCG 
AGCTGCCACT GGTTTGAGCA AGGCAATCAC CCCGATTTCT GCCTTGTCGA GCCCGAAGCG 
GCCACGGCAA CGTCTGTCTC GGGGGAAGGA GCCGGGGAGG AGGGTGTGGA AACCGGAGAT 
GAGGCAGAAG TTCAATCTCT TCCCCGGGCA GTGAATCAGC TCAGCGGCAG TGGCAAGTCC 
ACAAAAAAAC CCAGCAGACA GATAAGTATC TCGCAAATAC GGGAGCTAGG CGACTTCGTC 
AATATCACCA GCCATCAGAA CGGCTATAAG ATCATCCTGA TCCATCCGGC GGAAACCATG 
AGTACGGCTG CTGCCAGTGC CCTTCTGAAG AATCTGGAAG AACCGCCGCT CCAAACGTTG 
TTCATACTGA TAACGCATCA GGCACAGTAT TTATTGCCGA CGATCCGCAG CCGTTGCCGC 
CAGATCATCA TGCCCGCCCC CGATGCAGCC TCCGCAGCAC TGTGGTTAAA ACAGCAGGGT 
GTCAAAGCCC CCGAAAGATG CCTGGCCTCG GCTGGCTATG CTCCCCTGAC CGCACTGGAA 
TTCGCGAATG AAGATTATCT TGTGCGGCAC AGCGCTTTCA TCCAGCAAAT CAGCACTCCA 
TCAGGTTTCG ACGTGCTGGC ACGGGCAGAG GAAATGCAGA AATCGGACCT TGTCATGGTG 
GTCAGCTGGC TGCAAAAGTG GTGCTACGAT CTGATGAGTT TTCGTATGGC GCAGAAGGTC 
CGCTATCATC CGGACATGCT CGCGCAAATA AAACCCCTGG CATCCGGGCT TGATCCGTAT 
TCAATGGCAA CTTATTTGCG CGCCCTGGAT AAAACGCAGC AGCTTGCCCG CCATCCGCTC 
AATCCAAGAT TATTTCTGGA AGAACTGCTG TTTTCCTATG TGACGATGTT ATCCGAGAAA 
TCCAGGAATC GGAGCAAGGC CGGCTGA

Protein sequence

MSNIYGWQEE VWRKLTGALG HALLLRGRKG LGKLAFARYL AKSRLCENRS VEGKACEVCA 
SCHWFEQGNH PDFCLVEPEA ATATSVSGEG AGEEGVETGD EAEVQSLPRA VNQLSGSGKS 
TKKPSRQISI SQIRELGDFV NITSHQNGYK IILIHPAETM STAAASALLK NLEEPPLQTL 
FILITHQAQY LLPTIRSRCR QIIMPAPDAA SAALWLKQQG VKAPERCLAS AGYAPLTALE 
FANEDYLVRH SAFIQQISTP SGFDVLARAE EMQKSDLVMV VSWLQKWCYD LMSFRMAQKV 
RYHPDMLAQI KPLASGLDPY SMATYLRALD KTQQLARHPL NPRLFLEELL FSYVTMLSEK 
SRNRSKAG