Gene Nmul_A0949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0949
Symbol
ID	3785209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1101121
End bp	1102278
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	58%
IMG OID	637811032
Product	DNA-directed DNA polymerase
Protein accession	YP_411644
Protein GI	82702078
COG category	[L] Replication, recombination and repair
COG ID	[COG0389] Nucleotidyltransferase/DNA polymerase involved in DNA repair
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.868276
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCCGCT GCGTTGCCCA TCTCGATATG GATGCTTTTT ACGCTTCGGT CGAGTTGAAA 
CGATACCCGC AATTGCGCGG ATTACCGGTG ATAATCGGCG GAAGCGCGGA GCAGCAGCCA 
GAACTTTTCA ATGGTGAGCC GCGTTTTGCA AAACTGAAAG GTTATGCGGG ACGGGGTGTG 
GTAACCACCG CTACTTACGA GGCTCGCGCT TTCGGCGTTT CCTCCGGCAT GGGCTTGATG 
AAAGCGGCGC AGTTGGCCCC GGAGGCTATC CTGCTGCCCG CCGACTTCAG CGCATACCGC 
CGTTATTCGA ATCTGTTCAA AACGGCCGTT GCTTTGGTCG CGCCTCGTAT AGAGGATCGC 
GGTATCGATG AGATTTACAT CGATCTCAGT GACTCGGCCG AAGATATCGT GACTCTTGCC 
CGGCGCATCA AGCAGGCTGT GCGGGAAAGC ACCGGGTTGT CCTGTTCTAT CGGCGTGGCG 
CCAAACAAGC TTCTGGCAAA AATCTGCTCA GACCTTGAAA AGCCGGATGG TCTCACTCTC 
CTGAGCATGG CCGATGTTCC AGCCAGAATC TGGCCTCTTC CCGTCCGTAA AATTAATGGC 
ATCGGTCCGA AGGCAAACCA GAAACTGGCA GCGTCAGGTA TTTTCACCAT CGGTGATCTG 
GCACAAGTAG ACATCGCTTT CCTGCAGGCG CGGTTCGGGC GCAGCAACGG CTGCTGGCTG 
TATGAGGCTT CCCGGGGCAT TGACGAGCGT TCCGTCGTGA CTCATGCGGA GCCCAGGTCG 
ATCAGCCGCG AGACGACTTT CGAGCGGGAT CTGCATGCGC GTCGCGATCG TCCCATTCTT 
TCTGAAATTT TCACCGGCCT ATGCGCGGGA GTCGCCGAAG ATCTTCAGCG CAAGGGCTAT 
GCTGCCCGTA CCATCGGCAT CAAATTGCGG TATGAAGATT TTCGCACCGT AACCCGCGAC 
ATCACGCTCC CAGTTCCCAC AGCGAATGCC GCCGTCATTC GCAAGGCAGC CCAGGAATGC 
CTGCGGCGCG TCTCTCTTGA GCAGAAAATA CGGTTGCTTG GCGTTCGCGC GAGCGGGTTG 
TGTTCCGAGA CGCTGGCGCA GAGCGCGGAC ATGAGTCAGC AAAGGGAACT TCCCCTGGCT 
GTGCCGGACA TCCGATGA

Protein sequence

MARCVAHLDM DAFYASVELK RYPQLRGLPV IIGGSAEQQP ELFNGEPRFA KLKGYAGRGV 
VTTATYEARA FGVSSGMGLM KAAQLAPEAI LLPADFSAYR RYSNLFKTAV ALVAPRIEDR 
GIDEIYIDLS DSAEDIVTLA RRIKQAVRES TGLSCSIGVA PNKLLAKICS DLEKPDGLTL 
LSMADVPARI WPLPVRKING IGPKANQKLA ASGIFTIGDL AQVDIAFLQA RFGRSNGCWL 
YEASRGIDER SVVTHAEPRS ISRETTFERD LHARRDRPIL SEIFTGLCAG VAEDLQRKGY 
AARTIGIKLR YEDFRTVTRD ITLPVPTANA AVIRKAAQEC LRRVSLEQKI RLLGVRASGL 
CSETLAQSAD MSQQRELPLA VPDIR