Gene Nmul_A0901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0901
Symbol
ID	3784948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1025223
End bp	1027019
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	58%
IMG OID	637810983
Product	PHP-like
Protein accession	YP_411596
Protein GI	82702030
COG category	[L] Replication, recombination and repair
COG ID	[COG1796] DNA polymerase IV (family X)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCAGCC ATAATGCCGA TATCGCCGCT GTCTTCGAAG AGATTGCCAA TCTGCTCGAG 
ATCGAAGGCG CAAACCCTTT TCGGATACGC GCCTACCGTA ACGCAGTCCA GGCAATAGGC 
GCCCTTTCCA CCGAAGCGTA CGTGCTGCTC GAAAACAAGG AAGACCTGAC GGAGCTTCCC 
GGCATAGGGC GCGATCTTGC AGGCAAGATC GAAGAAATTA TTGCCACCGG CCATTGCGCC 
TTGCTGGATC GGCTGCAAAC CGAGCTTCCC CCCGCGGTTA CAGAGCTTCT GAAAGTGCCC 
GGCCTCGGGC CGAAGCGGGT CCGGCATCTT TATCACGACC TGGATGTCCA GACTGTCGAG 
CAGCTCTACG GCGCGGCGCG TGAGGGACGC ATTCGTGCAC TATCTGGTTT TGGCGAGAAA 
ACCGAGCTCA ACATCCTCCA GGCGATCGAG GCGCATACCG ATCAGAAAGG GCGTTTCAAG 
CTGGCGGTGG CGGCGCAATA CGCCGAGCCG CTGCGCGCGT TTCTGGCAGA CGTTCCCGGA 
GTCAAGGAAG CAATCGTCGC CGGCAGCTAC CGGCGCATGC GCGAAACGGT TGGGGATCTC 
GATATCGTTG TCACAGCCGC ATCGGGCAGT CCTGTCATGG AGCGCTTCAC CGGGTACGAG 
GAGGTTGCAG AAATACTTGC TGCCGGAAGC ACTCGCGCCA GCGTGGTCCT GAAATGCGGC 
TTGCAGGTGG ACCTGCGCGT GGTTGCGGAC GAAAGCTACG GCGCTGCCCT GCACTATTTT 
ACCGGATCAA AAGCCCATAA TGTTGCGGTA CGGTATATCG CCCAGAAAAA AGGGTTGAAA 
GTCAACGAAT ACGGCGTGTT CCGGGGTAAA AACCGCATCG CGGGCGAGAC CGAGGAATCG 
GTCTATCGTG CCGCCGGACT ATCCTTTATT CCACCCGAGT TGCGCGAGAA CAGGGGTGAA 
ATAGACGTGG CACGAACCCG GAAATTGCCA CGCCTAGTCG AGCTGTGCGA CTTGCGGGGG 
GATCTGCATA CTCACACAAA AGCTACGGAC GGTCATAACA CCTTGCGCGA AATGGCACTG 
GCCGGCAAAT CGCATGGCCT GGAATACATT GCCGTCACGG ATCATTCACG CGGACTGAGA 
GTCACCCGCG GCCTCGATCC TCTCCGGCTG AAGCGCCAGT GCGATGAGAT CGACGCGCTG 
AATGAAGAAC TGGAAGGAAT TACCCTGCTC AAGGGAATCG AGGTGGACAT TCTGGAGGAT 
GGCACCCTGG ATCTGCCGGA TCACGTTCTG GCGCAACTCG ATCTGGTCGT AGGGGCAGTC 
CACAGCAAGT TCGAGCTTCC GCGGGCGAGG CAGACCGAGC GGATACTGCG CGCAATGGAA 
CATCCCCATT TCACCGTTCT TGCGCATCCC AACGGTCGCC TCATCCCGCA GCGCCCGCCT 
TATGATATCG ATATGCCCCG CATTATCCGT GAAGCAGGAC GCCGCGGATG CTTCCTCGAA 
CTCAATGCCC AGCCCGAGCG GCTGGATTTG TTCGATATCT ACTGCCAGAT GGCCAAGGAG 
GAAGGGGTGC TGGTCAGCAT CAATTCCGAC GCCCACAGCA CTTTTGATTT CGCGAACCTG 
CGCTTTGGTA TCGGTCAGGC AAGGCGGGGC TGGCTGGAAA AACAGGATGT GCTCAACACC 
CGCTCTCTCG AGGAATTACG AATACTCATT GCCCGCACGA TGCAGCGCCC CAACACCTGC 
GGCCCGTACA AACGGCAAAC CAAGCCTCAA ATCCGGTCAG GTAAAAATGT CCGGTAA

Protein sequence

MPSHNADIAA VFEEIANLLE IEGANPFRIR AYRNAVQAIG ALSTEAYVLL ENKEDLTELP 
GIGRDLAGKI EEIIATGHCA LLDRLQTELP PAVTELLKVP GLGPKRVRHL YHDLDVQTVE 
QLYGAAREGR IRALSGFGEK TELNILQAIE AHTDQKGRFK LAVAAQYAEP LRAFLADVPG 
VKEAIVAGSY RRMRETVGDL DIVVTAASGS PVMERFTGYE EVAEILAAGS TRASVVLKCG 
LQVDLRVVAD ESYGAALHYF TGSKAHNVAV RYIAQKKGLK VNEYGVFRGK NRIAGETEES 
VYRAAGLSFI PPELRENRGE IDVARTRKLP RLVELCDLRG DLHTHTKATD GHNTLREMAL 
AGKSHGLEYI AVTDHSRGLR VTRGLDPLRL KRQCDEIDAL NEELEGITLL KGIEVDILED 
GTLDLPDHVL AQLDLVVGAV HSKFELPRAR QTERILRAME HPHFTVLAHP NGRLIPQRPP 
YDIDMPRIIR EAGRRGCFLE LNAQPERLDL FDIYCQMAKE EGVLVSINSD AHSTFDFANL 
RFGIGQARRG WLEKQDVLNT RSLEELRILI ARTMQRPNTC GPYKRQTKPQ IRSGKNVR