Gene Nmul_A2572 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2572
Symbol
ID	3784652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2945553
End bp	2947646
Gene Length	2094 bp
Protein Length	697 aa
Translation table	11
GC content	60%
IMG OID	637812663
Product	hypothetical protein
Protein accession	YP_413253
Protein GI	82703687
COG category	[R] General function prediction only
COG ID	[COG3211] Predicted phosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.682256
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGCA CCCTCCACGC TGATAGAAAG AACAATCCCG ATCGCACCAG CAGCAACGAA 
TCCGGCAATG CATCCCTGCA TGATCTGATC GAAGCCGGCA GGCTTTCCCG CCGCGCCTTC 
CTCCAACGTT CGCTAGGCCT TACGGCTATG GCATTCGGCG GCTCCCTGCT CGATGGCCTG 
ATGCAGTTTG CTTACGCAGC GCCGGCGCCT GTGAACGGCA TCGGTTTCGA TTCAGTGCCT 
GCCAACCTAT ATCTCTCACC CGGGGATGAC GCCGTTACCG TTCCCGCCGG CTATACCGCG 
CGCGTACTGG TCGCCTGGGG AGACTCTCTT ACCCAGGCGC CGCACTGGAA TCCGGGGAGC 
GCAATGACCG AGACGGTACA GTTGCACGCC TTCGGCGCCC ATGTGGACGG GATGCATCTG 
TTTCCCTTCC CTCCCATGGG ATCGTCCGGA TCACCCGGCG TCGCCAATAT CCGCGGTCTG 
CTGGTGACGA ACCATGAGTA CGTCGATCCT CCTCTGGTCA ATAACATCAC TCCCGCATCC 
AGCTATGCGA CCACCCCCAT CACTCTCGAT ATGGTGCGCG CACAGCAGGC CGCGCATGGC 
ATCAGCGTGG TCGAGGTGTG GAAAAAGAAC GGCATGTGGG AGGTCCAGCG TACTTCCGCC 
TTCAACCGCC GCATTACCGG CAACTCCCTC TGCAAGCTGA GCGGACCCGC CGCCGGGCAT 
GATCTGATGA AAACGGCCGC CGACCCCGGC GGCATGAATG TTCTCGGCAC ACTCAACAAC 
TGCTCCAACG GCCATACCCC TTGGGGCACT TATCTCACCT GCGAGGAAAA CTGGAACGGC 
TATTTCTCCA ATGAGACCGG AGATGTGGCA GGCGCAAACG ATCCGGAACA GAAGCGCCGG 
ATTCTAAACG GGCAAGCGCG CTATGGTATC GGCAAGGGCG GGTTCGGTTA CCGCTGGCAC 
GAAATGGATG CGCGTTTCCG TGCCGACCTT AATCCGAATG AGTCGCATCG CTTCGGCTGG 
GTAGTGGAAA TCGATCCATG GGATCCAAAG AGCACGCCGG TGAAGCGCAC TGCGCTGGGA 
CGTTTCAAGC ACGAAAATGC CAGTTGCGTC GTGGACCCAG ATAATACGGT CGTCATATAT 
ATGGGTGATG ATGAGCGCAA CGAGTACCTT TACAAGTTTG TCTGCGCCAA TAAATATAAC 
CCCCGCAACC GCGCGGCCAA CCGCGATCTG CTGGATTCCG GCACGCTTTT CGTGGCAAGG 
TTCAATGCGG ATGGCGGCGG GAAGTGGCTG CCACTGGTCT GGAACCAGAA TGGACTGACG 
CCGGCAAATG GCTTTGCCGA TCAAGCCGAA GTATTGATCA AGGCGCGCCA AGCAGCGGAT 
CGCGCAGGCG CCACGATGAT GGATCGTCCG GAATGGATAG CAGCGCACCC CGCCTCGCGT 
GAAGTCTATA TGACGCTTAC CAACAACAAC CGCCGTGGAA GCAATCCGCC GTCCGGCAAC 
AGCATCGACG GAAGTACCCC TGCCGGCAGT GCGCGTCCTC CCGTCGATGC CGCGAATCCC 
AGGCTGGACA ACCGTTACGG TCACATCATC CGGTGGCGCG AAAACATGGG CAAGGCCGAC 
GCCCTGGATT TCGAATGGGA CATTTTCGTT GAATGCGGTG ACAAGCTGGA CCCGCAGCCG 
CATCATCGCG GCAATATTAA CGGCGACGAT TACGGCGCCC CCGATGGCCT CTGGTTCGAT 
CAGGATGGCC GCCTGTGGAT ACAGACCGAT CAGGCAGGTG ATGCCACTGG CGACTGGGCC 
AATATCGGGG GAAATGTCAT GCTGTGCGCG AATCCTTCCA CGGGCGAGAC GCGCAGATTC 
CTCACTGCGC CGAAGTACTG CGAGGTCACC GGAGTTACAA GTTCTCCGGA CGGCAAGGCC 
CTGTTCGTCG GCATCCAGCA CCCGGGGGAG GATTGGGAAA CGCATTTTAC CCAGAACTCG 
ACCTGGCCCG ACAGCGGTCA AAATGGCCCC ACTACGGCGG GCGGTTCCCC ATCCAAGCCC 
CGCTCCGCCG TGGTGGTCAT CACTAAAGAT GATGGCGGCG TGATTGGCAC CTGA

Protein sequence

MSSTLHADRK NNPDRTSSNE SGNASLHDLI EAGRLSRRAF LQRSLGLTAM AFGGSLLDGL 
MQFAYAAPAP VNGIGFDSVP ANLYLSPGDD AVTVPAGYTA RVLVAWGDSL TQAPHWNPGS 
AMTETVQLHA FGAHVDGMHL FPFPPMGSSG SPGVANIRGL LVTNHEYVDP PLVNNITPAS 
SYATTPITLD MVRAQQAAHG ISVVEVWKKN GMWEVQRTSA FNRRITGNSL CKLSGPAAGH 
DLMKTAADPG GMNVLGTLNN CSNGHTPWGT YLTCEENWNG YFSNETGDVA GANDPEQKRR 
ILNGQARYGI GKGGFGYRWH EMDARFRADL NPNESHRFGW VVEIDPWDPK STPVKRTALG 
RFKHENASCV VDPDNTVVIY MGDDERNEYL YKFVCANKYN PRNRAANRDL LDSGTLFVAR 
FNADGGGKWL PLVWNQNGLT PANGFADQAE VLIKARQAAD RAGATMMDRP EWIAAHPASR 
EVYMTLTNNN RRGSNPPSGN SIDGSTPAGS ARPPVDAANP RLDNRYGHII RWRENMGKAD 
ALDFEWDIFV ECGDKLDPQP HHRGNINGDD YGAPDGLWFD QDGRLWIQTD QAGDATGDWA 
NIGGNVMLCA NPSTGETRRF LTAPKYCEVT GVTSSPDGKA LFVGIQHPGE DWETHFTQNS 
TWPDSGQNGP TTAGGSPSKP RSAVVVITKD DGGVIGT