Gene Nmul_A0920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0920
Symbol
ID	3786465
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1045267
End bp	1046967
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	59%
IMG OID	637811002
Product	tyrosinase
Protein accession	YP_411615
Protein GI	82702049
COG category
COG ID
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCCAA AATTGTTCTC ATCCACCATG TCCCGCCGCA CATTCCTGAA AGCTGCGGCG 
GCGACCACCG CCGCCATCGG CGCTTCTGCC CTGCCCTTCG GAGCCCAGGC ACAAGGGAAA 
GCAAAGTATC GGCGTTTGAA CGTTCTGAAC CCTGGGGCAA AGCGCGCCAT CGAAAGCTAC 
AAGAGGGCTA TCGCCAGGAT GCTCAAGCTC CCGCCGGAAG ACCCTCGCAA CTGGTATCGC 
ATCGCGCTCA CTCACACGAT GGATTGCCCG CACGGCAACT GGTGGTTTCT GGTCTGGCAC 
CGCGGCTATA TCGGCTGGTT CGAGCAGATT TGCCGTGAGC TCAGCGGCGA CCCAGGGTTT 
GCTCTTCCCT ACTGGGATTG GACGGAGAAT ACGGACCCCG ACAGTCCCTT TCAGGCACGC 
GTGCCCGCCG TCATGTTCGA GGATGTGCTC ACCCCCGCTC ATCCGGCCTA TATTGCAAAC 
TCGCGCGAAT TTCAGAACCG CTTTCGCGGG GTAATCGCCA GGGCGGATTA CTGGAAGCGT 
TTTTGCGGGC CGAATGGTGA ATTCGATGAT GAGACGCAGT ATGGTCAGCT CCTCGCCCGG 
GGAATCCGCT CCCCCGAGGA TCTGTGGTTC GATATGCTAA ACGATCCGAG AGGCCGCTTT 
TTTTTCGATC TGAAACAGGC GCGCGGCACG ACCCGGGAAA AGCCGGAGCT CGATGGAAAA 
ACAACGAAGG CCGTCTCCCT GCAAACATTG CTGGACGCGC TGGCCCCTCG CGATTTCCTC 
ACGTTTGCCA GCCCAAAGAC CCTTGGTCAC AGTGCCCTCA CCGGATTTGG CGTGCTGGAA 
GGACAGCCGC ACAACAGGGT GCACAACTGC GTCGGCGGCA TCTTTACCGA CCCCAATGGC 
AACACCACCA ACAACGGCGG CTTCATGCAG GCCAATCTAT CGCCTGTCGA CCCGCTTTTT 
TTTCTGCACC ATGCGAATAT CGATCGGCTT TGGGATGTAT GGACCCGGAA GCAGTTGGCG 
AGGGGATATC CTGCCTTGCC CGAAGGCGCG GATTTCGACG CCTGGTCGAG GGAACCGTTT 
CTTTTCTTTG TCGATGCAAA GGGAAAGCCG GCGAAGAAAA GAACCGCCGG GGACTACGCG 
GCTATCGGGG ATTTCAATTA CGATTATGAG CCCGGCTCCG GGGAGGAAGT GGTGGCGCCT 
CCCATGTTCG CCTCACTGCT GGGCGCAGCG GTACCCTCCG AGAGCACCCG GGCCCAGATC 
ACCCGTTCCG TGGTGAGCGG GGAGCAGGCG GCAAGCGCGG TCGTGACACT TCCGTCTCCG 
CTGCTTGGCT TGCGCGCACA GGCGGAAACG CCGCGATTGT ATGCAAAGAT CACCCTGGCG 
CTGCCGCCGC TGGCGCACCA TCATGATTTT GCCGTGATGG TGGATGACGG GAACAGTCGA 
ACGGACCCCT CCAGTCCTCA CTACGTCGGT ACGCTCTCGA TGTTCGGTCA TCACACCATA 
CAGGCTCCGG TTACCTTTAC CGTGCCTTTA TCGGGCACGA TCGAGGCAAT GCGGCAGAAC 
GCGCAGCTTA CAGACAGCGG GGCGTTGAAT ATCCGGATTG TTTCGGAGCG AATGGTAAAA 
CCGGGAGTAC CGATGGCAAG ACATGCCCCT GGCACGGAAC CGAAAGCGGA GGTACTTTCC 
ATTGTTGTGG AGGCCCATTG A

Protein sequence

MQPKLFSSTM SRRTFLKAAA ATTAAIGASA LPFGAQAQGK AKYRRLNVLN PGAKRAIESY 
KRAIARMLKL PPEDPRNWYR IALTHTMDCP HGNWWFLVWH RGYIGWFEQI CRELSGDPGF 
ALPYWDWTEN TDPDSPFQAR VPAVMFEDVL TPAHPAYIAN SREFQNRFRG VIARADYWKR 
FCGPNGEFDD ETQYGQLLAR GIRSPEDLWF DMLNDPRGRF FFDLKQARGT TREKPELDGK 
TTKAVSLQTL LDALAPRDFL TFASPKTLGH SALTGFGVLE GQPHNRVHNC VGGIFTDPNG 
NTTNNGGFMQ ANLSPVDPLF FLHHANIDRL WDVWTRKQLA RGYPALPEGA DFDAWSREPF 
LFFVDAKGKP AKKRTAGDYA AIGDFNYDYE PGSGEEVVAP PMFASLLGAA VPSESTRAQI 
TRSVVSGEQA ASAVVTLPSP LLGLRAQAET PRLYAKITLA LPPLAHHHDF AVMVDDGNSR 
TDPSSPHYVG TLSMFGHHTI QAPVTFTVPL SGTIEAMRQN AQLTDSGALN IRIVSERMVK 
PGVPMARHAP GTEPKAEVLS IVVEAH