Gene Nmul_A2156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2156
Symbol
ID	3784396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2450361
End bp	2451848
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	58%
IMG OID	637812244
Product	tyrosinase/peptidase
Protein accession	YP_412841
Protein GI	82703275
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAACCC GAAAGAATCA ATCCACGTTG ACAGCCGCGG AGAAGGCGGC CTTTGTTGGG 
GCGGTAAAAG CACTCAAGGC AAATGGCTCC TATGATGTAT TCGTGGCCCA GCACCGTACC 
GCCTTTCTTG CCGGCGTGAA CGATCCGGCA CATGGCGGTC CTGCCTTTCT GCCTTGGCAC 
AGGGAGTATC TCCGCCGGTT CGAGCGTGCC CTTCAGCAGA TCGATCCCAG TGTTTCCATC 
CCCTATTGGG ACTGGACAGT TGATCGCACG ACGAATGCTT CCATCTGGAA TGCGAATTTC 
ATGGGTGGAA ATGGAACGGG CCCCGGCGGA CGCGTGATGA CGGGGCCGTT CGCCTTTTCC 
ACGGGAGAGT GGACGCTTAC TGTTCTGGAC CCCGGTGACA CGGATAATTT TCTCACCCGT 
GCCTTCGGCG CCATGGGAGC GTTGCCCACC CAACAGGGAG TGAATGCCGC CATCAATATC 
GTGCCCTATG ATTCAGCGCC CTGGAATCGT AACAGCAGCA TGAATACGAG TTTTCGAAAC 
CATCTCGAGG GGATTATCCA CAATCCCGGC CACATGTGGG TAGGCGGCTC GATGATGGCT 
ATGTCCTCCC CCAACGATCC GGTGTTCTGG CTGCATCATT GCAATATCGA TCGGTTATGG 
GCAGTATGGC AGCGGGAAAA TCCGGGGCAG AATTATCGTC CGCCGAGCGG CACGGCGGGC 
GTGGTGAACG GCCATGGACT GGATGACCCG ATGCCGCCCT GGAACAACGA AGCTTCGCCG 
CCTACGCCCC GGGATGTTCT CGATCACCAT GCGCTTGGCT ACACGTACGA TGACGAGGAA 
GAAGAACCTC CGCAGATCGT ACCCCTGACC CTTGATGCGG CTCCGTTTGC CGCTTCCATA 
GGCCAGGCGG GAGAAGTGGA CACATATAGC TTCGTTGCCT CAAGCCAGGG GAATTATATT 
ATCGAAACCG AGGGTTCCAC CGATGTAGTG GCCGCCCTGT ATGGTCCGGA TGATGCCAAT 
GCGCTCGTTG CCGAGGATGA CGACAGCGGC GTCGGCCGGA ATCCGCGCAT TGCACGAGAC 
CTGGCGCCGG GAACATACTA TGTTCGCATA AGGCACTATA GCGGCTCATC CACTGGAAGC 
TACCGTATTT CAGTACGAGG GTCAGGAGGC CCGCAGCCGG GTATCCAGAC CATTCAGATA 
AATGGTCCGG CAGTGCAGGG CACACTCTCC GCCAATGAGA GGGATCTGTA CACCTTTACT 
GTCAGCACGT CCGGCTCCCA TACGATAGAA ACCGCTGGTA GCACTGATTG CTTCCTCACG 
TTATTCGGCC CCGACAGCCA GACTGCCGTC ATTGCCCAGG ATGACGACAG TGGCCCGGGA 
ACCAATTCGC GCATCGTGCA AAACCTCGGG GCCGGTGTCT ATTATGTTCA GGTCAGGCAT 
TACAGCCCGA CCGGTACAGG GGCGTATAGT GTTTCCGTCA GAACATGA

Protein sequence

MGTRKNQSTL TAAEKAAFVG AVKALKANGS YDVFVAQHRT AFLAGVNDPA HGGPAFLPWH 
REYLRRFERA LQQIDPSVSI PYWDWTVDRT TNASIWNANF MGGNGTGPGG RVMTGPFAFS 
TGEWTLTVLD PGDTDNFLTR AFGAMGALPT QQGVNAAINI VPYDSAPWNR NSSMNTSFRN 
HLEGIIHNPG HMWVGGSMMA MSSPNDPVFW LHHCNIDRLW AVWQRENPGQ NYRPPSGTAG 
VVNGHGLDDP MPPWNNEASP PTPRDVLDHH ALGYTYDDEE EEPPQIVPLT LDAAPFAASI 
GQAGEVDTYS FVASSQGNYI IETEGSTDVV AALYGPDDAN ALVAEDDDSG VGRNPRIARD 
LAPGTYYVRI RHYSGSSTGS YRISVRGSGG PQPGIQTIQI NGPAVQGTLS ANERDLYTFT 
VSTSGSHTIE TAGSTDCFLT LFGPDSQTAV IAQDDDSGPG TNSRIVQNLG AGVYYVQVRH 
YSPTGTGAYS VSVRT