Gene Nmul_A1692 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1692
Symbol
ID	3784618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1932053
End bp	1933195
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	51%
IMG OID	637811778
Product	integrase catalytic subunit
Protein accession	YP_412382
Protein GI	82702816
COG category	[L] Replication, recombination and repair
COG ID	[COG2826] Transposase and inactivated derivatives, IS30 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.204308
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTAGCG TATATGGTGG CATGACTGAT GAACGCAAAG CGTGTATTTG GCGGTTATGG 
CAGCAAGGGG TTGCTATGAG TGTAATTGCT AGAGATATTG CAAAGCCGCC TGCGACGGTA 
TATTCGTATC TTCTCTACCA TGGAGGCATA AAGCCGAGGC AACGATCTCG TCGATCTGGT 
TGTCTGTCGC TGGAGGAACG TGAAATGATT TCTCGTGGAT TGGCTAGTTG CAAAAGCCTG 
CGCAGGATTA GCCAGGAACT TGGTCGGGCT GCCTCTACGA CATCAAGAGA AATTGCCCGC 
AATGGCGGAC CTGAAAAATA TCGGGCATGC CATGCCGAGA AAGCTTTTCT CAAGCGCAGT 
CGACGCCCCA AGCCTACATT GCTTTCCCAG GATGAGGAGC TAAGAGGCGT GGTAACAGGA 
CTGCTGGAGG CTGATTGGTC GCCAGAACAG ATAACCGGAT GGCTCAAGCG ACACTCTTCT 
GACGGAAAAG CGATGTGTGT ATCGCATGAG ACGATCTACA AATCCCTGTT CATTCAAACT 
CGTGGCGTAC TACGCCAGGA ACTGAAGAAG CACTTGCGCA CCAAAAGAAT GTTTCGTCAC 
GCCAAGTCCC ACCGGGTTGC AGGCAGAGGA CACATTACCG ATGCGATTTC TATTCGAGAA 
CGCCCTGCAC AGGTGGAAGA CAGGGCCCTG CCTGGGCATT GGGAAGGAGA CCTGCTTATA 
GGCTCGAGTA ATAGTGGCAT TGCTACGATG GTCGAGAGAT ACTCCAGATT CACCGTGCTT 
TGCAAAGTGC AGGACAAGCG CGCTGAAAGT GTTGTTCAGT CCTTGATAAC CCAGATGCGC 
ATGCTTCCTG AGCAACTGCG CAAGAGCCTG ACATGGGATA GAGGCCAGGA ACTTGCCGCA 
CACAAGCGCT TTACCATGGC CACCAATATG GCCGTCTATT TCTGCGATCC GAGCAGCCCC 
TGGCAAAGGG GAACCAATGA GAATACCAAT GGCCTGCTAA GACAATACTT TCCAAAAGGA 
ACGAGTTTGG CGACATACAC GCAGTGTCAA CTGAATGAGG TCGCCGAAAA ACTAAACTCT 
CGCCCGAGGA AAACTTTGGA TTTTAGAACA CCCGCCCAAG TACTGAATGA AGCGTTGCAC 
TGA

Protein sequence

MASVYGGMTD ERKACIWRLW QQGVAMSVIA RDIAKPPATV YSYLLYHGGI KPRQRSRRSG 
CLSLEEREMI SRGLASCKSL RRISQELGRA ASTTSREIAR NGGPEKYRAC HAEKAFLKRS 
RRPKPTLLSQ DEELRGVVTG LLEADWSPEQ ITGWLKRHSS DGKAMCVSHE TIYKSLFIQT 
RGVLRQELKK HLRTKRMFRH AKSHRVAGRG HITDAISIRE RPAQVEDRAL PGHWEGDLLI 
GSSNSGIATM VERYSRFTVL CKVQDKRAES VVQSLITQMR MLPEQLRKSL TWDRGQELAA 
HKRFTMATNM AVYFCDPSSP WQRGTNENTN GLLRQYFPKG TSLATYTQCQ LNEVAEKLNS 
RPRKTLDFRT PAQVLNEALH