Gene Nwi_0203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_0203
Symbol
ID	3676659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	-
Start bp	233410
End bp	234354
Gene Length	945 bp
Protein Length	314 aa
Translation table	11
GC content	66%
IMG OID	637711741
Product	methylated-DNA-(protein)-cysteine S-methyltransferase
Protein accession	YP_316823
Protein GI	75674402
COG category	[K] Transcription [L] Replication, recombination and repair
COG ID	[COG0350] Methylated DNA-protein cysteine methyltransferase [COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID	[TIGR00589] O-6-methylguanine DNA methyltransferase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.661415
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.947991
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCGGCA GACGGCGAAC GTCCTACATC CTGGCCATGA TGACGCTTGC GAAAATTCCT 
GCTCCGGCTG ATTCGCGCAT GACGCAGCCG GACGCGCCTG GCGCAGCATT GCGCGATTAT 
GACGCGGTCC GCCGAGCGAT CGCCTTCATC TCCGAAAACT GGCGCTCGCA GCCCGCCATC 
GCAGCGACGG CTGACGCCGC CGGCGTGACG CCGGACGAGT TGCACCATCT GTTCCGGCGC 
TGGGCGGGTC TAACCCCGAA ATTGTTCATG CAGGCGCTGA CGCTCGACCA CGCCAAGCGG 
TTGTTGCGCA AATCCGCCAG CGTGCTCGAT GCAGCCCTCG ACTCCGGCCT CTCGGGTCCG 
GGACGCCTGC ACGACCTGTT CGTCACGCAT GAAGCGATGT CACCCGGCGA ATGGAAGAAT 
GGCGGCTCCG GCATGAAGCT CGCTTTCGGT TTTCATCCCT CGCCCTTCGG CATCGCGATT 
GTGATCGCCA GCGACCGTGG CCTCGCGGGA CTGGCTTTCG CCGACGGCGG CGACGAGCAG 
GCCGCGCTCG CCGACATGAA GCGGCGATGG CCCAATGCAG CTTACGTCGA GGATGCAGCT 
CGCACCGGGG CGCTGGCGCA GCGCGTGTTC GATACGAGGC TTTGGCGAGC CGACCAGCCG 
CTGCGCGTGG TTCTGATCGG GACGGATTTC GAGGTCCGGG TCTGGCAGAC CCTGCTCAGG 
ATTCCCATGG GAAAGGTCAC GACCTACTCA ACCATCGCCG CCAGTATCGA TCGCCCGACC 
GCTTCGCGCG CCGTCGGCGC CGCTGTCGGC AAGAACCCGG TGTCATTCGT CGTGCCCTGC 
CATCGCGTGC TCGGCAAAAG CGGCGCGCTG ACGGGGTATC ACTGGGGAAT CACCCGCAAG 
CACGCGATGC TGGGGTGGGA GGCCGGGCGG ATTGGCCTGG AATGA

Protein sequence

MAGRRRTSYI LAMMTLAKIP APADSRMTQP DAPGAALRDY DAVRRAIAFI SENWRSQPAI 
AATADAAGVT PDELHHLFRR WAGLTPKLFM QALTLDHAKR LLRKSASVLD AALDSGLSGP 
GRLHDLFVTH EAMSPGEWKN GGSGMKLAFG FHPSPFGIAI VIASDRGLAG LAFADGGDEQ 
AALADMKRRW PNAAYVEDAA RTGALAQRVF DTRLWRADQP LRVVLIGTDF EVRVWQTLLR 
IPMGKVTTYS TIAASIDRPT ASRAVGAAVG KNPVSFVVPC HRVLGKSGAL TGYHWGITRK 
HAMLGWEAGR IGLE