Gene Dole_2035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2035
Symbol
ID	5694878
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2465857
End bp	2467044
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	59%
IMG OID	641264636
Product	putative RNA methylase
Protein accession	YP_001529916
Protein GI	158522046
COG category	[L] Replication, recombination and repair
COG ID	[COG0116] Predicted N6-adenine-specific DNA methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000306959
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGACAC GACTCAGAAA ACAGGCCCCC GGTCACCAGC CGTCGGCCTA TGTTTATCAG 
CAGGAGAACT GGTATGTGGC CCGGGTGGAG GAGTCCTTCA AGGCGGCGGG CATTCAGGAA 
CTGGCCGACC TGAGCGCCGC TGATATTGAA CCGACCCCGC GGGGCATCCG CTTTTCAGCG 
GACAGGGCCA CCCTGTATAA AATCAACTAC ACCTCCCGCC TGCTCTCCCG ATGCCTTGCC 
CCTCTGGCGG TTTTCCCCTG CCGGCACACC GACGATCTTT ACAGCGCCGG CAAAGCCCTG 
CCATGGAAAG ATTTCTTTAT AAAGGGCCGG ACCTTTGCCA TTACCGCGGA CGTTGTGAAC 
AGCGATATCA CCGACGCCCG CTATACAACC CTTCGCCTCA AGGATGCCAT TGCCGACTAT 
TTTACTGAAA ACACCGGCCG GCAGCGACCT GATGTGGACA CCCGCAATCC GGATGTTCGC 
GTGGATGTCA CGATTCTGGA CAACCGGGCC ATCATCTCAC TGGACACCTC GGGAGAGGCG 
CTTCACAAGC GGGGCTACCG CGAGCTCAGT GTCTCCGCGC CCATGCAGGA GACCGTGGCC 
GCCGCCATTC TCCATTTTTC CAGGTGGGAC AAAAAGACCC CCCTTTACGA CCCCATGTGC 
GGGTCCGGCA CGCTCCTGTG TGAAGCCCTG ATGGCGGCCT GCAACATTCC GGCCGGCATT 
CTGCGCGGTG CCTTTGGCTT CCAGATACTG CCCGACTTTG ACCCGGTGCT CTGGCAGCAG 
GTCCGGAAGG AAGCGGATGC AGAAATCACG GAGATTCCCG AGGGCCTGAT CGCGGGCAGC 
GACGTCAACC CGGCCGCGGT CACTGCCGCG AAAACCAACC TCATGGGACT CCATTACGGA 
GGACGGGTTT CCATTACCCA GCAGGCGTTT CTCGATATTC CGGAACTGGA AAACCGGCTC 
ATTATAACCA ATCCGCCTTA TGGCATTCGC ATGGGCAGAG ACCGGGACCT GCGGTTTTTT 
TATAAATGCC TTGGGGACTT TCTCAAACAG AAATGCCGGG GGTCCACCGC CTGGATATAC 
TTCGGTGACA GGGACTACAT CAAGAACCTG GGGCTCAAGA CCGCATGGAA ACTGCCCCTG 
CGGGCCGGTG GCCTGGACGG GCGCCTGGTA CGGTATGAAC TCTACTGA

Protein sequence

MKTRLRKQAP GHQPSAYVYQ QENWYVARVE ESFKAAGIQE LADLSAADIE PTPRGIRFSA 
DRATLYKINY TSRLLSRCLA PLAVFPCRHT DDLYSAGKAL PWKDFFIKGR TFAITADVVN 
SDITDARYTT LRLKDAIADY FTENTGRQRP DVDTRNPDVR VDVTILDNRA IISLDTSGEA 
LHKRGYRELS VSAPMQETVA AAILHFSRWD KKTPLYDPMC GSGTLLCEAL MAACNIPAGI 
LRGAFGFQIL PDFDPVLWQQ VRKEADAEIT EIPEGLIAGS DVNPAAVTAA KTNLMGLHYG 
GRVSITQQAF LDIPELENRL IITNPPYGIR MGRDRDLRFF YKCLGDFLKQ KCRGSTAWIY 
FGDRDYIKNL GLKTAWKLPL RAGGLDGRLV RYELY