Gene Dole_2237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2237
Symbol
ID	5695085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2708897
End bp	2710135
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	50%
IMG OID	641264843
Product	restriction modification system DNA specificity subunit
Protein accession	YP_001530118
Protein GI	158522248
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACCTTC ATGAAGTGTG TGATCTGATT GTTGATTGTG AGCATAAGAC CGCACCAACC 
CAAGCAGAAG GCTACCCCTC TATTAGAACC CCAAACATTG GTCGAGGATA TTTTCTTTTG 
GACGGAGTGA ATCGTGTTTC AGAAGAAACT TACCGGTCAT GGACAAGACG AGCCGAACCA 
AAACCTGGCG ACTTAATAAT GGCCCGAGAG GCTCCGGTTG GGAATGTTGC TATGGTCCCT 
GCGGGTCTTC GCCCCTGCCT TGGACAAAGG ACCTTGCTGA TACGACCAAT GAGGTCAAAG 
GTTTTCCCAC GCTACCTCGC GTATTTGCTG ATTGGCGACC AAATCCAGAA TATTATCCAT 
GCCATGACGA ATGGAGTCAC CGTACCTCAT TTAAACATGA AGGATGTGAG GTCGCTTCCC 
CTACCACCGC TTCCCCCCCT TCCCACCCAG CGCAAAATCG CCGCCATACT TTCGGCCTAT 
GACGACCTGA TCGAGAACAA CCTGAGGCGG ATCAAGATTC TGGAGGAGAT GGCGCAGAAC 
CTCTACCGCG AGTGGTTCGT CAAGTTCCGC TTCCCCGGCT GGGAGAAAGC CCGCTTTGTG 
GATTCGCCGC TGGGGAAGAT TCCGGAGGAG TGGGAGGTGA CAACAATCAA CAAAGTCACC 
TCATACATTA ACCGTGGCGT AACTCCTAAA TATGACGCCT CTGCATCGAG TCTTGTTGTA 
AATCAAAAAT GTATTCGTGA TCGCAAACTT AACTTGAGCC TTGCGAGACA GCATAAAAGT 
CGCGTGATGG ATGACAAATA CGTTGTGTTT GGCGATATTT TGATCAATTC CACTGGTGTT 
GGAACTTTAG GTCGTGTGGC CCAGGTGTAT GAAGATTTGA ACGATGTGAC AGTTGATACG 
CATGTGTCGA TTGTTCGCCC TTCAAACGGA GATGGCATTG ATTTCTTGGG CCTCGCCTTG 
ATTGATTTAG AGCCTCATTT TGAGTCGCTC GGAGCGGGTG CCACCGGTCA AACCGAGCTT 
CGTCGTGATA GGATTGGTGA AACCGAAATC GTTTTACCAC CGGTTAAAAT GCGGAAGCAG 
TTTTCAGAAA AGGTAACTTC GCTTCGAAAA TTGGTCCTTA ATCTGGCAGC TCGAAACGAA 
ACCCTGCGCC GCACCCGCGA CCTGCTTCTC CCCAAACTCA TATCCGGCGA GGTGGATGTG 
TCGGAACTGG ACATCGCTAT TCCTGAGGAG GCTGCATGA

Protein sequence

MDLHEVCDLI VDCEHKTAPT QAEGYPSIRT PNIGRGYFLL DGVNRVSEET YRSWTRRAEP 
KPGDLIMARE APVGNVAMVP AGLRPCLGQR TLLIRPMRSK VFPRYLAYLL IGDQIQNIIH 
AMTNGVTVPH LNMKDVRSLP LPPLPPLPTQ RKIAAILSAY DDLIENNLRR IKILEEMAQN 
LYREWFVKFR FPGWEKARFV DSPLGKIPEE WEVTTINKVT SYINRGVTPK YDASASSLVV 
NQKCIRDRKL NLSLARQHKS RVMDDKYVVF GDILINSTGV GTLGRVAQVY EDLNDVTVDT 
HVSIVRPSNG DGIDFLGLAL IDLEPHFESL GAGATGQTEL RRDRIGETEI VLPPVKMRKQ 
FSEKVTSLRK LVLNLAARNE TLRRTRDLLL PKLISGEVDV SELDIAIPEE AA