Gene Dole_0249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0249
Symbol
ID	5693067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	283450
End bp	284631
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	49%
IMG OID	641262829
Product	restriction modification system DNA specificity subunit
Protein accession	YP_001528136
Protein GI	158520266
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGCA AAGAAAATTC TCAATTCTCA ACTCGCCATT CTCCATCGGT TCCGCCGGGA 
TACAAACAGA CCGAGGTGGG GGTGATTCCG GAGGATTGGG AAGTTAAGCC TCTCGCTTTT 
GTTGTGAAAT ACACAAACGG AAAGGCGCAC GAGCAAAGCA TCACGGATTC GGGCAATTTT 
GTGGTTGTAA ATTCCAAGTT CATTTCAACT GAAGGTATCA TTCGTAAATT TGCTCAAATG 
CGTTTCTGCC CAGCGGAGAA AGGGGATGTG CTCATGGTGA TGAGCGATGT CCCAAACGGA 
AGAGCCATTG CAAAATGTTT TTGGGTAGAT TGCGAAGATA CTTACACTGT CAATCAGCGT 
ATTTGTGTCC TGAATCCTTG TGGGATAGAT GGCAAACTTC TGTATTACAA ACTCGACCGG 
AATCCGTTCT ATTTGACATT TGATGATGGT GCTAAACAGA CGAACCTCCG AAAGGAAGAC 
GTCCTTTCTT GCCCTCTGTC AATTCCAAAT ACCGAAGCCG AACAACGCGC CATCGCTGCC 
GCCTTGAGCG ACGTGGATGC CCTGCTGGAT GGCCTCGACC GGCTGATCGC CAAAAAGCGC 
GACCTCAAAC AGGCCGCCAT GCAGCAACTC CTCACCGGCC AAACCCGCCT GCCGGGGTTT 
AAGGGGGAGT GGGAGATTAA ACGGTTGGGG GATGTACTTA TGGTCCGTCA CGGCAAGAGT 
CAGCGCGGCA TCTCTGTGTC TGACGGGAAG TACCCGATTC TTGCATCCGG TGGAGAAATT 
GGACGAACCA ATACCTGCAT TTACGACAAG CCCTCTGTTT TGATTGGGCG AAAAGGAACG 
ATTGATTCAC CACAGTATGT GGACTCTCCC TTTTGGACGG TGGACACGTT GTTTTTTACG 
GAAATTTCTA CCGAAGCGAA CGCCAAGTTC ATTTTTTCCA AGTTCTCTAT AATCCCTTGG 
AGAACTTACA ACGAGGCTTC GGGTGTGCCC AGCTTAAACG CAAAAACTAT CGAAAATATC 
GAGATTTTTT TACCCTCCCC CACCGAACAA ACCGCCATCG CCCAAGTCCT CTCCGACATG 
GACGCCGAAA TCGCCGCCCT GGAACAGCGC CGCAACAAAA CCAGAGACAT CAAACAGGCC 
ATGATGCAGG AACTTTTAAC TGGAAAGACG AGGCTGGTAT GA

Protein sequence

MKSKENSQFS TRHSPSVPPG YKQTEVGVIP EDWEVKPLAF VVKYTNGKAH EQSITDSGNF 
VVVNSKFIST EGIIRKFAQM RFCPAEKGDV LMVMSDVPNG RAIAKCFWVD CEDTYTVNQR 
ICVLNPCGID GKLLYYKLDR NPFYLTFDDG AKQTNLRKED VLSCPLSIPN TEAEQRAIAA 
ALSDVDALLD GLDRLIAKKR DLKQAAMQQL LTGQTRLPGF KGEWEIKRLG DVLMVRHGKS 
QRGISVSDGK YPILASGGEI GRTNTCIYDK PSVLIGRKGT IDSPQYVDSP FWTVDTLFFT 
EISTEANAKF IFSKFSIIPW RTYNEASGVP SLNAKTIENI EIFLPSPTEQ TAIAQVLSDM 
DAEIAALEQR RNKTRDIKQA MMQELLTGKT RLV