Gene Dhaf_3951 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dhaf_3951
Symbol
ID	7260971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfitobacterium hafniense DCB-2
Kingdom	Bacteria
Replicon accession	NC_011830
Strand	+
Start bp	4191475
End bp	4192695
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	39%
IMG OID	643563872
Product	restriction modification system DNA specificity domain protein
Protein accession	YP_002460400
Protein GI	219669965
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGGGGAGA TTGTTAAAAA ACTAAAATCT TATCCTTTAT CTCGAGATGT TGAAACTAAA 
GAAAGAACAG GATATAGGTA TATCCATTAT GGAGATATTC ATAAGCAAAT AGCTGATTTG 
ATAGTACAGG ATGAAGATTT GCCCTCTATA AAAGAAGGGG ATTATATACC ACTTAATCAG 
GGTGATTTAG TTTTGGCAGA TGTTTCTGAA GATTACACCG GGATTGCAGA GCCAAGCATC 
ATTCTCCATG AACCAAAAAC AAAGATTATT GCAGGATTGC ACACCATTGC AATCCGCCCT 
CAGAGTGCCA CCTCTTTGTA TTTGTATTAC TTACTACACA CAGAAAGATT TAAAAAATTC 
GGAAGCCATG TCGGGACGGG CTTAAAAGTA TTTGGGATAA CTTTTAATAA TTTATCTTTA 
TTTCAAATAA AGACTCCGAG TTTTCCCGAA CAAACCGCCA TCGGCAACTT TTTCCGCACC 
CTCGACGATA CTATCACCCT TCATAAGCGT AAGCTGGATA AGCTGAAAGA GTTGAAGAAC 
GGCTATCTGC AAAAGCTGTT TCCTCAACCC GGAGAAGATG TGCCAAGGGT GCGCTTTGCC 
GGATTCAATG AACCGTGGGA AGTGCGTTCA TTTGAAAATA TTCTTGCCCC AGCCGTGGCC 
AGTAACACTC TGTCAAGAGC TGAATTAAGC TATGAAAAAG GCAGCATTAA AAATATCCAT 
TATGGTGATA TACTTGTGAG ATTCGGAGTC TATATTGACA TTGCAAGGGA TCCGATTCCT 
TGTATCGCCA ACGGAAGAAT TATTGATTAT AAGAATAAAT TGCTCCAAGA AGGAGATGTC 
ATATTTGCTG ATACGGCAGA AGATGAGACT GTCGGTAAAG CGGTCGAAAT CACTAATATT 
AGTAATTTCC AGGTTGTTTC TGGATTGCAC ACAATGGCAT ACCGACCCAA AATTAAAATG 
TCACCTTACT ATTTAGGCTA TTATTTGAAT TCTCATTCAT TTCGCTATCA ATTGCTTCCC 
CTTATGCAAG GGGTAAAAGT GTTATCGTTG AGCCGCAAGA ACCTGTCTAA GACACTTATT 
CGCTATCCGG CTGTATTAAG CGAGCAGTCT CAAATTGGCG ATTTTTTACG AAATCTGGAT 
GAACAAATCT TTACTCTATA CAATAAATTA GGCAAGCTGA AACAATTAAA GTCGTTTTAT 
CTGCAAAAGA TGTTTATATG A

Protein sequence

MGEIVKKLKS YPLSRDVETK ERTGYRYIHY GDIHKQIADL IVQDEDLPSI KEGDYIPLNQ 
GDLVLADVSE DYTGIAEPSI ILHEPKTKII AGLHTIAIRP QSATSLYLYY LLHTERFKKF 
GSHVGTGLKV FGITFNNLSL FQIKTPSFPE QTAIGNFFRT LDDTITLHKR KLDKLKELKN 
GYLQKLFPQP GEDVPRVRFA GFNEPWEVRS FENILAPAVA SNTLSRAELS YEKGSIKNIH 
YGDILVRFGV YIDIARDPIP CIANGRIIDY KNKLLQEGDV IFADTAEDET VGKAVEITNI 
SNFQVVSGLH TMAYRPKIKM SPYYLGYYLN SHSFRYQLLP LMQGVKVLSL SRKNLSKTLI 
RYPAVLSEQS QIGDFLRNLD EQIFTLYNKL GKLKQLKSFY LQKMFI