Gene Dde_2869 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dde_2869
Symbol
ID	3758830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio desulfuricans subsp. desulfuricans str. G20
Kingdom	Bacteria
Replicon accession	NC_007519
Strand	+
Start bp	2856595
End bp	2857941
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	50%
IMG OID	637783770
Product	type I restriction-modification system, S subunit
Protein accession	YP_389359
Protein GI	78357910
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0947716
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCAGT ACAAAGCGTA TCCCGCGTAC AAGGATTCCG GCGTTGAGTG GATTGGGCAG 
GTGCCGGAGC ATTGGAAGAT TGCGCCAGTA AAGTATCACT ACGATGCAAG ACTGGGGAAA 
ATGATCCAGC CTGCTGCGGT CTCTGACCGA GATATAGAAG TGCCATACCA TCGGGCGCAA 
ACCGTTCAAT GGGAAAGGAT CGTTGAGTCT GACATCAAAG AAATGTGGGC ATCACCAAGG 
GATATAGAAC AGTTTTCTGT ATCTGAAGGC GACCTTTTAA TTTGCGAGGG CGGTGATGTT 
TGTCGCGCTG CAATTGTTAA ACAGCCTCCT GAAAAAAACA TGATATTCCA GAAATCCATC 
CATCGTATCC GCTCGAAAGG CGAATATGGT GTTGGTTGGG TTATGCGTTT GATGCAGCAC 
TTACGCTCGT CTGAGTGGAT AGATGTTCTG TGCAATAAAA ACACGATTGT CCATTTTACA 
AGCGACAAAC TTGGTTCATT AGAATGCCCC CTGCCGCCAC CAGACGAACA AGCCTCCATC 
GCCGCCGCCC TCGACCGCGA AACTGCCCGT ATTGATGCGC TGATCCAGAA GAAAACCCGC 
TTTATCGAGC TGCTGAAGGA AAAGCGCCAG GCGCTGATTA CCCATGCGGT CACCAAGGGG 
CTAGACCCCA ATGTAAAGAT GAAGGATTCC GGGGTGGAGT GGCTGGGGGA GGTGCCGGAG 
CATTGGAGCA GTGTTCCCAT TAAGTACATG GCGCTTGAAC GAAATTCATT GTTCTTAGAT 
GGTGACTGGA TTGAGAGCAA GGATATTTCG ACCGATGGGA TTCGCTATAT AACAACAGGG 
AACGTCGGCG AGGGTGTGTA TAAAGAGCAA GGTTCTGGTT TCATATCTGA AGAGACGTTC 
CATGCTCTTG GATGCACAGA GGTTTACGGG GGTGACGTTC TGGTATCTCG TTTGAACAAT 
CCTATTGGTC GTGCTTGCAT GGTTCCAGAC CTCGGCGTGA GAGTGGTCAC GTCTGTAGAT 
AACGTGATTT TTAGGCCGGA CTCAAAGTTC AATAAGAAGT TCATCGTTTA TCTCTTCAGT 
AGCGAAGAGT ATTTCAAGCA CACAAGCAAT CTGGCACGCG GCGCCACCAT GCAGCGTATT 
AGTCGTGGGC TTTTAGGCAA TATTCGAGTT GCTACTCCTT CGATTGAAGA ACAAACCCAA 
ATCGCCCGCT TCCTCGACCA CGAAACCGCC CGTATTGATG CGTTGATTGG CAAGGCAGAG 
CAAAGTATTA CCCTACTCAA AGAGCGCCGC GCCGCATTTA TCACCGCCGC TGTGACCGGC 
CAGATTGATT TACGAGGAGA GCAATAA

Protein sequence

MSQYKAYPAY KDSGVEWIGQ VPEHWKIAPV KYHYDARLGK MIQPAAVSDR DIEVPYHRAQ 
TVQWERIVES DIKEMWASPR DIEQFSVSEG DLLICEGGDV CRAAIVKQPP EKNMIFQKSI 
HRIRSKGEYG VGWVMRLMQH LRSSEWIDVL CNKNTIVHFT SDKLGSLECP LPPPDEQASI 
AAALDRETAR IDALIQKKTR FIELLKEKRQ ALITHAVTKG LDPNVKMKDS GVEWLGEVPE 
HWSSVPIKYM ALERNSLFLD GDWIESKDIS TDGIRYITTG NVGEGVYKEQ GSGFISEETF 
HALGCTEVYG GDVLVSRLNN PIGRACMVPD LGVRVVTSVD NVIFRPDSKF NKKFIVYLFS 
SEEYFKHTSN LARGATMQRI SRGLLGNIRV ATPSIEEQTQ IARFLDHETA RIDALIGKAE 
QSITLLKERR AAFITAAVTG QIDLRGEQ