Gene Dde_1858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dde_1858
Symbol
ID	3756861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio desulfuricans subsp. desulfuricans str. G20
Kingdom	Bacteria
Replicon accession	NC_007519
Strand	-
Start bp	1906851
End bp	1907900
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	58%
IMG OID	637782742
Product	restriction endonuclease-like
Protein accession	YP_388350
Protein GI	78356901
COG category	[V] Defense mechanisms
COG ID	[COG1715] Restriction endonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGTTA AAACGGCCGC CATTCAGGTT TTGCAGCAGG CCGGAACGGA ACTGCACGCC 
AAGGATATCG CCGAGCAGAT CATGGCTGCC GGTCTCTGGC AATCCGGAGG GAAAACCCCA 
GACGCCACTG TCAGCGCCCG GCTCTACTCC GACATCAAGA ACAACGGAGA CAAGTCACCC 
TTTGTAAAGG TCGGCCCTCA GACCTTCGCG CTTCGGGATT CCGCTGAAAT ACCGAGCGGC 
GCTGAACCGG TTCCTGCGTT CGTCGAGGAC ACTCCAAAAC CGCCTTCTGT AAATGCAGGT 
TTCTCCTTCA CCGATTGCGC TCAGAAAGTG CTTGAGACGT TCGGCGGCAA GAAGCCGATG 
CATTACAAAG AGATCACCGA GAAGGCCCTG CAAAAAGGCT GGCTGGTAAC CGGCGGCAAG 
ACGCCCGAGG CCACCATGTA CGCCCAGGTG ATCACCGAGA TCAAGCGCCA GCAGAAATGT 
GGTGAGCGGC CCCGCTTCGT TCAGCACGGC CGTGGCAATG TGGGCCTGAG CCAATGGATG 
GGGCGTGGGT TGGCGTTCCA GATCGAGCAG CACAACCACC AGGTCCGGAA AGTCTTGCGC 
GAACGACTGC TGGCCATGAA GCCCGGCGAG TTCGAGGAAC TTATCTCGCA GTTGCTGGCG 
GAGATGGGTT TCGAGATGGT CGAGGTAACC AAACTCAGCG GAGACGGCGG CATCGATGTC 
CGGGGCACCT TGGTGGTCGG TGACGTGGTC CGCATCAAGA TGGCCGTCCA GGTCAAGAAA 
TGGAAGCTCA AGAACAACAT CCAGGCTCCG GTGGTACAGC AGGTGCGCGG CAGTTTGGGG 
GCGCACGAGC AAGGCCTGAT CATCACCACC AGCGACTTCA GTGCCGGAGC CATCAAGGAA 
GCGGCCCAGT CCGACAAGAC CCCAATCGCC CTGATGAACG GGGAACAGCT TGTAATGCTG 
CTGATGGAAC ACGGCATCGG CGTCCATCGC TCGACGCCTG ATCTTTTTGA AATTGATGAA 
GAGTGTGCCG TAAGAGCTGA AACAGAATGA

Protein sequence

MDVKTAAIQV LQQAGTELHA KDIAEQIMAA GLWQSGGKTP DATVSARLYS DIKNNGDKSP 
FVKVGPQTFA LRDSAEIPSG AEPVPAFVED TPKPPSVNAG FSFTDCAQKV LETFGGKKPM 
HYKEITEKAL QKGWLVTGGK TPEATMYAQV ITEIKRQQKC GERPRFVQHG RGNVGLSQWM 
GRGLAFQIEQ HNHQVRKVLR ERLLAMKPGE FEELISQLLA EMGFEMVEVT KLSGDGGIDV 
RGTLVVGDVV RIKMAVQVKK WKLKNNIQAP VVQQVRGSLG AHEQGLIITT SDFSAGAIKE 
AAQSDKTPIA LMNGEQLVML LMEHGIGVHR STPDLFEIDE ECAVRAETE