Gene Dgeo_3109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_3109
Symbol
ID	5687572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_009939
Strand	+
Start bp	199490
End bp	200770
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	60%
IMG OID	641262572
Product	restriction modification system DNA specificity subunit
Protein accession	YP_001527846
Protein GI	158421619
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAATC CGAACTGGAA CTGGCGCCCT TTGGGTGAGC TGTTTGAGAT CGGCGCCGGC 
AAAACGATGT CCGCAGCGGC GCGGGCGGGG GCCGACAAGG TGCCGTTTCT GCGCACATCG 
AACGTCCTCT GGGACGAGAT CGATCTCACC CAGGTCGACG AAATGTCGAT TTCCCCGACC 
GAGTTGGTCG ACAAGAGCCT CAAGGCTGGG GATCTGCTGG TCTGCGAGGG GGGGGAGATC 
GGGCGTGCGG CCGTCTGGGA TGGTCGCGTG CCGGTGATGT CCTTCCAGAA CCACCTTCAT 
CGACTACGCC GCAAACAGGA CGATGTCGAT GCACATTTCT ATGTGTACTT TCTGCAGAGC 
GCGTTCACCC AGCTCGGCAT CTTCGAGGGC GCCGGCAACA AGACAACGAT CCCGAATCTC 
TCGCGCAACC GGCTCGCGGC CCTGGATGTA CCCCACCCCC CTAAGCCGGA ACAGCAGTCC 
GTGGCACAGG TGCTGGCCAA GGTGCGAGAA GCCATCGCTG TTCACGATCA GGCGACATCT 
ACCGCTTTGG AGCTGAAACA TGCGGTGATG AACGACCTGT TCACGCGCGG CCTACGTGGC 
GAGCCCCAGA AAGAAACCGA GATCGGGCTG GTGCCGGAAA GCTGGGCCGA GGTTTCCATC 
GCGGACCTGG GTGAAATCGT TACCGGCACC ACGCCGCCAA CAAGGGAGCG CGCCTACTAC 
GATGACGGGA ACATTCCTTT CATCTCGCCG GGTGACATTG AACACGGGAC CCCCATTGCC 
TCAACGCAGA AGTGCATCAC GGACTCTGGA CTTGCCGTTT CGCGCGCACT TCCCGCAGGC 
ACGACTTGCG TGGTGTGCAT TGGCTCGACC ATCGGCAAGG TCGGACGCAC AACGGCGGCA 
GCCAGTGCCA CCAACCAACA AATCAACGCC ATCGTTCCGG GCGTGGGCTA TGACCCGAAC 
TATCTTTCGC ACTTGCTCAC TTACCAGTCA AACATTGTGC GCAACGCAGC CTCACCCAGT 
CCAGTTCCGA TTCTGAGCAA GGGCGCATTC GAGAAACTCG TCTTGTTCAC CTCGACGAAT 
CCCGATGAAC AGGTAGAGAT TGCCACCATC CTTGACGCCG TCGACCGCAA GATCGACCTG 
CACCAGAAGA AGCGCAAGGT GGTGGAGGAG CTCTTCGAGT CCCTGCTACA CAAGCTCATG 
ACCGGCGAGA TCGCCGTGTC GGATCTGGAT CTGTCGGCAC TAGCCCCGGC CTCGACGCAA 
CTCGAGGAGG CCACGGCATG A

Protein sequence

MTNPNWNWRP LGELFEIGAG KTMSAAARAG ADKVPFLRTS NVLWDEIDLT QVDEMSISPT 
ELVDKSLKAG DLLVCEGGEI GRAAVWDGRV PVMSFQNHLH RLRRKQDDVD AHFYVYFLQS 
AFTQLGIFEG AGNKTTIPNL SRNRLAALDV PHPPKPEQQS VAQVLAKVRE AIAVHDQATS 
TALELKHAVM NDLFTRGLRG EPQKETEIGL VPESWAEVSI ADLGEIVTGT TPPTRERAYY 
DDGNIPFISP GDIEHGTPIA STQKCITDSG LAVSRALPAG TTCVVCIGST IGKVGRTTAA 
ASATNQQINA IVPGVGYDPN YLSHLLTYQS NIVRNAASPS PVPILSKGAF EKLVLFTSTN 
PDEQVEIATI LDAVDRKIDL HQKKRKVVEE LFESLLHKLM TGEIAVSDLD LSALAPASTQ 
LEEATA