Gene Dgeo_3043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_3043
Symbol
ID	5687741
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_009939
Strand	+
Start bp	132028
End bp	133380
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	56%
IMG OID	641262508
Product	IS605 family transposase OrfB
Protein accession	YP_001527782
Protein GI	158421555
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01765] transposase, putative, N-terminal domain [TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGATTA CGCTCACCGC CAAACTGAAG TTGCGGCATA CTCCAGAGCA GAAGAAAGCT 
CTGGACGCCG TAACTTTGGC GTACCGTGAC GCGCTGAACT TCACCTCCCA GAAGGCGTTT 
GAAATGGGTA AAACCAGCAA CGCCGCCAAG ATCCAGAGAG AGGTGTACGC AACTCTGCGG 
GAAAGGTTCG GGCTGGGCGC TCAAATGGCC TGCTCCGTGC CGCGTTACGT TGGAGCCGTC 
TACAAAACTC TCTGGGCGAA GGCCAAACAG AGTAAGGCAG CGCGTGAGGT CAACCCCAAA 
GCCAAGCGGT ATAAGGGACT GGACAACGCG CCCAAGTTCG TTTCTCGCAC CCTGAGCTAT 
CAGTACCAGC GCGATTACTC GTTCAAGAAA GGCCAGCAGG TGAGTATTTC CACCCTGAAT 
GGCCGTGTGG TGTTGCCCTA TGAAGGCTAC GCCAAACACC TTGAATACAT CGCGCAGGGG 
GCTGAAATTG GGGCAGGCAA ACTCTGGTAC AGCAAAGCCA AAAAGCAGTA TTTCCTTTTG 
GTTCCGCTGA CCTTTGAATT GCCCGACCCC GACCCCATGA CCCATAAACA GGTGGTGGGG 
GTGGATGTGG GAATGCGCTA CTTTGCCACT GCATCGAACA CCTCTGGGAA AGCTCTTTTC 
AAGTCGGGTA AGGCCACGCT GCGTAAAGCA GAGCGGTTCC AAAAGGCCCG CAAATCGCTT 
CAGCAAAAAG GCACTCGTTC CGCCGTGCGC CGTTTGGTGC AACTATCGGG CCGAGAAAGA 
CGGTTTATTG CTGACGTTAA TTCGTCTCTC GCTGTCCAAA TCCTCAAAGC CTTTCCCCAT 
GCCTTTATCG GCGTCGAGGA ACTGACTGGA GTCCGTGAGC GCACCGAACG GCGCAGCCGG 
AAGAACAGTT CCGAGAAAAC CCGGAAGGCA AACCGTAGAC GTGCAAGGTG GAGTTACGCC 
GAGTTGCTGG GCTTCCTGGC CTACAAAGCA CCGTTGCACG GTTCTATGGT GGTTAAAGTT 
GACGCCCATT ACACCAGCCA AACCTGCCCC AGGTGTGGAC ACTGCTCAAG AGAGAACAGG 
CCGCACAAGG GGCTGATGTT TATCTGTGAA AGCTGTGGGT ATCAGTTGCA CGCTGACCTT 
GTAGGGGCAA GGAACATAGG ACTCAGGGCA TTGCTTGTCC GGCAAGACTG GGCAAGCACG 
GGGTGTTTGT CATGCACCCC TGGTCGCCCT CAAAGCGCAG ACCCGCAAGC TGGGTCTGCT 
GGGCGAGATG TGTCGGACGC TGAAGCCAAA GCTGAGCGCC TGAAAAGGTA CTCAGAATTG 
CGGTGGAGTC CAGACGCAAG CCCCCGCCTT TAG

Protein sequence

MKITLTAKLK LRHTPEQKKA LDAVTLAYRD ALNFTSQKAF EMGKTSNAAK IQREVYATLR 
ERFGLGAQMA CSVPRYVGAV YKTLWAKAKQ SKAAREVNPK AKRYKGLDNA PKFVSRTLSY 
QYQRDYSFKK GQQVSISTLN GRVVLPYEGY AKHLEYIAQG AEIGAGKLWY SKAKKQYFLL 
VPLTFELPDP DPMTHKQVVG VDVGMRYFAT ASNTSGKALF KSGKATLRKA ERFQKARKSL 
QQKGTRSAVR RLVQLSGRER RFIADVNSSL AVQILKAFPH AFIGVEELTG VRERTERRSR 
KNSSEKTRKA NRRRARWSYA ELLGFLAYKA PLHGSMVVKV DAHYTSQTCP RCGHCSRENR 
PHKGLMFICE SCGYQLHADL VGARNIGLRA LLVRQDWAST GCLSCTPGRP QSADPQAGSA 
GRDVSDAEAK AERLKRYSEL RWSPDASPRL