Gene Dgeo_0054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_0054
Symbol
ID	4058495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	-
Start bp	50524
End bp	52458
Gene Length	1935 bp
Protein Length	644 aa
Translation table	11
GC content	71%
IMG OID	641229050
Product	hypothetical protein
Protein accession	YP_603526
Protein GI	94984162
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGCCG CTCCTAACCC TTCTGAACCC CTCCACCGTC TCCCGGTGCG GCTGCTGGGC 
GATCTCATCT CGCCACGCGC GCTGGAGCGC ATCTTGCAAG ACGCAGCGCA GGCCCGGGGC 
CGGACGCCCG AGACCCTCGA CGCCCCCACG CTCGAAGACA TCCTCAAGCG CGAGGTCTTT 
AAGCGGCTGC AACTGAGCGT GCCCGCTGCG CTCGCCAAGC GCCGGGTGTC GGACGTGATC 
AAAGAGGTGC TGGCCGCCAC TCCAGCCCCG CAAACCCCTC GCAGCGGGGA ACAATCACTG 
GAGGTCCTGG AGGAGGGCGC GCGGCGCTTC ACCCTCTATT TTGATTGGCC GGAGACGCAG 
CGGCTGCGCG GCGTGCTGGG GGTGGCCCGG CAGCAACAGC AGGCCGGACA AGACATCACG 
GCGCTGGTGC GCGAAGGCCA GGACCTGATC AACCTGATGG AGCGCCGTCT GCAAGAAGGG 
TTGGTCACGC AGGCACAAGA CCTGGCGGAG CTGCAGGCGG CTTACCAGCG GGTCCAGAGT 
ATGGGCGGTA AGGATGTCCG CCGCCTGGAA GGCCTGATCG CGCAGATCAA GGAGGCGCAG 
AGCCAGGGCG TGCTGCTGCC CGCCGAAGTG GAGCGGGCGC GCACCATCAC GTTCACCCTG 
CGCAAGCTGC TGGAGTCGTC GGTGGTGCAG CCGCTTGAGT CCGGCAAAGC CCCGCCCCTT 
CTCGATCCCG AGGCGCAGGC ACGGGTGCTG GCGCTCGAAC AAGAGCACGT TGCTCGGCAA 
CTGGCCGACC TCGCCCGCGA GTTTGGGCCG TTGGTGCGCG CCCGCCCAGA GCTGGAAACG 
CGCCTGCAGA TCATCCGCAG TCAGCATGCC AGCGGTACGC TCAAGGCCGA GACGGTCGAT 
CTCTGGCGCG CTGAGCTGGA AGCCACCCGC GACCTGGTCC TGGCCTCCCA GCGGGAAGAA 
CTTGCGGGCC TGGAAGCCCG GCTGGCAGCG CTGCCGGAAA GCCCCGAACT GGCCGAGGCC 
CGCACCGCAC TGAACGTGGC TCGGCTCACA CTGGCGGGAG GCGGCCTCGC CACCGATGAG 
CTGCGCGACC TGGGGGGTAC CCTGGCCGCG CTGGAGGCGG CCCCCGCGCT GGCTGCGCGC 
CTGCTCGCCG GTCAGCGCGA ACTGGCCGAA GTGGAGCGGG CCGCTCGGGA CGTGCCCGGA 
GCCAGCGCCG AACTCGCCCC GCAGCTCGCC GCCGCCCGCG AGGCGCTGGC CCGGGGTGAG 
GATGTGGAGA TCGACGCGCT GTGGGCTGCC TTGGAGCGCC GCATGGGTCA GGCGGCCCAG 
CAGCGCCAAG ACTTCGACGC CCGCGCCGAC TTTGTCATCC GCGAATACGA CACCGTGCGG 
CATCTGGCGG GCGAAACCAT TCAGCGACTG GGGCGCCTGG CCGATACCCT GCGCGCGCAG 
CGCCGCCTGG GGCCGATGTC AGCGGACGCC CGCGAGCGGT ACGCCCAGAC CCTCGCGGAC 
GCTGAGGCCC TGCTGACAGA GGCTCGCGCC GAGTATCAGG CGGCCCAGGA GGTGACGGCC 
AGCTTCGGCG CCGAGGCCCT CAGCGGCCTG CTTGATGTCT TTGATTTCGG GGGGGACCCG 
GCGGGCGATC TGTTTGGCGC CGCGGCCCCC ACTGAACAGA TGCCCGATGC CGCCGGTCTC 
CCCGACGACA CCTGGCTGAT TCGGGGGCGC ACGGTGGTGG CAGGCCGCAC GGACCCGGCG 
GTGTCCGGCA TCGCCGCCCT GCTCGAACAG GCCGCGCTGC TGGACGTGCG GGTCCTGCGC 
TTTGAAGATC CTCAGGGGGC TTGGGCGGCA CGGCAAGACG GGGGAGGCGG CTGGCGGCTG 
GCCCGCGGCC CCAACGCCGC CTCCCTAGAA GACCGAGTGG GCGACTGGCT GGCGAGCGGC 
GAGCTCCGGC GTTAG

Protein sequence

MTAAPNPSEP LHRLPVRLLG DLISPRALER ILQDAAQARG RTPETLDAPT LEDILKREVF 
KRLQLSVPAA LAKRRVSDVI KEVLAATPAP QTPRSGEQSL EVLEEGARRF TLYFDWPETQ 
RLRGVLGVAR QQQQAGQDIT ALVREGQDLI NLMERRLQEG LVTQAQDLAE LQAAYQRVQS 
MGGKDVRRLE GLIAQIKEAQ SQGVLLPAEV ERARTITFTL RKLLESSVVQ PLESGKAPPL 
LDPEAQARVL ALEQEHVARQ LADLAREFGP LVRARPELET RLQIIRSQHA SGTLKAETVD 
LWRAELEATR DLVLASQREE LAGLEARLAA LPESPELAEA RTALNVARLT LAGGGLATDE 
LRDLGGTLAA LEAAPALAAR LLAGQRELAE VERAARDVPG ASAELAPQLA AAREALARGE 
DVEIDALWAA LERRMGQAAQ QRQDFDARAD FVIREYDTVR HLAGETIQRL GRLADTLRAQ 
RRLGPMSADA RERYAQTLAD AEALLTEARA EYQAAQEVTA SFGAEALSGL LDVFDFGGDP 
AGDLFGAAAP TEQMPDAAGL PDDTWLIRGR TVVAGRTDPA VSGIAALLEQ AALLDVRVLR 
FEDPQGAWAA RQDGGGGWRL ARGPNAASLE DRVGDWLASG ELRR