Gene Dgeo_1840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_1840
Symbol
ID	4057570
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	-
Start bp	1951169
End bp	1952164
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	63%
IMG OID	641230868
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_605304
Protein GI	94985940
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.171686
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.370097
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATCAAA AGCGCCCTCA ACTCAAGGCC CGCGTGGAGG GAGATTACGG CGAGTTCGTC 
CTCGAACCGC TCACGCGCGG CTACGGCGTC ACCATCGGGA ATCCCATCCG GCGCATCCTG 
ATGTCCTCGA TTCCCGGTAC TGCCGTGACG AGCGTCTACA TCGAGGATGT CCTGCACGAG 
TTTTCCACTA TCCCCGGCGT CAAGGAAGAC GTCATCCGCA TCATCCTGAA TCTCAAGGAA 
CTTGTGGTGA AATTCCACGC GCCTGGCCCG AAGACCCTGA CACTGCGGGC GCAGGGTGAG 
GGTGTGGTCA AGGCCAGTGC CTTTGAGGTT CCAAGTGATG CCGAGATCGT CAACCCCGAC 
CTGACGATCG CCACCCTCGC GGAGGATGGC AAGCTGGTCA TGGAGGTGCG CGTCGAGGAG 
GGCGAGGGCT ATGTCCCGGC CGACAAGCAC GCCACCAAGG ACCGCATCAA CTCGATCCCG 
GTGGACGCTG TGTTTTCTCC GGTTCGGCGC GTGGCTTATC ACGTTGAGAA CACTCGTGTG 
GGCCAGCAGA CCGACCTGGA CCGCTTGATT CTGCGGATCT GGACAGATGG CAGTGTCGGC 
CCCCAGGAGG CGCTGGACCG GGCGGTGGAG ATTCTGCGTG ATGAGCTGAC CGTGTTCGGC 
AATGTCGAGA CGGTGTCGGC TGCTGCACCC GAATTGCCGT CGGTCTATAC GCCTGCTGCT 
CCCATCGTGA GTGGCTACGA CCTGCCGCGC CAGCCCGAAC TCAGCATCAA CCCCCAGCCG 
TACCCCGCTG ACCTCGACAC GCCCCGCGTG ACGCTGGAAG GCTTGGGCCT CACCACCCGA 
GTGCTGCACT CGCTCAAGGA AGAAGGCATC GACTCGGTGG ACGCCCTGTG CGCCCTCTCC 
GACCGTGACC TGAAGAAGGT GCCTGGCATC GGTGAGCGCA GCCTGGATGA GATCAAGCAG 
CAGTTGGCCC AGTTCGGCCT GGCGCTGCGG GACTGA

Protein sequence

MDQKRPQLKA RVEGDYGEFV LEPLTRGYGV TIGNPIRRIL MSSIPGTAVT SVYIEDVLHE 
FSTIPGVKED VIRIILNLKE LVVKFHAPGP KTLTLRAQGE GVVKASAFEV PSDAEIVNPD 
LTIATLAEDG KLVMEVRVEE GEGYVPADKH ATKDRINSIP VDAVFSPVRR VAYHVENTRV 
GQQTDLDRLI LRIWTDGSVG PQEALDRAVE ILRDELTVFG NVETVSAAAP ELPSVYTPAA 
PIVSGYDLPR QPELSINPQP YPADLDTPRV TLEGLGLTTR VLHSLKEEGI DSVDALCALS 
DRDLKKVPGI GERSLDEIKQ QLAQFGLALR D