Gene Dtox_3036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3036
Symbol
ID	8430030
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	3231531
End bp	3232610
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	46%
IMG OID	645035292
Product	RNA polymerase sigma factor RpoD
Protein accession	YP_003192411
Protein GI	258516189
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0549205
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGGGATG AAAAGAAAGT AGAAAATATA AGAAGCTTGG TAGAGAAAGG CAAAAAGCAA 
GGCTACCTGA CTTACCACGA GATAATGGAT GTTTTGCAAA CTACTGAACT TACGCCGGAT 
CAGATTGATG ATGTTTATGA ACAGTTGTCC GGGATGGGGA TAGATCTCTT AGCCACAGAG 
CCTGAAATGG ATGAGGCGGC AGTAAAACCT GATGAAGACG TTGAAGTTGA TTTGAGTGTG 
CCGGAAGGTA TTGGCATTGA CGATCCGGTT AGGATGTATC TGAAGGAAAT CGGCCGGGTA 
CCTTTATTGT CCTCCGAAGA AGAGGTGGAA TTGGCCAAGC GCATGGAGAT GGGCGAGGAG 
GAGGCTAAGC GGCGTTTGGC TGAGGCGAAT TTACGGCTGG TGGTCAGCAT AGCCAAACGC 
TATGTAGGAC GGGGCATGCT GTTTCTGGAT TTGATTCAGG AAGGCAATAT GGGTTTGATT 
AAAGCAGTGG AGAAGTTTGA TTACCGCAAA GGCTATAAGT TCAGCACTTA TGCTACCTGG 
TGGATCAGGC AGGCGATTAC CAGGGCGATA GCCGATCAGG CCAGAACCAT CAGAATTCCC 
GTTCACATGG TGGAAACTAT CAACAAGCTG ATTAGAGTAT CCCGCCAGCT GCTTCAGGAA 
TTGGGTCGTG AACCAATGCC CGAAGAAATT GCTAAGGAAA TGAACATAAC TGAAGATAAA 
GTCAGGGAGA TTATGAAAAT TGCTCAGGAA CCGGTTTCCT TAGAAACTCC TATTGGTGAA 
GAAGAAGATT CCCATTTGGG CGATTTTATT GAAGATCATG ATGCCCGTGC TCCTGCTGAA 
GAAGCATCCT TTACCTTATT AAGGGAGCAG CTGGATGATG TGTTAAAAAC TCTTACTGAC 
AGGGAGCAAA AGGTTTTAAG ACTTCGTTTT GGTTTGGATG ATGGCCGTGC CCGAACTTTG 
GAAGAGGTGG GCCAAAAGTT CGGTGTAACC CGTGAGCGGA TCAGACAAAT TGAAGCTAAA 
ACACTGCGCA AGCTGCGTCA TCCCAGTCGC AGTAAGAAAT TAAAAGATTA TCTGGACTAA

Protein sequence

MRDEKKVENI RSLVEKGKKQ GYLTYHEIMD VLQTTELTPD QIDDVYEQLS GMGIDLLATE 
PEMDEAAVKP DEDVEVDLSV PEGIGIDDPV RMYLKEIGRV PLLSSEEEVE LAKRMEMGEE 
EAKRRLAEAN LRLVVSIAKR YVGRGMLFLD LIQEGNMGLI KAVEKFDYRK GYKFSTYATW 
WIRQAITRAI ADQARTIRIP VHMVETINKL IRVSRQLLQE LGREPMPEEI AKEMNITEDK 
VREIMKIAQE PVSLETPIGE EEDSHLGDFI EDHDARAPAE EASFTLLREQ LDDVLKTLTD 
REQKVLRLRF GLDDGRARTL EEVGQKFGVT RERIRQIEAK TLRKLRHPSR SKKLKDYLD