Gene Dtox_3938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3938
Symbol
ID	8430953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	4113068
End bp	4114486
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	45%
IMG OID	645036156
Product	RNA polymerase, sigma 54 subunit, RpoN
Protein accession	YP_003193254
Protein GI	258517032
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000403843
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.477567
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATGG GTTATGGCTT GCATGTTGAG CAGACACAGA AATTAATCAT GACCCCGGAA 
TTGCGCCAGG CCATTACCGT TTTACAGTTG TCTTCCCTTG AGTTGAGCAT GTATATAGAC 
CAGCAGTTGC AGGAAAACCC TATGCTGGAG GTTCGAGAAG ATGATTTAGA CCGGATTGAG 
GAAAATGAGG GAGCAGAAGG CGACGCTAGC GGGGGGGAAG AGGAATTATC CCGGCAGGAA 
TGTGATGTGG ACTGGGAAGA ATATTTTCAC GACAGTGACT TGGATTTGGG CCGCAGGGAA 
AAATTAGCGG AGCAGTCCGG GAGCGGCTAT GAAAATTTTT TAACGCAGGC TCCAAATCTA 
ACTGAATATT TGATGATGCA GTTAAATTTG AGCCGGTGCG GGGATTATTT AAAAGCTATC 
GGTGAGTATA TTATAGGTAA TGTTGACCAC AACGGCTACC TGCACGTGTC AGTGAAGGAG 
ATTGCCGAGC AATTAGAGGT AAGCCAGTCT AAGGTGGAGC AGGCTTTATC TGTTATTCAA 
TCCTTTGATC CGCTTGGTGT CGGCGCTTCG TCTTTGCAGG AATGTTTGCT TATTCAGGTG 
CGGTATTTGA ATATAAAAAA TAAGCTGGTT GCGGAACTGA TTGAAAAATA CTTGCCGGAT 
ATTGCTAAAG GCAGGCTTAA CCAGATAGCT CAGCAGTTAG GAGTTGCAGT GACGGAGGTG 
CAGGAGGCAG CAGATATTAT TAAGACGCTG GATCCCAAGC CCGGGCGCAA TTTTAGCGCT 
ACGAACGATG TTCGCTATAT TGTTCCGGAT GTGATAGTAG AGAGAGTCGA AGGAGAATAT 
ATTATTCTGG TTAACGATTC ATCGGTGCCT CGCCTGACTA TAAATACTGC ATATCGCTCT 
GTTTTAACAC AGGATAAGTT TGATCTTCAG ACTCGCCGTT TTGTAGAAAG TAAACTCAAT 
TCCGCTGCCT GGTTGTTGAA AAGTATTGAG CAGAGGCGCC TGACTTTATA TAAAGTAGCC 
AGTTGCTTAG TTGATTTGCA GAAGGATTTT ATGGAATACG GTGTCAAGCA TTTGAAACCG 
CTTAATTTAA AAACTGTAGC GGAAATAGTT GGCTTGCATG AATCGACTGT GAGCAGGGCC 
ACCTCCAATA AGTACATTCA AACCCCGCAA GGCGTGTTTG AGATGAAATT TTTCTTTTCT 
ACCGGCCTGA CTTCCGCCGG TGGAGGAATG ACTTCGGCTG AGAGTATTAA GAAGACACTC 
AGAGAATTGA TTGCGTCTGA AGATGCCAGA AAACCGCTTA ATGATCAGAA GATCTCGGAT 
ATTTTTGCCG AGCGAGGGAT AAAGATTTCT CGCAGGACGG TGGCTAAATA CAGGGATGAA 
CTGAATATTC CTCCTTTGAA GCAGAGAAAA CGCTATTAA

Protein sequence

MRMGYGLHVE QTQKLIMTPE LRQAITVLQL SSLELSMYID QQLQENPMLE VREDDLDRIE 
ENEGAEGDAS GGEEELSRQE CDVDWEEYFH DSDLDLGRRE KLAEQSGSGY ENFLTQAPNL 
TEYLMMQLNL SRCGDYLKAI GEYIIGNVDH NGYLHVSVKE IAEQLEVSQS KVEQALSVIQ 
SFDPLGVGAS SLQECLLIQV RYLNIKNKLV AELIEKYLPD IAKGRLNQIA QQLGVAVTEV 
QEAADIIKTL DPKPGRNFSA TNDVRYIVPD VIVERVEGEY IILVNDSSVP RLTINTAYRS 
VLTQDKFDLQ TRRFVESKLN SAAWLLKSIE QRRLTLYKVA SCLVDLQKDF MEYGVKHLKP 
LNLKTVAEIV GLHESTVSRA TSNKYIQTPQ GVFEMKFFFS TGLTSAGGGM TSAESIKKTL 
RELIASEDAR KPLNDQKISD IFAERGIKIS RRTVAKYRDE LNIPPLKQRK RY