Gene Dtox_1987 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_1987
Symbol
ID	8428969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	2144021
End bp	2145175
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	46%
IMG OID	645034314
Product	hypothetical protein
Protein accession	YP_003191445
Protein GI	258515223
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0946014
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAC TAAGAGGATT AAAAATAATA AACATAATAT TAGTCCTGCT CATGATGCTC 
AGCATAGTTA ATCCCGCTCT GGCGACAGGA TTAACTGTCA ATCCCGATCA GCCGGCGTAT 
AGTGGAGGAG AAAAAGCCGC AGTTGCAGCA TCTGTTTATG ACGACGCTAC GAATGCAGGT 
GGCGGCACAG ACGGGAATTC CGACGCTAAA AGCGAGGAAA ACCATGAAAT TGCGGAGGAT 
AATGACTCCG CCGGTGTCAC CGAGCCCCAA AACAGCTCTG ACCAAACTGT GAGCAGCTTG 
GTTTATCCTG CCAATGACAC CGAAAAGCAG GCTGCAAGCC TGGCTGTTGA ACTCAATGAT 
GTTAATCCGG ACCTGGGAAC AGTTAAAGTT CGGGTAGTGG ATAACGTACA AAGACTGGCA 
GGAGATTTGG CAAACATTTC TTCCGATTAC CGGGAACCCT TTGGTGAAAT ATTGCCGTTG 
ACAGAAGTCG AGATTACCGA GGGGCTTACT ATGCGAGGGG CCTTGGAAAA GGCTCTGGCT 
ACAAAAAGTA TAACGGTTTA TGGCGCGGTA GATTATGTAA GTGGGATTGG TCCTGTTACA 
TCTGCCGACG GAAGCAGAAA AGTTGCCAAG CTTTCCGAGT TTGACAGTGG CAGCCAGAGT 
GGCTGGATGG TCACACTAAA TGATTGGTTT ATCAATGCGG GGGCCAATAC CTTTACAGTT 
AAGGACGGCG ATGTGGTAGA ATTCTGCTAC ACATGCAATC TGGGGGCTGA CCTTGGCTCC 
GGCTTTAACA ACCCGGATAC ATCCTTAAAA GCCCTTTCCG TTAATAAAGG AGTCCTTAAC 
CCGGTATTTG CGCCCGGAAC CAAAGAATAT ATATTAACTC TGCCTGCAGC AACACAAATA 
ATGGTTACTC CTACCGCTGC AAACAAAAAC AATAAGGTAA CAATTCAGTC GGGAGACGTA 
ACCTATCGCA GTACAGATGA AATTGCCGTT GCAGATGAAC AAGTAATCAC TGTTAAATGC 
GGTCAGAACA CCTATAAAAT AACCGTAGCT GTCTCAAATA ATGACCAGAG CAGTGCCGAC 
GCGGTCAATG ATTTAATTGA GGCACGTTTA CCCAGTATGA TATTGCCACA AGCAACGGCA 
TTCAAATCGA ATTAA

Protein sequence

MKKLRGLKII NIILVLLMML SIVNPALATG LTVNPDQPAY SGGEKAAVAA SVYDDATNAG 
GGTDGNSDAK SEENHEIAED NDSAGVTEPQ NSSDQTVSSL VYPANDTEKQ AASLAVELND 
VNPDLGTVKV RVVDNVQRLA GDLANISSDY REPFGEILPL TEVEITEGLT MRGALEKALA 
TKSITVYGAV DYVSGIGPVT SADGSRKVAK LSEFDSGSQS GWMVTLNDWF INAGANTFTV 
KDGDVVEFCY TCNLGADLGS GFNNPDTSLK ALSVNKGVLN PVFAPGTKEY ILTLPAATQI 
MVTPTAANKN NKVTIQSGDV TYRSTDEIAV ADEQVITVKC GQNTYKITVA VSNNDQSSAD 
AVNDLIEARL PSMILPQATA FKSN