Gene Dtox_3034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3034
Symbol
ID	8430024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	3229053
End bp	3230174
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	45%
IMG OID	645035286
Product	protein of unknown function DUF34
Protein accession	YP_003192409
Protein GI	258516187
COG category	[S] Function unknown
COG ID	[COG3323] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR00486] dinuclear metal center protein, YbgI/SA1388 family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.849304
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGTAG CTAACAAAGA AATAGTTAAG CTGGTTGAAA ATTTGGCTCC TTTGAGGTTG 
GCCGAGGAAT GGGACAATTC GGGCTGGCAG CTGGGCGACC CGGGTGCCCC GACTGCTAAA 
GTGATGCTGA CCCTGGATAT AACACCTCCT GTTGTGGAGG AAGCTGCCGC TGCCGGTGCC 
GGATTGATTA TCAGTCACCA CCCAATGTTT TTAAAAGGGC TGAAAAACCT CTGCCTGGAC 
CGGCCTGAGG GAAAACTAAT TGAGGCTTTA ATAAAAAAAG ATATAGCTGT ATATTCTGCT 
CATACCAATC TGGACAGCGC GGCAGGCGGA GTGAACAGTG TTCTGGCTGA ACAGTTGGGC 
TTAATTGAAG TCGATAATAT GCTTCCCGGT AAAGCGGAGC AGCTTTACAA ATTAGTAGTT 
TTTGTACCGC TTGAGCAGGT TGAGCAAGTC AGAACCGCCA TTACAGAGGC GGGTGCAGGT 
TGGATTGGCA ATTACCGGGA TTGTGCTTTT CAGTCAACAG GTATTGGTAC CTTTCGACCG 
CTGGAAGGCA GCAAGCCTTT TATAGGACAA ACGGGCCTGC TGGAAAAAGT TGAAGAATTC 
CGTTTGGAAA CTATCGTGCC GGAAAAAGAT AAAAAAAGCG TTATAGCAGC TATGCTTAAC 
GCTCATCCTT ACGAGGAAGT TGCTTACGAT TTATATCCTC TGGCCAATAA TACAGCCGGA 
CATGGTTTAG GTAGAATAGG TTGTTTGCCG CAGGAAGTAT CTCTAGGTGA TTTTGCTAAA 
CTGGTAAAAA TGACCTTGCA GGTTGATGCT GTTCGTCTGG GGGGAAATGA ACACGGAAAA 
CCTGTACGTA AAGTTGCTGT TTGTGGAGGG GCCGGGGCAT CTTTATGGAA GCAGGCTTTG 
AGTAAGGGTG CTGATGTTTA TGTTACCGGA GATATTAAGT ATCATGAGGC TTTGGATATG 
TCAACGGCGG GCCTAAGTTT CATAGATGCG GGCCATTTCC CCACTGAGAG AATTATTCTG 
CCTGTTTTAT ATAAATATCT GATCAAAGTA TGCTCTAAGC ATAATTTTGC TGTGGATATA 
TTGCTTTCTC AAAAGCAAAA TGATGTTTTT GTGTATGTTT AA

Protein sequence

MAVANKEIVK LVENLAPLRL AEEWDNSGWQ LGDPGAPTAK VMLTLDITPP VVEEAAAAGA 
GLIISHHPMF LKGLKNLCLD RPEGKLIEAL IKKDIAVYSA HTNLDSAAGG VNSVLAEQLG 
LIEVDNMLPG KAEQLYKLVV FVPLEQVEQV RTAITEAGAG WIGNYRDCAF QSTGIGTFRP 
LEGSKPFIGQ TGLLEKVEEF RLETIVPEKD KKSVIAAMLN AHPYEEVAYD LYPLANNTAG 
HGLGRIGCLP QEVSLGDFAK LVKMTLQVDA VRLGGNEHGK PVRKVAVCGG AGASLWKQAL 
SKGADVYVTG DIKYHEALDM STAGLSFIDA GHFPTERIIL PVLYKYLIKV CSKHNFAVDI 
LLSQKQNDVF VYV