Gene Dtox_0934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_0934
Symbol
ID	8427873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	954254
End bp	955882
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	50%
IMG OID	645033276
Product	aldehyde oxidase and xanthine dehydrogenase molybdopterin binding
Protein accession	YP_003190450
Protein GI	258514228
COG category	[C] Energy production and conversion
COG ID	[COG1529] Aerobic-type carbon monoxide dehydrogenase, large subunit CoxL/CutL homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00530941
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.265769
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGAGC CTTTAAAAGT CGGGCGGTCA ATACCAAGGT TGGATGCGGA AGACAAGGCA 
GCGGGAAGAG AAAAATATGC GGCAGACTAT TATCCGGAAG ATTTCCTTGT CATAGGCATC 
AAGAGATCAC CCTATCCACA TGCGCGGGTT TTACAGATTG ATTCCTCGAA GGCAAAAAGA 
ATACCGGGTG TTGTTGCTGT GTTGACTCAC CGGGATATAG CGGGTTCCAA TCAACTGGGC 
ATTATTGTGA AGGACCAGCC TGTACTGGCC CGAAATGTTG TGCGTTTCAT CGGGGATGCC 
GTAGTGTTGG CTGTTGCGGA AAACAAAGAA GTTCTGGAGG AAGCGCTTGC TCAAATTGAG 
GTGGAGTATG AGCCGCTGAC TCCTTTATTT TGTCCCCAAG CTGCTCTATT AGAAAACAGT 
GTAAAAGTCC ATGCCGACTG GCAAAACGGA AATATCCTTT TGGCAGGGAA GCTTGAAACA 
GGCAATGCCA AAGAGGCACT TGGGGACTGT GCGCACAAGG TGAGGGTTGA ATTGCAACTG 
GGATGCCAGG AGCATGCCTG CCTGGAAACC GAATGCGGTG TGGCCTGGAT TGAGGATGAC 
GGTAATATGG TTATCACTGC ATCCACCCAG AGTCCTTTCC GGGACCGGCT AGAACTGTCA 
CATGCATTGG GGATACCACC GGATCGCATA CGTGTTATAG CACCCTTTCT GGGTGGTGGC 
TTTGGCCGCA AGGACGGAGT ATCTGTACAA GCCTATTTGG CACTGGCAGC GTTAAACTCC 
AACGGAAGAC CGGTAAAAAT ACAGTTATCA AGGGAAGAGA GCATTGCAAC GGGGACAAAA 
AGACACGCAG CTGAGATTTG CGTAGAACTG GGTTGTGATA CGCAAGGCAA GCTTTCGGCT 
CTTTGTTGCG ATGTTTTGAT GGACACCGGA GCCTATGCGT CACTGGGAGG GGAAGTATTG 
ACATTGGGGA TGGAACATGC CGGAGGTCCT TACCGTATTC CCAATGTTAT TATTGAGGGC 
AAGGCGGTAT ATACAAATAA CGTTCCGGCC GGCGCTTTCC GTGGTTTTGG CGTTCCACAA 
ACCACAGCGG GAATTGAGCA GGCGATGGAC GAATTGGCTA AAGTCGCCGG GTTTGACCCG 
CTTATATTCC GGTTGGTAAA TGCAGTTAAA CAGGGGGAGA GAAATTCAGC CGGGGTGATT 
ATGACCCAAT CCGTCGGATT AACTGCCTGT CTGGAAACAG TAGCTGCCTG CCCTGAGTGG 
AAAGATCGCC AAAATTGGAT AAACAGTGCG CCGCCTTTTA CGCGGCGTGG TGTCGGTTTG 
TCAGCTATGC ACCATGCTCA GGGATTTGGG CCTGTAATTC CTGACAATGC CAATGCCAAA 
ATCGAGCTTG ACCCAGAGGG CTGTTTTATC ATTTATGTGG GTGTGGCGGA TATGGGACAG 
GGCAATGCCA CAACTTATCT GCAAATAGCA GGGGATATTT TAGGCCAGGG CTTTGACCGG 
CTGAAAATGG TTTTGCCGGA TACCCAAAAA GCTTTGCCTT CCGGCTCATC ATCTGCCAGC 
CGCACAACAT TTACCTTTGG GAATGCAGTT ATCGGTGCTG CCAGACTTCT GTCGGGACGT 
ATTATATAG

Protein sequence

MNEPLKVGRS IPRLDAEDKA AGREKYAADY YPEDFLVIGI KRSPYPHARV LQIDSSKAKR 
IPGVVAVLTH RDIAGSNQLG IIVKDQPVLA RNVVRFIGDA VVLAVAENKE VLEEALAQIE 
VEYEPLTPLF CPQAALLENS VKVHADWQNG NILLAGKLET GNAKEALGDC AHKVRVELQL 
GCQEHACLET ECGVAWIEDD GNMVITASTQ SPFRDRLELS HALGIPPDRI RVIAPFLGGG 
FGRKDGVSVQ AYLALAALNS NGRPVKIQLS REESIATGTK RHAAEICVEL GCDTQGKLSA 
LCCDVLMDTG AYASLGGEVL TLGMEHAGGP YRIPNVIIEG KAVYTNNVPA GAFRGFGVPQ 
TTAGIEQAMD ELAKVAGFDP LIFRLVNAVK QGERNSAGVI MTQSVGLTAC LETVAACPEW 
KDRQNWINSA PPFTRRGVGL SAMHHAQGFG PVIPDNANAK IELDPEGCFI IYVGVADMGQ 
GNATTYLQIA GDILGQGFDR LKMVLPDTQK ALPSGSSSAS RTTFTFGNAV IGAARLLSGR 
II