Gene Dtox_0178 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_0178
Symbol
ID	8427102
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	199343
End bp	200674
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	51%
IMG OID	645032567
Product	4Fe-4S ferredoxin iron-sulfur binding domain protein
Protein accession	YP_003189756
Protein GI	258513534
COG category	[R] General function prediction only
COG ID	[COG4624] Iron only hydrogenase large subunit, C-terminal domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAAAT ATTTTCACTC TGTAAGACTG GACGAAGATA AGTGCAAAGG CTGCACCAAT 
TGCGTCAAAC GCTGCCCCAC CGAGGCTATC CGGGTAAGGG AAGGACGGGC TCTAATTATT 
GAAGAACGCT GTATCGACTG CGGTGAGTGC ATAAAAATTT GCCCGAACCG GGCTAAACTG 
GCCACAACTG ACGGGCTGGA GCAGCTGCAA AACTTTCATT ACACCATCGC ACTGCCTGCT 
CCTTCTCTTT ATGCGCAATT TGAGCCTAAT ACCAGTCCCG AACAAATATT AGGCGCACTT 
TTAAACATAG GCTTTGACGA TATTTTCGAA GTAGCCCTGG GAGCCGAGGC AGTTTCACTG 
GCTCTGAGAG ATTACCTTAG CCGCGATCAT CCAAGGCCCA TGATTTCTTC CGCCTGTCCG 
GCCGTACTCA GGCTGATGCA GGTGCGTTTT CCCGGACTAT TGCAGCACAT AGTGCCAATC 
GAGACACCTA TGGAAATTTC AGCCGGGCTG GCCAGGGAAA AGGCCCGTCA GCAGCATGGC 
TTCAGTGACA ACCAGATAGG CGTCTTTTTT ATAACTCCCT GCCCGGCCAA AGTAACTGCC 
ATAAAACAAC CATTCGGGGA AAAATCCTAT GTGGACGGCG CTATTTCAAT GTCCGTAATC 
TACGGCGAAC TGCTGCATAG TCTTGATTCA CCATCAACGA AACAATTACC TTTATTATCA 
GGAGCCAGGG GTGTGGGCTG GGGAAAAGCC GGAGGAGAAA ACCATGCCAT CAGGTGCCAC 
TCACATCTGG CTGTAGACGG TATTCACAGT ATTATCAACG TGCTGGAGGA AATTGAAAGA 
GGTGGCTTAA GCGATATAGA TTACCTGGAA GCACAGGCCT GCACCGGCGG CTGTATCGGC 
GGCCCGCTGG CGCCTCAAAA TCTGTTCGTA GCACGCGTTC GCATGGATAA CCTGGTCAAA 
AAGCTGAGTT TGCAACCGGA CAGGCCAAAG AGTTTATCAA CGGATCCGGA GTTCTTACGC 
CTGAATAAAC CAATTTTGCC CAGACCCGCC CTAAAACTGG ACCAGGATAT TAACCGGGCT 
ATTGAAATGC TGGAAGAAGT TGAAAAGATA ACGGAAGATT TACCCGGTCT GGATTGCGGT 
TCTTGCGGCT CTCCAAACTG CCGGGCACTG GCGGAGGATA TTGTCAGGGG CTACGCGGAT 
ACCAGCTTCT GCATCTTCAA ACTCCGTCAA AGGCTGCAGA TTTTAGCCCG TGAGATAGTG 
GACCTATCCC ACAAGCAGCC CCCGGCCATG GGCAGAGAGA GGGAAAAAGA ACTTAAAGAA 
GGTGATGCCT GA

Protein sequence

MQKYFHSVRL DEDKCKGCTN CVKRCPTEAI RVREGRALII EERCIDCGEC IKICPNRAKL 
ATTDGLEQLQ NFHYTIALPA PSLYAQFEPN TSPEQILGAL LNIGFDDIFE VALGAEAVSL 
ALRDYLSRDH PRPMISSACP AVLRLMQVRF PGLLQHIVPI ETPMEISAGL AREKARQQHG 
FSDNQIGVFF ITPCPAKVTA IKQPFGEKSY VDGAISMSVI YGELLHSLDS PSTKQLPLLS 
GARGVGWGKA GGENHAIRCH SHLAVDGIHS IINVLEEIER GGLSDIDYLE AQACTGGCIG 
GPLAPQNLFV ARVRMDNLVK KLSLQPDRPK SLSTDPEFLR LNKPILPRPA LKLDQDINRA 
IEMLEEVEKI TEDLPGLDCG SCGSPNCRAL AEDIVRGYAD TSFCIFKLRQ RLQILAREIV 
DLSHKQPPAM GREREKELKE GDA