Gene Dtox_3877 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3877
Symbol
ID	8430891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	4057263
End bp	4058414
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	42%
IMG OID	645036096
Product	helix-turn-helix domain protein
Protein accession	YP_003193195
Protein GI	258516973
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2856] Predicted Zn peptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.862285
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCAAA AAATTATTGG TGCGAACCTT CGCCGGATTC GCGAGGCCAA GGGTTGGACT 
CAATCCCAGG TAGCCGATCT GGCTGGGATT TCAAGGGTTG CTTATCGAAA TATTGAAAAC 
GGTAATACAA CCCCCAAAGT ATCGACCCTG CAAAACATCG CTTCCGCTGT TGGAGTAAAA 
CTCCAGGATT TATTCATTCC GGTTCGCACC TTAAAGGGAG TCCGATTTCG AGCATCGAAA 
AAGATGAACA GCCGGGACAA TATTTTGACT GAAGTAGCAC ATTGGCTTGA TGATTTTAAT 
TACCTGGAAA GGTTACTAAA TGATCACAAA GACTACCAGT TCGAAGATCT TACCAGGGAG 
TTGTCTTCAA TGCCTCCTGG AGATGACAGA GCTAAGCATG CAGCCGAACG AGTAAGAAAA 
AAATTGAAAC TCAAAGAAAA AGAGCCTATC CGCGATATTG CTGGTCTGCT GGAAGCATGC 
GGGATAAAAG TATACCCTCT GAGTCTTGTA TCAGACGGTT TTTTCGGCTT ATCTGTTGCC 
GGAGAAGATG GCGGCCCTGC AGTCATTGTT AATGTTTGGG GAAGAATATC CGTTGAGCGA 
TGGATTTTTA GCGCTGCTCA CGAACTAGGG CATTTACTTC TTCATTTAGA TACCTATAAC 
ATAGAAGAAA GTTTTGAAGA CAAAGACCAA GAAAATGAAG CAAATGTCTT TGCTTCCCAT 
TTTTTGATGC CAGAAAAAGC TTTTCAAGCT GAATGGATAG ATACTTACGG CTTGTCCTTT 
GTCGACCGGG TTTTTAAAGT TAAGCAAATA TTCCTGGTAA GCTACAAAAC TGTTCTATAT 
CGCCTTTCTG AAAGTCTGGG AAATTCCGTG TGGAAAAAAT TTCAGATTGC TTATAAGATG 
AAAACTGGCA AAACATTGAG TATTGCGGAT GAGCCGGAGG CTTTGTCCCC AGATAAATTT 
CAACAATCAT CGCCAGAAGT ATTGCGTTCC AGAGAACCTG ACTCTCTATC CCCCTCACAC 
TTTATTGAAG ATCGTTTATC TAGATTGGTT CGTAAAGCTA TCGAAAAGGA TGAAATCACC 
ATGAGTCGTG GGGCAGAAAT TCTTAGATTA GATCTTGAGG CCATGCGAGA AATGGTCTCT 
TCATGGGTGT GA

Protein sequence

MDQKIIGANL RRIREAKGWT QSQVADLAGI SRVAYRNIEN GNTTPKVSTL QNIASAVGVK 
LQDLFIPVRT LKGVRFRASK KMNSRDNILT EVAHWLDDFN YLERLLNDHK DYQFEDLTRE 
LSSMPPGDDR AKHAAERVRK KLKLKEKEPI RDIAGLLEAC GIKVYPLSLV SDGFFGLSVA 
GEDGGPAVIV NVWGRISVER WIFSAAHELG HLLLHLDTYN IEESFEDKDQ ENEANVFASH 
FLMPEKAFQA EWIDTYGLSF VDRVFKVKQI FLVSYKTVLY RLSESLGNSV WKKFQIAYKM 
KTGKTLSIAD EPEALSPDKF QQSSPEVLRS REPDSLSPSH FIEDRLSRLV RKAIEKDEIT 
MSRGAEILRL DLEAMREMVS SWV