Gene Dtox_3662 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3662
Symbol
ID	8430670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	3849481
End bp	3850650
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	44%
IMG OID	645035889
Product	integrase family protein
Protein accession	YP_003192994
Protein GI	258516772
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000552191
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGGCT GGGTTGAATC TCGTGGTAAA AACAAATGGC GATTAAATGT CCCTGATGGG 
ACTGGCCCGG ATGGAAAACG TATCACTCAC AGAAAAGTAG TTGAAGCTAC CAGTGAGCGC 
GAAGCTAAAA AACTGCTGGA CGTTTTCTCT GCTGAAGTCC AAAAGGGCCA GTATATCGCA 
CCATCAAAAT TAACTTTCAA AGAGTTCAGT CAAAAATGGC TTGAAAGCAA AAAGGACTTA 
GCACCAAAAA CCTTATATCG GTATAAGGAG ATATTAAACT CCCGAATATT ACCGGCAATG 
GGGCACCTTA AGATTGAAGA CATTAAGCCA TTTCATATAA TGCAGTTTTA TGGCAATTTA 
CAAGAACCCG GTATAAGGGA GGATGGCAAA GAAGGTACAT TATCGCCAGC TACTGTCCTT 
TATCACCACC GACTGCTGAC CAATATATTC AATGCAGCCG TTAAATGGCA AATAATCCTT 
ACCAATCCCG CCCTACGTGT GGAGGCACCC AAGGCCAAAA AGCATAAGGC TACTTCCTAT 
GAGGAAGAAG ACACTGCAGC TTTACTCAGT GCATTGGAGG AACAGCCGCT AAAGTTCCAG 
GCAATTGTTT ATATTGCCCT TGGTTGTGGT CTTCGTCGCG GTGAGATCAT GGGCCTGGAA 
TGGAAGGACA TTGATCTCAC AAAAGGTACA CTGGAGGTAA GACAGTCCAG CCAGTACCTA 
CCCGGTCATG GTACGTTTGC AAAGTCACCT AAGAATGAAA GCTCAGAACG CATTATTGCC 
GTTCCTACAG AAACAATGTC GCTATTAAAA CAGCACAGAG TACAGCAAAA TGAGCAGCGT 
TTACAAGTAG GCGGCCTGTG GCAAGCCTCA GATAGACTAT TTACTACCTG GGACGGAAAA 
CCGATGCACC CGGACAGTAT AACAAAATGG TTTAGTGGTT TTCTAAAAAA CAACAACCTG 
TCTCCATTGC CTTTTCATGG TTTGCGCCAT ACTGCAGCCA GCTACATGAT TAAGGCCGGT 
ATCCCGCTTA AAAATATAGC CAGCCGCCTG GGTCATAGTT CACCCAACAC AACCCTAAAT 
ATTTATGCCC ACAGTTTTAA GTCTGTTGAT GCAGAAGCAG CCAATAAAAT GAATGATATT 
TTAACCACAC GAAAAAAAGG ACAGGCTTAA

Protein sequence

MAGWVESRGK NKWRLNVPDG TGPDGKRITH RKVVEATSER EAKKLLDVFS AEVQKGQYIA 
PSKLTFKEFS QKWLESKKDL APKTLYRYKE ILNSRILPAM GHLKIEDIKP FHIMQFYGNL 
QEPGIREDGK EGTLSPATVL YHHRLLTNIF NAAVKWQIIL TNPALRVEAP KAKKHKATSY 
EEEDTAALLS ALEEQPLKFQ AIVYIALGCG LRRGEIMGLE WKDIDLTKGT LEVRQSSQYL 
PGHGTFAKSP KNESSERIIA VPTETMSLLK QHRVQQNEQR LQVGGLWQAS DRLFTTWDGK 
PMHPDSITKW FSGFLKNNNL SPLPFHGLRH TAASYMIKAG IPLKNIASRL GHSSPNTTLN 
IYAHSFKSVD AEAANKMNDI LTTRKKGQA