Gene Dtox_2981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_2981
Symbol
ID	8429971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	3169054
End bp	3170709
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	41%
IMG OID	645035235
Product	CRISPR-associated protein, TM1812 family
Protein accession	YP_003192358
Protein GI	258516136
COG category
COG ID
TIGRFAM ID	[TIGR02221] CRISPR-associated protein, TM1812 family [TIGR02549] CRISPR-associated DxTHG motif protein

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.124903
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGTAAGT TAATTACTTT TATCGGAACA GGTAAATATG AGGAAACTAC TTATATATTT 
GATACAAATA AAATATATAC CCGCTATTTT TCCGTATTTT CCACAGCAAT CATAAAACCT 
GTTGAAGTTC TGGTAGTTAG AACCGAGGAG GCAGCTAATG AGCACTGGGG TCCTCTTTGT 
CAGGAATTTT TAGAAAATGG TTTTTCTGAA CCTGTTCCGA TAGATGTACC GGAAGGAAAA 
AGTACAAAGG AACTCTGGGA GATATTCAAT ACATTAATAG ATAAGGTCGA TGAACAGGAC 
AGTGTGGTAT TTGATATAAC TCACGGTTTT CGATCTCTTT CCCTGGTATG CTTCCTTAGT 
ATCGCCTACC TAAAATTTGT TAAGAATGTG CAAATTAAGG GTCTCTATTA TGGAGCATAT 
GAAGCTAGGG ATAAAGAAAA AAATATTACT CCGGTTTTTG ATTTAACTGA TTTTTGCTCA 
CTGCTTGATT GGATTGTTGG TGTAAATTCT TTTATCCAGC ACGGCAGTGC CCGGGAAATC 
AGCAGTCTCC TGGTAATGGC TCAAAAAAAA GCTAAGGAAA AGCAGGGCCC GGCGCGTCGG 
GAGCTAAATA GTTTTGGTAT GTTAATTGAA GATATTTCCC GGGCTTTGTT TACCACCAGA 
CCTTTTGAAC TGGTCAACAA GGCTCGCAAT TTAAAATATT ATAAAGAGGG AACTGAGCAA 
AGAAATATTC TGGAACGTGA TGTCTGGGAG TGGGCTGCTC CTTTTGGTGT CTTAATGGAT 
AAAATCATAG AAGAGTATTA TGCCTTTGCA GGGGTGGAAG ATCATTATAA CCCTCTCAAT 
CTTGAAAGGC ACCTGGCAGC GGTCCGCTGG TATGTTGAGC ATAATTATGC TCCTCAAGCA 
CTATCAATGA TGAGAGAACT GGTAATATCA TTTACTATGT GCCAGAAAGG AGAGTACGGG 
AAGGCTTTTG ATCGGGGTAT GCGTGAACTG ACAGCAGGAC AGCTGTACAG GGCTAAGGAA 
AATAGTCTCT CAGGAAAGCT GTGGTCTAAG CTGTCTGACC CACGCAATGA TGTAATCCAT 
GCTGGCTGGA GAACCAATCC CAGGTCATCC CATAAGGTAA TGCAGGAAAC CAGTGAATGT 
CTTGCATTAT TGGAGGAATT ATTCAGTGAA GAAGGGCTGA TAGTTTGTCA CGAGATACCT 
GATTCAGATG GAGAAGCTTC AAACTTAAAG GTTCTTATAA CACCTTTGGG AATGTCTCCG 
GGACTTTTAT ATACCGCTAT AAATCACATT GAGCCGGATC GTATTTTGGT ACTCACGTCT 
AAAGAGGGTA GGGCATTGCT GACAGAGATA ACAACTCAAG CAGGTTATAG CGGAGGAATA 
GAAGTGGTAG AAGTGAAAGA TCCTTTTGCC GGATTCAATG AATTATCCGA AGTAATAGAA 
AAAGTTATGG GTTATTTGGA AATGCTGCCG CCACACAAAA TTTACATAAA CTTGGCCGGG 
GGTACTACTT TGCTGCAATA TATAACAACC CGTATAGCCG GGCTTAAGGT AGATAATTGT 
GAGGAGTTAG TTAATGTAGT CATGATAGAT AAAAGACCGG TTCGTGAACA GCAGGAAAAC 
CCCTATGTTA TGGGTGATAT GTTAGTTGTT GAATAA

Protein sequence

MCKLITFIGT GKYEETTYIF DTNKIYTRYF SVFSTAIIKP VEVLVVRTEE AANEHWGPLC 
QEFLENGFSE PVPIDVPEGK STKELWEIFN TLIDKVDEQD SVVFDITHGF RSLSLVCFLS 
IAYLKFVKNV QIKGLYYGAY EARDKEKNIT PVFDLTDFCS LLDWIVGVNS FIQHGSAREI 
SSLLVMAQKK AKEKQGPARR ELNSFGMLIE DISRALFTTR PFELVNKARN LKYYKEGTEQ 
RNILERDVWE WAAPFGVLMD KIIEEYYAFA GVEDHYNPLN LERHLAAVRW YVEHNYAPQA 
LSMMRELVIS FTMCQKGEYG KAFDRGMREL TAGQLYRAKE NSLSGKLWSK LSDPRNDVIH 
AGWRTNPRSS HKVMQETSEC LALLEELFSE EGLIVCHEIP DSDGEASNLK VLITPLGMSP 
GLLYTAINHI EPDRILVLTS KEGRALLTEI TTQAGYSGGI EVVEVKDPFA GFNELSEVIE 
KVMGYLEMLP PHKIYINLAG GTTLLQYITT RIAGLKVDNC EELVNVVMID KRPVREQQEN 
PYVMGDMLVV E