Gene Dred_0539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dred_0539
Symbol
ID	4957594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum reducens MI-1
Kingdom	Bacteria
Replicon accession	NC_009253
Strand	+
Start bp	583830
End bp	586181
Gene Length	2352 bp
Protein Length	783 aa
Translation table	11
GC content	46%
IMG OID	640179718
Product	CRISPR-associated helicase Cas3
Protein accession	YP_001111908
Protein GI	134298412
COG category	[R] General function prediction only
COG ID	[COG1203] Predicted helicases
TIGRFAM ID	[TIGR01587] CRISPR-associated helicase Cas3

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGAAC AACTAAAATC ACACCCACAC CTTTTTTTAC ACCAGCACAT TGAGCAGGTT 
AACCAGGCCA CAAAGGCAAT AAGAGATTGG CATACTACTG ACACAATAAC CAATGATATA 
AAGTTATTGC TGGGCCATCT GGCCAAATAC CATGATTTGG GCAAGGGTAC CCCTGCCTTT 
CAGGAATATA TCGAAAATCC AGAGGGTTAT CAGGGTGATC CCCAGGAGAA GGCCCATTCA 
ACTCTTTCTT TACTGCTGAC ACTGGCCATT GCAAGGCAGC AATCCTGGGA GGAGTTACAC 
ACCCTGGTCA TTGCCGCCGC TGTTGCCGGG CATCACAGCA GACTGCCAAC CATCCCGGAG 
AAGAAAATAG GGGGCGTATG TTGCCCCCAA TGGGATATCG ACGGCTTTGC GGGGGGAGAA 
AAGGCGTCAC TCTTGAAACG GCAATTAGCC AGCATCGATT TCCCTGCACT AGAGCAGGAA 
ACAAAGGTAG AATTTGGGTC TTATGGTTTG GCCCAGGCAT TGCAAAGCGA CCCAGCCAAA 
TCTTTGAGGG AAATGAAGAG ATTTTTAATC ACAAGAATAT ATGGCATATT TGCCTCCCTA 
AGTTTGGAAG AAGCCCTAAG ATTAAGAATG AAGGCGCAAC TGCTCTATTC GGTTTTACTG 
GAAGCGGATA AGGCTTTGCT GGCAGTATCC AGCCCAGAGG TGTATTTAAA CAGAGAGGTT 
CGGCATTGGC AGTCCCGGTG GGTTGAGGAT AAAATTGGCA AGCCCCCGGA GACCTCAATT 
AATCAATTGA GACAAAGGGC AAGGCAAGGG GTAATTGCCG CACTGGAGGC CAAAAACACC 
AACCTTTACA GTCTCACCGC TCCAACAGGC TGTGGCAAAA CCATGCTGGC AGCCACTTGG 
GCCCTTAAAT TAAGAGAACG GGTGACCGAA GGACAGGCTC CGCCCAAGAT TATCATTGTA 
CTACCATTTT TATCAGTCAT CGACCAAACG GCCAGGGAAT ATGCCAGGCT ATTATCCCAC 
AGTGGGCAAG AAACAGATGG TCGCTGGCTT ATCCAGAGCC ATTCCCTGGC CGATCGCCAC 
TACGCCAGGG GGTTAGAGGA TGAGGACGGT CGTTTTTTTA TTGATACCTG GCGCAGTGAA 
ATAATCATTA CAACCTATGA CCAGTTTTTA ATGAGTTTGT TAGATCCCCG GGCTAAGTAC 
CAAATGAGGT TTCATAATCT GTGTGATGCC ATGATAATCA TGGATGAAGT ACAAGCATTG 
CCTTGTAAAT TATGGCAGAC ACTGGAAAAG GTATTTCAGG CCCTAGCCAG TGAGGGCAAT 
AGCAGGTTGC TACTGATGTC AGCCACGCTA CCGCCCTTTA TGAAAGAGGC ACTTCCTTTA 
TTGCCGGACT ACCAAGGATA TTTTACCCTG TTTAATCGTT ACACCCTGCA ACTACGGCTA 
CAGGAATCAC AGACGTTGGA TAATTTCTGC GAAGAAATGT CAGACAGATT GATTGGTTGG 
CTGGAATGTA GCAATCGCAT TCTGATCACC CTAAATACCC GCCACAGTGC TCGCAGGGTG 
CGGGATTTTC TTAGCCAAAG TTGGCCTGCT GAGTATGGAG ATGTGCCGCT GTTCTTTATC 
AGTGCCGATG TGACACCAAA GGACAGGCTG GAAATAGTAA AACAAATCAA ACAGGGCAAA 
CCCTGTGTTG TTGTATCAAC CCAGTGTATT GAGGCCGGTG TGGATATTGA TATGGATCGA 
GTTATCCGGG ATTTTGGCCC CCTGGACAGC ATTATTCAAA TTGCCGGAAG ATGCAACCGT 
GAAGGGCTAA GGGCCCAGGG TGTCGTTGAG GTGGTGGATT TAATCAATGA ACAGGACAAA 
AGATATTCAG AAATGATATA TGATACTACC CACCTGCAAA TTACCAGAAA AATTTTAGCA 
GATAAGCAGG AAATTCAGGA GAAGGAAATA ATAACTTTAT CCACTCAGTA TTTTAAAGAT 
TTAACCGAGC AAAAGGATAC TGGGTACAAT CATTTGATAC GCTTTGCCAA ATGGCAGGAG 
GATACGCCGG TAAAGGAGCT GCTTAGGGGT AAAGAACGAT TGCAGATAGA TTTTTTGGTG 
TTGGAACAAG ATGCAGAGTT GAGGGATGAA ATGCAGATAG TGGGCCGTAT AAAGGACAGG 
TGGGAAAGAA GGGAAGCGTG GAGAAAACTG TCCGGCAGAA TTGCCCTTGT TTCAGTTAGT 
ATTTTTGCCC AACCAGGTTT CCACCCAGAA CAAATAGCAG ATGAATTCAT GGGGAGTTGG 
TGGGTGGTTC GGGAGGGTTA TTATAACAGT AAACAGGGAT TATTGATTGA GGGAGAAACA 
ATGATTTTAT AG

Protein sequence

MTEQLKSHPH LFLHQHIEQV NQATKAIRDW HTTDTITNDI KLLLGHLAKY HDLGKGTPAF 
QEYIENPEGY QGDPQEKAHS TLSLLLTLAI ARQQSWEELH TLVIAAAVAG HHSRLPTIPE 
KKIGGVCCPQ WDIDGFAGGE KASLLKRQLA SIDFPALEQE TKVEFGSYGL AQALQSDPAK 
SLREMKRFLI TRIYGIFASL SLEEALRLRM KAQLLYSVLL EADKALLAVS SPEVYLNREV 
RHWQSRWVED KIGKPPETSI NQLRQRARQG VIAALEAKNT NLYSLTAPTG CGKTMLAATW 
ALKLRERVTE GQAPPKIIIV LPFLSVIDQT AREYARLLSH SGQETDGRWL IQSHSLADRH 
YARGLEDEDG RFFIDTWRSE IIITTYDQFL MSLLDPRAKY QMRFHNLCDA MIIMDEVQAL 
PCKLWQTLEK VFQALASEGN SRLLLMSATL PPFMKEALPL LPDYQGYFTL FNRYTLQLRL 
QESQTLDNFC EEMSDRLIGW LECSNRILIT LNTRHSARRV RDFLSQSWPA EYGDVPLFFI 
SADVTPKDRL EIVKQIKQGK PCVVVSTQCI EAGVDIDMDR VIRDFGPLDS IIQIAGRCNR 
EGLRAQGVVE VVDLINEQDK RYSEMIYDTT HLQITRKILA DKQEIQEKEI ITLSTQYFKD 
LTEQKDTGYN HLIRFAKWQE DTPVKELLRG KERLQIDFLV LEQDAELRDE MQIVGRIKDR 
WERREAWRKL SGRIALVSVS IFAQPGFHPE QIADEFMGSW WVVREGYYNS KQGLLIEGET 
MIL