Gene Dhaf_3931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dhaf_3931
Symbol
ID	7260952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfitobacterium hafniense DCB-2
Kingdom	Bacteria
Replicon accession	NC_011830
Strand	-
Start bp	4166529
End bp	4167524
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	45%
IMG OID	643563854
Product	CRISPR-associated protein Cas1
Protein accession	YP_002460382
Protein GI	219669947
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03641] CRISPR-associated endonuclease Cas1, HMARI/TNEAP subtype

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAAAAA CCTTATATAT CTTCTCCAAT GGTCAGCTCC GGCGGAAGGA TGATACGATT 
TTCTTCGTCA ATGAGGAGGG GGATCAAAAA TATATCCCTG TGGAAGATAC CTCCGAGTTG 
ATGGTCTTTG GGGAGGTGGA TATTAATAAA CGATTCCTGG AGTTCTGCAC GCAAAAGGAG 
ATTATCATTC ATTACTTTAA TAACTATGGT TATTACAGCG GTACCTTTTA TCCCCGGGAA 
CACTATAACT CAGGGTATAT GATATTGAAG CAGGCTGAAG CTTACCTGAA TGAGGAAAGA 
AGGCTGTTGC TGGCGCGGCA ATTTGTGAAC GGTGCTTTTT TAAATATCAG GCAGGTTCTT 
AAATACTATG CCAATCGGGG CAAGGAAGTG GGGCCCCGGT TAACGGAGAT AGAAAAGCTG 
AGTGAAGGTA TAGGAGCTGC CGGCACGATT CCTGAGCTGA TGGCTTTTGA AGGGAATATC 
AGGGAACATT ATTATAAGGC CTTTGACGCG ATTCATGGCC ACCCGGAATT TGTGTTCGAG 
GGGCGCTCAA AGCGGCCTCC TAAAAATGCA ATGAATACCT TGATCAGTTT TGGCAATTCC 
ATTGTATACT CCACAGTGTT GAGTGAAATT TATAAAACTC ATCTGGATCC GCGCATCGGC 
TATCTTCATA CCACTAATTT TCGCCGGTTT AGTTTGAATT TGGATGTGGC GGAAATCTTT 
AAACCGATTT TGGTGGATCG GGTGATTTTT ACTCTGATCG GGAAAAAGAT GATCAAAAAG 
AGCGATTTTA AAAAGGAGTC CGGGGGCTTA ATGCTGAAGG AGAACGGACG GAGGGTTTTC 
GTTGAGGAGC TGGAAAACCG TTTGAAAACC ACCATCAACC ACCGGGATAT AGGCACTCCG 
GTGTCTTATC GGCGCTTGCT TCGTCTTGAG CTGTACAAGC TGGAAAAGCA TCTCATGGGT 
GAGAAAGACT ACGAGCCTTT TGTCAGCCAG TGGTGA

Protein sequence

MKKTLYIFSN GQLRRKDDTI FFVNEEGDQK YIPVEDTSEL MVFGEVDINK RFLEFCTQKE 
IIIHYFNNYG YYSGTFYPRE HYNSGYMILK QAEAYLNEER RLLLARQFVN GAFLNIRQVL 
KYYANRGKEV GPRLTEIEKL SEGIGAAGTI PELMAFEGNI REHYYKAFDA IHGHPEFVFE 
GRSKRPPKNA MNTLISFGNS IVYSTVLSEI YKTHLDPRIG YLHTTNFRRF SLNLDVAEIF 
KPILVDRVIF TLIGKKMIKK SDFKKESGGL MLKENGRRVF VEELENRLKT TINHRDIGTP 
VSYRRLLRLE LYKLEKHLMG EKDYEPFVSQ W