Gene Dred_1007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dred_1007
Symbol
ID	4956261
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum reducens MI-1
Kingdom	Bacteria
Replicon accession	NC_009253
Strand	+
Start bp	1078392
End bp	1079423
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	40%
IMG OID	640180177
Product	CRISPR-associated Cas1 family protein
Protein accession	YP_001112367
Protein GI	134298871
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03640] CRISPR-associated endonuclease Cas1, DVULG subtype

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAAA TGTTGAATGT TCTTTATATA ACAAATCCTG AGGCTTATTT GGCAAAAGAT 
GGGGAAAACC TTGTGGTAAG AGTTCAGGAT GAAGAAATTT TCAGAACTCC TATTCACTAT 
CTGGAGGGTA TAGTTACCTT TGGTTATATG GGTGCAAGCC CCGCTTTACT GGGAATGTGT 
GTTGAGAAAG GGGTTACGGT ATCTTTTTTA ACTGCCCATG GTAAGCATCA GGCTACAGTA 
CATGGAACTC CCAAGGGCAA TGTGCTATTG AGAAGAAAAC AGTACCGTCT GGCTGATTCT 
GAAAGTGAAT CTGCAAAGCT GGCTTCAATG TTTATTATCG GGAAAATTGC TAACTGCAGG 
ACGGTACTCC GCCGTTTTAT GAGTGATTAC GGAGATAAGG TTCAAATTGA AGAAGTTGAT 
CGTGTCTCTA AAATAATGGC TCGTAATGTA TTGAGGCTAG GCAAAGAACT ATTGCTTGAT 
GAAGTGAGAG GAATTGAAGG CGAATCAGCA CAAATGTATT TTTCTGTATT TGACCAACTA 
ATTATATGTC ATAAGGACCA CTTTTTTATG AAAGGAAGAA ATCGCAGACC GCCATTGGAC 
AACATGAACG CATTGTTGTC ATTCCTATAT AGTCTACTTT TGCATGAGAC CCGATCCGCT 
CTAGAAACTG TTGGATTAGA TCCATATGTT GGTTTTTTAC ACCGTGACCG ACCGGGTAGG 
ACCGGGTTGG CCCTAGACCT TATGGAAGAA TTTCGGCCGT ACTTGGTAGA CAGATTAGCA 
TTAAGTTTAA TTAATAGACG GCAAGTCACA GGAGATGGAT TTTTGAAAAA GGAATCGGGT 
GGAGTTATTA TGAAGGAGAA TGTTCGAAAA ATCGTGATAG AAGCCTGGCA AAAAAGAAAG 
AGAGAAGAAA TAACCCATCC ATTTCTGGAA AAAAAGATAT ATGTTGGTTT ATTGCCCTAT 
GCGCAAGCCC TATTGTTAGC TAGACATTTA AGGGGAGACT TAGATCGATA TCCTCCGTTT 
GTATGGAAGT AA

Protein sequence

MRKMLNVLYI TNPEAYLAKD GENLVVRVQD EEIFRTPIHY LEGIVTFGYM GASPALLGMC 
VEKGVTVSFL TAHGKHQATV HGTPKGNVLL RRKQYRLADS ESESAKLASM FIIGKIANCR 
TVLRRFMSDY GDKVQIEEVD RVSKIMARNV LRLGKELLLD EVRGIEGESA QMYFSVFDQL 
IICHKDHFFM KGRNRRPPLD NMNALLSFLY SLLLHETRSA LETVGLDPYV GFLHRDRPGR 
TGLALDLMEE FRPYLVDRLA LSLINRRQVT GDGFLKKESG GVIMKENVRK IVIEAWQKRK 
REEITHPFLE KKIYVGLLPY AQALLLARHL RGDLDRYPPF VWK