Gene A2cp1_0784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A2cp1_0784
Symbol
ID	7299170
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter dehalogenans 2CP-1
Kingdom	Bacteria
Replicon accession	NC_011891
Strand	+
Start bp	882459
End bp	883343
Gene Length	885 bp
Protein Length	294 aa
Translation table	11
GC content	71%
IMG OID	643593579
Product	CRISPR-associated protein Cas1
Protein accession	YP_002491204
Protein GI	220915900
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03638] CRISPR-associated endonuclease Cas1, ECOLI subtype

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTGAAGG GCAGGCTCGG CCTCGAGACG GCGCGGATCC CGCAAGGCGA CCGCCACGGC 
CTGCTCTGGC TGTCGCGCGG CAGCCTGTAC GTCGAGGATG GGACGCTCCG CTTCCGCACC 
GCCGGCTGGG CCGAGCTCCC AGCCGGCGAC TATGCCATAC CGTTTCAGAT GGTCACCGCC 
GTGCTCCTCG AGCCGGGGAC CACCGTCAGC CACGACGCGC TCAGGCTGCT CGCGCGCCAC 
GGGACGGGCC TCGTCGCCAT CGGCGAGGAG GGCACGCGCT TCTACGCGAG CATGCCGTTC 
GGCCCGGACG CCTCGGCGCT CGCCCGCCGG CAGGTGATGG CGTGGGCGAG CGCCGCGGAC 
GGTCGGTTGC GCGTCGCGCG TCGCATGTAC GCCTGGCGCT TCGGCGAGGT TCTGCCCGAC 
GAGGACATCA CCGTCCTACG CGGTATCGAG GGTGCCCGGA TGCGCGAGAT CTACCGGCGC 
CTCGCAGAGC AGTACGGCGT TCCATGGTCC GGTCGGCGCT ACGACCGGCA GCGCCCGGAC 
CAGAACGATC CCGTGAACCA GGCGATCAAC CACGCCGCGA GCGCGGTCGA GGCCGCGGCG 
CTCGTGGCCG TCGCCGTGAC GGGGACGATC CCCCAACTCG GCTTCATCCA CGAGGACTCG 
GGGAACGCGT TCGCCCTCGA CGTCGCCGAC CTGTTTCGCT CGGCGATAGC CCTCCCGGCC 
GCCTTCTCGG CCGTGCGGGA GTGTGCCAAG GATCCCCGCA AGCCACTCGA GCGCACGGCA 
AGGCGCGCCG CGGGTCGTCT CCTGCAGCAG AAGGACGTCA TCCCCGAGAT GATCGACCGC 
ATCAAGGAGA TGTTCGATGC CGATGACGGT CATCGTGACC CGTGA

Protein sequence

MLKGRLGLET ARIPQGDRHG LLWLSRGSLY VEDGTLRFRT AGWAELPAGD YAIPFQMVTA 
VLLEPGTTVS HDALRLLARH GTGLVAIGEE GTRFYASMPF GPDASALARR QVMAWASAAD 
GRLRVARRMY AWRFGEVLPD EDITVLRGIE GARMREIYRR LAEQYGVPWS GRRYDRQRPD 
QNDPVNQAIN HAASAVEAAA LVAVAVTGTI PQLGFIHEDS GNAFALDVAD LFRSAIALPA 
AFSAVRECAK DPRKPLERTA RRAAGRLLQQ KDVIPEMIDR IKEMFDADDG HRDP