Gene Hoch_1316 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1316
Symbol
ID	8543698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	1742241
End bp	1743416
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	69%
IMG OID	646386032
Product	CRISPR-associated protein, Cmr3
Protein accession	YP_003265767
Protein GI	262194558
COG category	[L] Replication, recombination and repair
COG ID	[COG1769] Uncharacterized protein predicted to be involved in DNA repair (RAMP superfamily)
TIGRFAM ID	[TIGR01888] CRISPR-associated protein, Cmr3 family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACGC GCGCCTACCT GCTTCAGCCC ACCGACGTAT GGTTCTTTCG CGACGGCCGC 
CCGTATGACC GCTACGAGGC CAGTCAGACG GCGGTCAAGA GCCTGTTCCC GCCCTCTCCG 
CTAACCGTAC TTGGCGCCTT GCGTGCCGGC CTGGCGCGCG CCCTGGGTTG GCGTGACGGG 
CCCTGGCCAG CCGAAATCTG TGCCGTGCTC GGCGACGGTA TCGAAGACCT GGCCGAGCTC 
TCGCTGCGTG GCCCGTATCT GGCCCGGAGC GTCGACCCGG AGCGGCCCGA GCCGTGGTGG 
CCGCTTCCCG TACACCTGGT CGGAATTGTC CAGAACGGAG TGCGGCATGC TCAGGCTCTT 
GGGCATCGCG AAGACGAGCA AAGCCTACCG TGGCGAGCCC GCGCGCTGCT GAGACCCAGC 
CAGGAGCCGA TCCGCTGCGA CCTCGGCGAG GTGCACCTGC CCGTGCCGTC CAGTGACAAG 
CCGGCTCCGC CCTCCGAGCG CTTGTCCGCG CGGCCGCGGT ACTGGGTGAA CACCGCCGGC 
CTCGACGCCA TCCTCGCCGG CCGGTTGCCC AAACCCGAGG ACGTGATCGC GCCGCCCTGG 
CAGCACCAGA TGCGCGTGGG CATCCACCGG GACGAGACCA CGCGAACGAC CAGCGATCGC 
GCCCATGCCT TGTACAGCCC GCTCATGGTG AGCTTGCGGC CCGACTTCGG ACTTTTGGCC 
GAAATGCGCG GCGTACCCGA CACCGTGGAC GATCCCGCGC CGGTCTTGCC GCTGGGTGGC 
GAGTCCCGCC TGGCTGCTTG CCAGCGCGTG GCCTCTCCCC GTGCCCCGTC GTGTCCGAGC 
AATCTCATCC GCAAGAGCCG ACGCTGCGTT GTGGTCCACC TGTCCCCCGC CCGACTATCG 
AGCCTGCCGC GACCAGGCGA AACGCTCCCC GACCTGCCGG GCGCGCGGGT GGTAACGGCC 
TGCTTACGGC CGCTCGAGCA GATCGGCGGC TGGGATGGCC GGGACCGAGC GAAAGCACGC 
CCGCGACCGC TCAACCCCGT GGTGGCCGCG GGTAGCGTGT GGTTCTGCGA GCTCGATGGT 
GACGTCGACG CAACCCTGAA CATGCACGAT GGCCGCATCG GCGATGACAC GCGCTGCGGC 
TTTGGACACC TTGCCTTGGG CACCTGGCCC GCTTGA

Protein sequence

MTTRAYLLQP TDVWFFRDGR PYDRYEASQT AVKSLFPPSP LTVLGALRAG LARALGWRDG 
PWPAEICAVL GDGIEDLAEL SLRGPYLARS VDPERPEPWW PLPVHLVGIV QNGVRHAQAL 
GHREDEQSLP WRARALLRPS QEPIRCDLGE VHLPVPSSDK PAPPSERLSA RPRYWVNTAG 
LDAILAGRLP KPEDVIAPPW QHQMRVGIHR DETTRTTSDR AHALYSPLMV SLRPDFGLLA 
EMRGVPDTVD DPAPVLPLGG ESRLAACQRV ASPRAPSCPS NLIRKSRRCV VVHLSPARLS 
SLPRPGETLP DLPGARVVTA CLRPLEQIGG WDGRDRAKAR PRPLNPVVAA GSVWFCELDG 
DVDATLNMHD GRIGDDTRCG FGHLALGTWP A