Gene Hore_15140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_15140
Symbol
ID	7313107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	1616115
End bp	1617296
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	33%
IMG OID	643611957
Product	CRISPR-associated protein, Cmr3 family
Protein accession	YP_002509259
Protein GI	220932351
COG category	[L] Replication, recombination and repair
COG ID	[COG1769] Uncharacterized protein predicted to be involved in DNA repair (RAMP superfamily)
TIGRFAM ID	[TIGR01888] CRISPR-associated protein, Cmr3 family

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCAGGTAA CTGTTAGTCC GCTGGATGTA TTATTTTTTA GGAATGGGAA ACCTTTTGAT 
GCTGATGACA GTCCCATAGG TGAAACTATA GATATGCCCT ATCCCTCTAC TTTTTACGGG 
GCTTTCCGGA GTAGAGTGTT GCTGGATAAT AGCGAAAGAT ACTTTGAATT TCTAGAGGGA 
AAAGCAGGGG AAATAACTGA AGTAATTGGA AGTCCTGATT TTAAAGGTTC CCTTAAAATT 
AACTTTTTTT CTTTGATTAA GGAAGATAAG GTCTTTAAGG ATATTTTATT GCCATTACCG 
CAGGATATGG TTGTGAAAAA AGGGGATAAA AGTTCTGGAC TGTTACATTT AAGATTTGTT 
TCAAAAAAAA GCTGGATTAA AATGAATAAC TCTCTTTCTC ACCTTTTAAT TAATCCTGTA 
AGCAAACAGG TGGAGTGGCC CGGACCAGCT TATATTAAAA TAAAAGATCT TGAATATTAT 
TTGAACAATG AACTTGAGGA TGCAGAAGTA AAAGTCTTCG ATAGAATGAA TGATATTTTC 
GATAAAGAGT ATCGAACAGG GATAGAAATA GATAATGTAA CAAAATTAGC CAAGGAAAAA 
AAGCTGTACC GAAGAGAAGT ATTGAGATTT AAAAACAACA GAGATAAGTC TTATAGTTTT 
TTTCTTGAAT TAACTGGAGA TAAAGGACTG CTATCCGAAA GTGGTTTATT AAAATTAGGG 
GGTGAGCAAA AGGCAGCAGA GTATAGGAAA GTTAAAGATG TCAGTAACAA AATAGAACTA 
TATGCTTCAA CTAAAAAAAG AATTTTAAAA AGCAAAAAGT TCAAAATTTA TCTTTCTACT 
CCGACTGTCT TTAAAAGAGG ATGGTTACCT GAATGGATTA ATCCTGATGA CTTTACAGGC 
AAATTACCTG CAAGTGGTAT CAGGGTAAAG TTATTAACTG CAGCTGTAGG AAAACATAAA 
ATAGTGAGTG GCTGGGATAT GGCTAAAAAG ACTGACAAAA ATAAAAGGGG TAAAGCAAAA 
ACAGGTTTTA GGGTAGTACC TGAAGGTAGC CTTTATTATT TCCAGATACT GGATAAAAAA 
TTTGATATTG AGGAATTAAT AAATGAATTA CATGGACAAT CTATTTCTGA TTTAAAAAGC 
AAAGAAGGTT TTGGTATCTC ATTTATAGGA GGGATTAAGT AG

Protein sequence

MQVTVSPLDV LFFRNGKPFD ADDSPIGETI DMPYPSTFYG AFRSRVLLDN SERYFEFLEG 
KAGEITEVIG SPDFKGSLKI NFFSLIKEDK VFKDILLPLP QDMVVKKGDK SSGLLHLRFV 
SKKSWIKMNN SLSHLLINPV SKQVEWPGPA YIKIKDLEYY LNNELEDAEV KVFDRMNDIF 
DKEYRTGIEI DNVTKLAKEK KLYRREVLRF KNNRDKSYSF FLELTGDKGL LSESGLLKLG 
GEQKAAEYRK VKDVSNKIEL YASTKKRILK SKKFKIYLST PTVFKRGWLP EWINPDDFTG 
KLPASGIRVK LLTAAVGKHK IVSGWDMAKK TDKNKRGKAK TGFRVVPEGS LYYFQILDKK 
FDIEELINEL HGQSISDLKS KEGFGISFIG GIK