Gene Hore_15210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_15210
Symbol
ID	7313114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	1625089
End bp	1626066
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	32%
IMG OID	643611963
Product	CRISPR-associated protein Cas1
Protein accession	YP_002509265
Protein GI	220932357
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGTTGG TTATCAACAC ATACGGTAGT TACCTTCATG TAAAACAAAA ATCGTTTGAA 
ATAAAGACTG AAGAGGATAA AAAGAGGGTT TCTGCTAAAA AGGTTAGTTC AATATTAATT 
ACCACAGGTG CTGCCATCAG TACAGATGCA GTTAAACTGG CCCTGGAAAA TAATATTGAA 
ATACAGTTTC TGGATGAGTT TGGTTGTTCG TTAGGAAAAG TCTGGCACCC TAAACTTGGT 
AGTACTACTT ATATTAGAAG GAAACAGCTT GAGCTGGCAG AAAGTGAAGA AGGTACTGAA 
CTGGTAAAAG AATTTATGCT TGATAAAATA GATAATATGA TTAACCATTT ACATGATCTG 
GCTATAAAAC GTTCTAAATC AAAAGAGAAA TATATAAATA AGAAGATAAA AGAGATCTGT 
GAATTGCGTA ATAAATTAGA AAAAGTTACA GGGTATATTG AAGATGTAAG AAATACTATA 
ATGGGGTATG AAGGTAATAT ATCCAGGAAG TATTTTGCCA GCTTAAGTTT TCTTTTGCCA 
GATAGATATA AGTTTAATGG CAGGAGTTTC AGACCTGCTG AGGATGAATT TAATTGTTTG 
CTGAATTATG GTTATGGTGT ATTATATGGC AAAGTAGAAA AAGCATTAAT TATTGCAGGG 
TTAGATCCTT ATGTTGGCAT TCTACATACT GATGGTTATA ATAAAAAGTC TTTTGTCTTT 
GATTTTATTG AACCCTACCG ACACCATATA GACAGAGTAG TAATGAAGTT ATTTAGTAGA 
AAAAAAATCC GTAAGTTACA TTTTGATAAA ATTCAGGGAG GATTAACTCT TAACGATGAA 
GGAAAAAAAT TGCTTCTTAC AGAATTAAAT GATTATTTTG ATAAAAAAAT TAGATATAAG 
GGGAGAGAGA TAAAAATTAA TAATACGATT CAGTATGATT GTCACTCCCT GGCCAACAGA 
ATTATAGAGG AAGGTTGA

Protein sequence

MQLVINTYGS YLHVKQKSFE IKTEEDKKRV SAKKVSSILI TTGAAISTDA VKLALENNIE 
IQFLDEFGCS LGKVWHPKLG STTYIRRKQL ELAESEEGTE LVKEFMLDKI DNMINHLHDL 
AIKRSKSKEK YINKKIKEIC ELRNKLEKVT GYIEDVRNTI MGYEGNISRK YFASLSFLLP 
DRYKFNGRSF RPAEDEFNCL LNYGYGVLYG KVEKALIIAG LDPYVGILHT DGYNKKSFVF 
DFIEPYRHHI DRVVMKLFSR KKIRKLHFDK IQGGLTLNDE GKKLLLTELN DYFDKKIRYK 
GREIKINNTI QYDCHSLANR IIEEG