Gene Hlac_3331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3331
Symbol
ID	7402187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	-
Start bp	81837
End bp	82859
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	55%
IMG OID	643709883
Product	CRISPR-associated protein, Csh2 family
Protein accession	YP_002567449
Protein GI	222481213
COG category	[L] Replication, recombination and repair
COG ID	[COG3649] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR01595] CRISPR-associated protein, CT1132 family [TIGR02590] CRISPR-associated protein, Csh2 family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACTCA ACCGATCCGA AATACTGTTC ATTTACGACG CACAGGACTG CAACCCGAAC 
GGCAACCCTA TCGGCGACAA CCGCCCCCGA CGCGATCCTG ACACCGGACA GGGAATCATT 
ACCGATGTCC GTCTCAAGCG GTATCTCCGC GACCAACTGC TCGACGACGG GTTCGATATT 
TACGTCAAAA AGCTCGATGG AGATGCACGG CCGCGTACAA CTCTCGCGTT GGATGTGCTC 
GAAGATATCG ACGACGTAGA CGACATCGAA GAGATCGAAG ACGTCGGTGA ACGATTCCTT 
GCGGCCGCCA CTGACGTTCG GTACTTCGGC GCAACGATGA GTTTCGAGTC AAGTGACGAT 
GAAGAGGACG AAAAACTCCG ACAAGCCCTC GGGAGTGCGC TTCCGAACCA GTATCAGGGG 
CCGGTTCAGT TCCTGCCAGC GAAATCGTTG AACGAGGTTG AAGACAACGA GGAGTACGAT 
TCTCTCACGA GCGTCATCTC TACGGGCGAT GGGAACCGGC AGGGTGGATT CGATCTCGAC 
GACAAGAGAA TCAAATACGG GATCTTTCCC TTCTGGGGGT TGGTCGACAA CCACGGCGCA 
GAGTCGACGA ATCTGTCCGA GACAGATGTC AAACGTCTCG ATTCGCTCTG CTGGCGTGCG 
TTGAAGAACC AGACGACATC CCGGTCAAAA CTGGGCCAAG AGCCACGGCT CTACGTTCGA 
CCGGAGTACA AACCTGATAA TTATCACATC GGTGGACTTC ACAACCATGT CACGCTGTCC 
GATGAAAACG ACAAACCGCT CCGTTCGATC AACGATGTCG TCTTGGATGT CTCGAATCTC 
GTTACGGCGT TGGATCGCGC CGAGGATCGG ATCGAGACCG TCCACGTCGT GGGAAGTGAC 
TATCTGACAC TGACAACCGG TGATAAGACG ATCCCGGCGA GCGAGTTCGG CGACCATCTC 
GAATCGGAAG GCCACTCAGT CCACCAGATC GACGTTCTCG AAGAGCGTGA TTTCGCGGAG 
TAA

Protein sequence

MTLNRSEILF IYDAQDCNPN GNPIGDNRPR RDPDTGQGII TDVRLKRYLR DQLLDDGFDI 
YVKKLDGDAR PRTTLALDVL EDIDDVDDIE EIEDVGERFL AAATDVRYFG ATMSFESSDD 
EEDEKLRQAL GSALPNQYQG PVQFLPAKSL NEVEDNEEYD SLTSVISTGD GNRQGGFDLD 
DKRIKYGIFP FWGLVDNHGA ESTNLSETDV KRLDSLCWRA LKNQTTSRSK LGQEPRLYVR 
PEYKPDNYHI GGLHNHVTLS DENDKPLRSI NDVVLDVSNL VTALDRAEDR IETVHVVGSD 
YLTLTTGDKT IPASEFGDHL ESEGHSVHQI DVLEERDFAE