Gene Hlac_1644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1644
Symbol
ID	7399594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1666189
End bp	1667190
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	55%
IMG OID	643708711
Product	integrase family protein
Protein accession	YP_002566299
Protein GI	222480062
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.104877
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGAC AAATCGAACC CGAACGCGCA GTAGAACGGT ACCTAAACGA ACGCCGGGCG 
GACATTTCTG AGTCCACCTA TTACAACCAC TCATCCCTGC TGTCACAGTT CATTGAGTGG 
TGTGAGGCCG AAGGTCTGGA CTACGTCAAC GAACTTGACG GGTTCCACAT CTCCGACTTC 
AAAATCCATC GCCGGGACGA GGATGGTATC AACAAAGTCA CACTCTACAA TCAGATGACT 
GTCCTTCGCG TCTTCCTCCG GTGGTGTGAA TCACGCAGTC TGGTTGAAGA CCTCGCGGAG 
AACATCTTGA TGCCGGTTCC CGAAGATGAC TCTCGGGACA CGATGATCGA CTCGGAGACG 
TCCGCACAGA TCCTCCAATA CCTCCAAAAG TACGAATATG GGACGTTGAA ACACACGGTA 
TTCTCGCTCC TGTGGGACAC CGGGTTCCGT GTGGGAACTC TCCGAGCGGT CGATCTTGGA 
GATTACCATT CAGAGAAACA GTTCATTGAG GTGGAACACC GTGCGGAGAC TGGTACACCG 
CTCAAGAACA AGTACGGAGC CGAACGTGAA GTGAATCTCC ATGAATGGGT GTGTGACGTG 
ATCGACGACT ACGTCGAAAT GTACAGGCAC GACATAACCG ATGACCACGG ACGGGAACCA 
CTAATCACGA CGGAACAAGG TCGTCCTGTT CGGTCGAACA TACGTGGCCA CATTAACTCC 
ATGACGCGCC CCTGCGTGTA CGCGGGCAGG TGCCCCCACG ATAGGGATCC AGATAGTTGC 
GAAGCCGCGC AGCGACGGGA CGCAGCCGCA CGGTGTCCTG GTTCGGTTCC TCCTCACGCA 
ATTCGTCGGT CCGCGATCAC AGCATGGCTC AACGATGGCC ACACAAAGGA ACTCCTCTCC 
GATAGGATGA ACGTCTCCGT GAAGACGCTG GAGAAGCATT ACGATGCCCG GACGGAAAGC 
GAAAAGCGGG AACTTCGCCG CGAGGAGTTC GGGATGGAGT AG

Protein sequence

MTRQIEPERA VERYLNERRA DISESTYYNH SSLLSQFIEW CEAEGLDYVN ELDGFHISDF 
KIHRRDEDGI NKVTLYNQMT VLRVFLRWCE SRSLVEDLAE NILMPVPEDD SRDTMIDSET 
SAQILQYLQK YEYGTLKHTV FSLLWDTGFR VGTLRAVDLG DYHSEKQFIE VEHRAETGTP 
LKNKYGAERE VNLHEWVCDV IDDYVEMYRH DITDDHGREP LITTEQGRPV RSNIRGHINS 
MTRPCVYAGR CPHDRDPDSC EAAQRRDAAA RCPGSVPPHA IRRSAITAWL NDGHTKELLS 
DRMNVSVKTL EKHYDARTES EKRELRREEF GME