Gene Hlac_2030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2030
Symbol
ID	7402049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	2022587
End bp	2023654
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	68%
IMG OID	643709101
Product	translation factor pelota
Protein accession	YP_002566678
Protein GI	222480441
COG category	[R] General function prediction only
COG ID	[COG1537] Predicted RNA-binding proteins
TIGRFAM ID	[TIGR00111] probable translation factor pelota

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.481161
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCA GCGACCGGGG CTACGGCGAG GAGGGCCGGG AACGGCTCAC CCTCGTCCCC 
GAGAACGTCG ACGACCTCTG GCACCTCGCG CACGTCCTCG AACCCGGGGA CCTCGTCGAG 
GGCGACACCA CCCGCCGGAT CCAGCGAAAC GACGACCAGA TGCGGGACAC CGGCGGCCAG 
CGCGAACACC TCTTCGTGAC GCTACAGGTC GACGAGGTGG AGTTCGCCCG GTTCGCCAAC 
CGGCTGCGCG TGTCGGGCGT CATCGTCGGC TGCTCGCGTG AGGACCAGCT CAACGCCCAC 
CACACGATCA ACGTCGAGGA GCACGACGAG ATAACGGTGG AAAAGCACTT CAAGCCGGAC 
CAGACCGAGC GGCTGGAGGA GGCGACCGAG GCCGCCGAGA ATCCCGACGT GGCCATCGCG 
ACCGTCGAGG AGGGGGCCGC CTACGTCCAC ACGGTCCAGC AGTACGGCAC CGAGGAGTAC 
GCCTCGTTCA CGAAGCCGAC CGGGAAGGGC GACTACTCTC GGCCGCGCGA GGAGCTGTTC 
GCCGAACTGG GCGAGGCGCT CGCGCATCTC GACGCCGACG CGGTGATCCT CGCTGGTCCG 
GGGTTCACGA AGCAGGACGC GCTCGACTAC ATCACCGAGG AGTACCGCGA TCTGGCCGAT 
CGGATCACCA CCGTCGACAC CTCCGCCGCG GGCGATCGGG GCGTCCACGA GGTGCTCAAG 
CGCGGCGCGG TCGACGAGGT GCAGAAGGAG ACCCGGATCT CCAAGGAGGC GACGCTCATC 
GACGACCTCA CCGCCGAGAT CGCGCAGGGC GCGAAGGCGA CCTACGGCCC CGAGGATGTG 
GCCGAGGCCG CCGAGTTCGG CGCGATCGAG ACCCTGCTCG TCGTCGACGA CCGCCTCCGC 
ACCGAGCGAC AGGGCGAGGG CGACTGGTCG ATCGACGTCA ACGAGGTGAT CGAGTCTGTC 
GAACAGCAGG GCGGCGACGT GGTCGTCTTC TCCTCGGAGT TCGCCCCCGG CGAACAGCTC 
TCGAACCTCG GTGGGATCGC CGCGATCTTG CGCTATCGAC TGCAGTAG

Protein sequence

MRISDRGYGE EGRERLTLVP ENVDDLWHLA HVLEPGDLVE GDTTRRIQRN DDQMRDTGGQ 
REHLFVTLQV DEVEFARFAN RLRVSGVIVG CSREDQLNAH HTINVEEHDE ITVEKHFKPD 
QTERLEEATE AAENPDVAIA TVEEGAAYVH TVQQYGTEEY ASFTKPTGKG DYSRPREELF 
AELGEALAHL DADAVILAGP GFTKQDALDY ITEEYRDLAD RITTVDTSAA GDRGVHEVLK 
RGAVDEVQKE TRISKEATLI DDLTAEIAQG AKATYGPEDV AEAAEFGAIE TLLVVDDRLR 
TERQGEGDWS IDVNEVIESV EQQGGDVVVF SSEFAPGEQL SNLGGIAAIL RYRLQ