Gene Hlac_1937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1937
Symbol
ID	7399889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1937122
End bp	1938405
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	70%
IMG OID	643709008
Product	putative pseudouridylate synthase
Protein accession	YP_002566585
Protein GI	222480348
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1258] Predicted pseudouridylate synthase
TIGRFAM ID	[TIGR01213] conserved hypothetical protein TIGR01213

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGTAC TCGAGGTCGC GGCGCGGGCG ACCGGGACGG GGCCGGTGTG CGACGCGTGT 
CTCGGCCGGC TCGTCGCCGA CCGGAGCTTC GGGCTGTCGA ACGCCGAGCG CGGGTCGGCG 
CTGCGGACCA GTCTTGCGCT CCGCGACGAC GAGGACTACG AGCCGGTCGA GACGGCAGAC 
TGCTGGGTGT GTGAGGGGCG CTGCACCGAG TTCGACGAAT GGGCCGAGCG GGCCGCCGAG 
GCGGTTGAGG ACGTGGAGTT CGCCACCTAC AACGTCGGCA CCCGTCCCCC GCCGCTGATC 
GAGGAGAACG AGGCGCTGCT CCGCGAGGAA GCCGGGCTCG ACGACGACGC GGGCGAGCCG 
TTCAAGTCGG AGTTCAACCG CGAAGTCGGG AAGCGGTTCG GCCGGCTCAC GGAGACGGAG 
GTGTCGTTCG ACCGCCCGGA CGTGCAGTTC ACGATCGACC TCGCCGAAGA CGAGATCGAC 
GCGAAGGTGA ACTCCACGTT TGTGTACGGC CGGTATCGAA AACTGGAACG GGACATCCCG 
CAGACCGAGT GGCCCTGCCG CGAGTGCAAG GGCTCGGGGC GACAGGGCGC GGACCCCTGT 
GATCACTGTG GCGGCTCCGG CTACCTCTAC GACGACAGCG TCGAGGAGTA CACCGCGCCC 
GTCGTCGAGG ACGTGATGGA CGGCACCGAG GCGACGTTCC ACGGCGCGGG CCGGGAGGAC 
GTGGACGCCT TGATGCTCGG AACCGGGCGC CCGTTCGTGA TCGAAGTCGA GGAGCCGCGC 
CGCCGCCGGG TCGACACCGA TCGCCTGCAG GCCGACATCA ACGCCTTCGC CGACGGCGCC 
GTGGAGGTCG AGGGGCTCCG GCTCGCGACC TACGACATGG TCGAACGCGT GAAGGAACAC 
GACGCTGCGA AGCGCTACCG CGCCGAGGTA GCCTTCGACG CCGACGTGGA CGCCGACGCC 
CTCGCGGCCG CGGTCGAAGA GCTTGAGGGG ACGACTGTCG AGCAGTACAC CCCGAACCGG 
GTCGACCACC GCCGGGCGAG CATCACCCGC GAGCGCGACG TGTACGAGGC GACCGCCGAA 
CTCGACGACG CCCGCCACGC GATCGTGGAG ATTCACGGCG AAGGTGGGCT CTACATCAAA 
GAGCTGATCT CCGGCGACGA GGGCCGGACG GAGCCGAGCC TCGCAGGCCT GCTCGGCGTC 
GGCGCCGAGG TCACCGCGCT CGACGTGGTC GCCGTCGAGG GCGAAGACGA GCCGTTCGAG 
CGCGAGGAGT TCTTCCGGGA GTGA

Protein sequence

MDVLEVAARA TGTGPVCDAC LGRLVADRSF GLSNAERGSA LRTSLALRDD EDYEPVETAD 
CWVCEGRCTE FDEWAERAAE AVEDVEFATY NVGTRPPPLI EENEALLREE AGLDDDAGEP 
FKSEFNREVG KRFGRLTETE VSFDRPDVQF TIDLAEDEID AKVNSTFVYG RYRKLERDIP 
QTEWPCRECK GSGRQGADPC DHCGGSGYLY DDSVEEYTAP VVEDVMDGTE ATFHGAGRED 
VDALMLGTGR PFVIEVEEPR RRRVDTDRLQ ADINAFADGA VEVEGLRLAT YDMVERVKEH 
DAAKRYRAEV AFDADVDADA LAAAVEELEG TTVEQYTPNR VDHRRASITR ERDVYEATAE 
LDDARHAIVE IHGEGGLYIK ELISGDEGRT EPSLAGLLGV GAEVTALDVV AVEGEDEPFE 
REEFFRE