Gene Hlac_2038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2038
Symbol
ID	7402057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	2030938
End bp	2031939
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	76%
IMG OID	643709109
Product	beta-ribofuranosylaminobenzene 5'-phosphate synthase family
Protein accession	YP_002566686
Protein GI	222480449
COG category	[R] General function prediction only
COG ID	[COG1907] Predicted archaeal sugar kinases
TIGRFAM ID	[TIGR00144] beta-RFAP synthase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.172756
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.249661
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGCG TGAGCGCCGG GGCGCGGCTC CACTTCGGCT TCTGTAACCT CAGCCTCTCG 
CACGAGCGGC TGTACGGCGC CCTCGGGCTC GGGCTCGCGG AACCTCGCGT CGTCGTCGAC 
GCGGAGCCAG ATTCGGAGAT AACCGTCGCT GTCGAGACGC CCACAACTGA TTCAGCCACC 
CGCAACGACA TCCGCGAGTA CGCCACCACC GCCACCGACC TGCTCGGCGT CGATGGCGCC 
CAAATCACGG TCCACGAGAC GCTCCCGCGC CACGCCGGAC TCGGGAGCGG CACCCAGCTG 
GCCGCGGCGA CGCTCGCAGC GGTCGCGGCC GCCCACGGGA AGGACCCCCG CGTCCGCGAG 
CGCGCCCCGG CGCTCGGCCG CGGCGGGCGC TCGGGCGTCG GCGTCGCGAC CTTCGAGGCG 
GGCGGGTTCG TGCTCGACGC GGGCCACCCC ACCGCACGGT TCACCACCGA CCGCCCCGCC 
GACGGCGAGT GGACCGTGCC GCCGGTGGCC GCCCGCCACG CCGTCCCCGA CGACTGGCGG 
TTCCTGCTCG TGCGCCCCGA CGCCGACCCA GGCCGGAGCG GTGACGCCGA GGACGACGCG 
ATGCGGACCG CGGTCGAGCG GGCGGAACCC GGGCTCGCAG ACCGGATCGG CGGGATCGTC 
ACCCGGCGCG TGCTCCCCGC GATCGCGACC GGGAACGCCG AGCGCTTCGG CGCCGCAGTC 
GCGGAGATCG GCCGGCTCAA CGGTGCGTGG TACGCCGACG AACAGGGCGG GGTCTACCGC 
CCGCCGGTCG GCGACGTGGT CGCATCGCTG TCGGACGCCG CGGCCGTGTT CGGCGCCGGG 
CAGTCGTCGT GGGGGCCGAC CGTATACGGA ATCACGGACG CCGCGAACGC GACTGCGGCC 
GCGAGCGCGG GCGAGCGCGC CCTCGACGAG GCGGGCGTTG ACGGGTCGGT CTCGGTCGTC 
GAGGCGGCCA ACGGCGGGGC GCGGGTGACG GGGCGGGAGT GA

Protein sequence

MARVSAGARL HFGFCNLSLS HERLYGALGL GLAEPRVVVD AEPDSEITVA VETPTTDSAT 
RNDIREYATT ATDLLGVDGA QITVHETLPR HAGLGSGTQL AAATLAAVAA AHGKDPRVRE 
RAPALGRGGR SGVGVATFEA GGFVLDAGHP TARFTTDRPA DGEWTVPPVA ARHAVPDDWR 
FLLVRPDADP GRSGDAEDDA MRTAVERAEP GLADRIGGIV TRRVLPAIAT GNAERFGAAV 
AEIGRLNGAW YADEQGGVYR PPVGDVVASL SDAAAVFGAG QSSWGPTVYG ITDAANATAA 
ASAGERALDE AGVDGSVSVV EAANGGARVT GRE