Gene Hlac_1073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1073
Symbol
ID	7400145
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1072354
End bp	1073391
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	64%
IMG OID	643708139
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_002565738
Protein GI	222479501
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.688029
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGACC AAGAATCCGA TATCGAGAGT GAGACGGAGC AGACGACGGA ACCGAACGGC 
GACGGGTCGA CTCCGACGAT CGCGGTCACC GGCGCGGCCG GATACATCGG AAGCCGCGTG 
ATCGTGGAGT TCCAAGAGGC GCACCCCGAC TGGGAGATCG TCGCGATCGA CAACCAGTAC 
CGCGGGCAGG TGGATTCGGT CGGTGAGGTG GAGATTCAGC ACGTCGACAT CCGAAACCGC 
GACCGGCTGG AGGACGCGCT CGCGGGCGCG GACGTGGTGT GTCACCTCGC GGCGATAAGC 
GGCGTCGACG ACTGCGAGGA GAACGCCGAC CTCGCGTACG AGGTGAACGT CACCGGGACG 
AACAACGTCG CGTGGTTCTG TCGGAAGACC GGTGCGGCGC TGGCGTTCCC GTTCAGCATG 
GCAGTATTGG GGGACCCGCA GTCGTTCCCG ATCACGGCCG ACCAGCCGCG CGACCCGTTG 
AACTGGTACG GGCGGACGAA GCTGCTCGGC GAGCGCGCGA TCGAGACGTT CGCCGACGGC 
GCGTTCCCCG CGCACCTCTT TTTGAAGTCG AACCTCTACG GCGAGCACGT CGTCGACGGG 
ACGACGGTGA GCAAGCCGAC CGTGATCAAT TTCTTCGTGA ACCGGGCGCT CGCGGGCGAA 
ACGCTGACCG TCTACGAGCC CGGCACGCAG GCACGGAACT TCGTCCACGT GAAGGACGTG 
GCGCGCGTGT ACGTCCGGAG CGCGGAGCGG CTGCTGGAGC AGCTCGCGAG TGGGGAGACT 
GGAACCGAAA CGTTCGAAAT CGCGAGTGAG GAGGACATGA GCGTGATGGA GGTCGCGGAG 
ATCGTGCGGG AGGTGGCGCA CGAGGAGCGC GAGATCGACG TCGACGTGGA GTTGGTCGAG 
AATCCGCGAA GTGCGGAGAC GATGGTTGAG GAGTTTGGGG TGGATATTTC GGCGGCGGGG 
GAACGGTTAG GATGGGCACC AAGCGAGAGT GTGAACGAGT CAGTTCGACA TCTGTTGACT 
CCAAAATCTG ATTCGTAG

Protein sequence

MTDQESDIES ETEQTTEPNG DGSTPTIAVT GAAGYIGSRV IVEFQEAHPD WEIVAIDNQY 
RGQVDSVGEV EIQHVDIRNR DRLEDALAGA DVVCHLAAIS GVDDCEENAD LAYEVNVTGT 
NNVAWFCRKT GAALAFPFSM AVLGDPQSFP ITADQPRDPL NWYGRTKLLG ERAIETFADG 
AFPAHLFLKS NLYGEHVVDG TTVSKPTVIN FFVNRALAGE TLTVYEPGTQ ARNFVHVKDV 
ARVYVRSAER LLEQLASGET GTETFEIASE EDMSVMEVAE IVREVAHEER EIDVDVELVE 
NPRSAETMVE EFGVDISAAG ERLGWAPSES VNESVRHLLT PKSDS