Gene Hlac_1065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1065
Symbol
ID	7400137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1063753
End bp	1064862
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	49%
IMG OID	643708132
Product	glycosyl transferase group 1
Protein accession	YP_002565731
Protein GI	222479494
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.912454
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTATC TCAGACAGAG CGTAAGGAAG GTTCATATTC GTATATCCGC CGGAGACCAT 
TTAATATGTT ATCAACGGAG CGTTCTTATT GGTGGAAGAA GTCATTCAGA TGTGACTCAG 
GCGAACCCCA AAGTTCGGTG GTTTACTCCA GATAAACCGG ACAACATCAG TGTTGGGAGA 
GAACGAATTG CCTCCCATCT CCGACAAAAC GAGGGGTTCC ACGTTGATGT TGTGGGAACT 
ACACTCCCAA CTGTCCGAAC AGCGATCAGA GAACGTGACC GATACGACGT GATCCTTGGA 
ACCACTCGTG CAGGGGCGAT TGCCGGGACA CTGATCGGAC GCGTAACCGG AAAGCCCGTG 
ATTGTTGACC ACGTAGATCC CATTCGACAG TTCCGTGAAA ACAACTCTCC GTTCTTTTCG 
ATCCCAGTTC GAATAGCCGA AAATATCTCA TTCGCGCTAG CCGAGTTGGT ACTGTACGTG 
TACGAGGAAG AGTACGATCG GGTTTCTCGC TACGCTAGCC AGCATATGAA AACCGAACTC 
GGTGTTGATT ATCGTCGGTT TGCTAGTCCC AATTCAGAGA TCATTGATTC TGTTCAGGAT 
CAGTTAGCTG AATACGAGCT TCGTGAATAT GTAGCAATCT ACGTCGGCGG GCTTGAACCC 
ATATATCACA TCAGAGAGTT ACTGATGGCG ATGTCGTATC TTCCTGACTG GTCGTTGATT 
GTTCTCGGAG AGGGCAGTCT CAGAGGAATG CTTGAAGAGG TGGATGCCGA CCAAGAGAAC 
ATTCACTATT TAGGACTCGT TCCACACGAG ACCATCCCTG GGTATCTCAA TGTGGCTGAT 
GTCGGCGTTT CATTGGTTGA TGACCCTCAT ACACTCAAGA TATTAGAGTA CGGTGCTGCG 
GGACTATCGG TCGTTCAAGC TAGTGGACTA GCGGAAGAGA GATTCCGGGA ACGGGTGGAA 
TATGCCGATT CCGATCCAAG ATCTATAGCG GATGCTATCA GGCGTGCCGG AGAGCGTGAA 
AACGTTGAAC AACTCCAGTC GTTCATATCT GAATTTGATT GGAAGCAGAT CGCTGGAGAT 
TATGTGGATG CGCTCAAAAG CATAAAATAG

Protein sequence

MSYLRQSVRK VHIRISAGDH LICYQRSVLI GGRSHSDVTQ ANPKVRWFTP DKPDNISVGR 
ERIASHLRQN EGFHVDVVGT TLPTVRTAIR ERDRYDVILG TTRAGAIAGT LIGRVTGKPV 
IVDHVDPIRQ FRENNSPFFS IPVRIAENIS FALAELVLYV YEEEYDRVSR YASQHMKTEL 
GVDYRRFASP NSEIIDSVQD QLAEYELREY VAIYVGGLEP IYHIRELLMA MSYLPDWSLI 
VLGEGSLRGM LEEVDADQEN IHYLGLVPHE TIPGYLNVAD VGVSLVDDPH TLKILEYGAA 
GLSVVQASGL AEERFRERVE YADSDPRSIA DAIRRAGERE NVEQLQSFIS EFDWKQIAGD 
YVDALKSIK