Gene Hlac_0548 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0548
Symbol
ID	7401683
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	571878
End bp	572951
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	72%
IMG OID	643707613
Product	glycosyl transferase family 2
Protein accession	YP_002565220
Protein GI	222478983
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0176894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCTCT CGGTCGTTGT TCCCACCCTC AATGGGCGGG ATCGGTTAGC CGCCTGTCTC 
GACGCGCTGG CGGCCCACGC CCCCGAGGCG GAGGTGATCG TCGCTAACGG CCCCTCCGCC 
GACGGCACCA CCGGGATGGT GCGGGACCGC GACGACGTGG ACGTGCTGGT GGAGATCTCC 
GACCGCACGG TCAACGTCGC CCGCAACGCT GGTATCGAGG TCGCCACCGG CGACATAGTC 
GCTCTCGTTG ACTACGACAA CCGGATCGGA GAGGGGTGGC TCGACGCGGT TCGCGCCGGG 
CTCGACGACG CGGACGTTGT GACAGGACCA GTGACCCCGA TCGAACCGGA GCAGGGAGGA 
CGCGACGGTG AAGCGTCCGC CAACGGGGAA CGCATTGTGC GCGACGACGA GCACGACGAC 
GAACGCGACG ACGAGCACGA CGACGAACGC GACGACGAGC ACGACGACGA ACGCGACGAC 
GAGCACGACG ACGAACGCGA CGGCCCGGAG CGCCGGACGA TCGCGGGCAC CGAGGTGACC 
TACTTCGAGG GGGGCAACGT CGCCTTCCGG CGCGAGGCGC TCCGGGACCT GGACGGCTTC 
GACGAGTATC TCCGCACGGG CGGCGCGCGC GACGCGGCGC ACCGGCTGGC GCAGATGGGA 
CGAACCGTGG CGTGGCGCGA AGACCTGGCG GTCACCAAGG CGCTCCCGAG CCCGACGGCG 
GCCGACTGCG GGCGCACCGC CCGCGAGTGG GGGTGGAAGT ACCGAGCGCT CGCGTACCGC 
CTCTTGAAGA ACTACGGGGT CCGCCCGACC GTCGTCGCGC GGGCCGGGAC GCACGCGGCG 
ACGGACGCGT TCGGAGCCGC CGGCGACGTG ATCCGCGGCG AGTCGACCCC GTCGCGGTGG 
GTCGCCACCG GCCGCGACGT ACTCGTCGGC CTCGCCGGCG GGAGCTCCGA CGGCCTCGTC 
GCGCGGAGCC GCGACCGGAG CCCGGCGCGG AACCCGAACG GTATCTCGAA GCGCGCCGAC 
CGCGCCGTCG CGAAGTACGA CCGACGGGAG CCGAAGAGGG GGACGGAGGA GTGA

Protein sequence

MDLSVVVPTL NGRDRLAACL DALAAHAPEA EVIVANGPSA DGTTGMVRDR DDVDVLVEIS 
DRTVNVARNA GIEVATGDIV ALVDYDNRIG EGWLDAVRAG LDDADVVTGP VTPIEPEQGG 
RDGEASANGE RIVRDDEHDD ERDDEHDDER DDEHDDERDD EHDDERDGPE RRTIAGTEVT 
YFEGGNVAFR REALRDLDGF DEYLRTGGAR DAAHRLAQMG RTVAWREDLA VTKALPSPTA 
ADCGRTAREW GWKYRALAYR LLKNYGVRPT VVARAGTHAA TDAFGAAGDV IRGESTPSRW 
VATGRDVLVG LAGGSSDGLV ARSRDRSPAR NPNGISKRAD RAVAKYDRRE PKRGTEE