Gene Hlac_2550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2550
Symbol
ID	7399775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2525917
End bp	2527218
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	71%
IMG OID	643709622
Product	homoserine O-acetyltransferase
Protein accession	YP_002567192
Protein GI	222480955
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACCG TTCCGACCGA CCACGGCGTC GCCGCTCTCG GGGAGTTCGT CTTCGAGTGC 
GGCCAGTCGG TCCCCGATCT GGAGGTCGCC TACGAGACCC ACGGCGAGTT CGACGGCGAC 
AACGTGGTGT TGGTCTGCCA CGCGCTCACC GGTAGCCAGA ACGTCGCCCG GTCGCCCGCG 
CCGGAGCGCA ACGAGGGGAC CCGCGGAGCC GGGCAGGCCG GACAGGCCCG CGCGTGGTGG 
GACGACATCG TCGGCCCGGG GAAGGCGATA GACACCACGA AGTACTACGT CGTCTGCGCG 
AACGTTCCCG GTTCCTGTTA CGGCACCACG GGGCCGGCGA GCGAGCGCCC AGCCGACCTC 
GACCTCCCCG AGGAACCCGA TCACGACCGG TGGGGGACCG CCTTCCCGCC GGTGCAGGTC 
GAGGACTGGG CGCGCTCGCA GCGCCGTCTG CTGGACCACC TCGGCGTGGG CCGGCTCCGA 
GCCGTCGTCG GCGGGAGCGT CGGCGGGATG AACGTCTTGG AGTGGGCGAA GCGCTACCCC 
GACGACGTCG ACCGCGTGGT CGCCATCGCG ACCGCCGGTC GCCTCGACGC GCAGTGTCTC 
GCGCTCGACG CGGTCGCCCG GCGGGCGATC CGCGCGGACC CGAACTGGAA CGGGGGCAAC 
TACTACGGCG AGGGCCGCCC CTCGCCGGAC GAAGGGCTCG CCTTGGCCCG TCAGATCGGG 
CACATCATGT ACCTCTCGAA GGCGTCGATG GAGCGGAAGT TCGGTCGTCG CTCGGCGGGC 
CGCGACTCGC TGACCCGCGA GGAGGGAGAT TTGGGTCTCC CGCCGGAGCC AACGGCGGCC 
TTCTTCCCGT ACCGCGAGGT GGAGTCGTAC CTCGACTATC AGGCGGAGGG GTTCAGCGAG 
CGGTTCGACG CCAACAGCTA CCTCTACCTC ACGCGCGCGA TGGACGAGTA CGACCTCTCC 
GCCGGCCACG GCACCGACGC CGACGCGCTC GCCGCCTTCG AGGGCGAGGC GCTGTTGATG 
AGCTTTACCG CCGACTGGCA CTTCACCGTC GAGCAGTCGT CGTCGCTTGC GGCCGCCTTC 
CGCGATCGGG ATGTCCCCGT CGCCCACCAC GTGATCGACT CCGATCACGG CCACGACGCG 
TTCCTCGTCG AGCCCGAACA TGTCGGCCCG CCGCTGCGTG ACTTCCTCGT GGAGGGGGTC 
GGAGGTCGGG CGGTCTCCGA TGACGGCGGC GGTGGGGGTA ACGACTCCGC GCGGCCCGAG 
CGGGACCACG CGCCGGTTCA CGCGAGCCTT TTTAAAGGGT AG

Protein sequence

MSTVPTDHGV AALGEFVFEC GQSVPDLEVA YETHGEFDGD NVVLVCHALT GSQNVARSPA 
PERNEGTRGA GQAGQARAWW DDIVGPGKAI DTTKYYVVCA NVPGSCYGTT GPASERPADL 
DLPEEPDHDR WGTAFPPVQV EDWARSQRRL LDHLGVGRLR AVVGGSVGGM NVLEWAKRYP 
DDVDRVVAIA TAGRLDAQCL ALDAVARRAI RADPNWNGGN YYGEGRPSPD EGLALARQIG 
HIMYLSKASM ERKFGRRSAG RDSLTREEGD LGLPPEPTAA FFPYREVESY LDYQAEGFSE 
RFDANSYLYL TRAMDEYDLS AGHGTDADAL AAFEGEALLM SFTADWHFTV EQSSSLAAAF 
RDRDVPVAHH VIDSDHGHDA FLVEPEHVGP PLRDFLVEGV GGRAVSDDGG GGGNDSARPE 
RDHAPVHASL FKG