Gene Hlac_1784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1784
Symbol
ID	7399657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1802154
End bp	1803242
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	69%
IMG OID	643708850
Product	hypothetical protein
Protein accession	YP_002566433
Protein GI	222480196
COG category	[R] General function prediction only
COG ID	[COG4801] Predicted acyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.19562
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGCTGA GGGGAGGCGG TCCGATAGAG GAGCTCGCCG TCCCATCCGG GACGACCGTC 
GAGGAGCACG ACCTCGTCAC CGACGGCGAC GTGCTCGTCG GCAGCCAGTC GACCGTGGAG 
TTCGGGCTCC GCGGGCGCAA CGTCGCGCTC GGCGAGCGTG TGAGCGTCGA AAACGACATC 
GAGGCCGAGG GCGACTGCCG GCTCGACACG TGGTGTTCCG TCGACGGCAA CGTCCTCGTC 
GGCGAGGACG CGTACCTCGG CGAGCGGGTG ACCGTCACCG GTCGACTGAT GGTCTCCGGC 
GACCTCGACA TCGGCGACGA CGTGACGATC GAGGAGGGGT TCGAGGCGAA CGGGTGGATC 
GTCATCCGCA ACCCCGTCCC CACCCTCGTC TTCTACTTCA TCGTCCTCTC TCAGCTCCTG 
CGGCTCGGCG AGACCGACGC GGCCGACAAC CTGGCGGAGG CGCTCGCCGA CGGCGAAGAC 
GTGCGTGACC CCCTGCTGGT CCCGCGTAGC GCCGAGATTT CCGACGACGC GTGGCGCGTT 
TCGACGCCCG CGAGCGTCGG CGACGACTGT CGGCTCCACG GCAACCTCCG CGCGGAGTCG 
ATCCGCGTCG GCGAGCGCAA CGAGGTGTTC GGCTCCCTGC GCGCCCGAGA GGGGATCACA 
GTCGGCGCGG ACACGACGAT CCACGGCGAC GTCACTACTC GCGGCGGAAC CGTCACGGTC 
GAAGCCGGCG CCCGCGTGCT CGGCGACGTC TCCGCCGGCG ATCTCGTCGT TCACGACGGC 
GCCGAGATCG ACGGCACCCT CCGCGCTCGC GGCGAGATGA AACTCGTTCA AGAAACCGGC 
GATGGCGACG AAGGTGAGGG CGAGACTGAG AGCGATGATG CCGGCGAAGA CGAGGGCGAT 
GCCGACGAGA TCGGCGAGAC AGACGCCGAC GAACTATCCG ACGAGGACGG GACGTCCGAC 
GGCGACGACT CCGCGGACGG CGAGGAGTCG GACTCCGACG AGTCCGGCGT CGAAGAATCA 
GACTCCGGAG GGTCAGATGT CGAGAGCCCC GACACCGAGG AACCAGACGT GGACGCGGAA 
GCGACGTAG

Protein sequence

MSLRGGGPIE ELAVPSGTTV EEHDLVTDGD VLVGSQSTVE FGLRGRNVAL GERVSVENDI 
EAEGDCRLDT WCSVDGNVLV GEDAYLGERV TVTGRLMVSG DLDIGDDVTI EEGFEANGWI 
VIRNPVPTLV FYFIVLSQLL RLGETDAADN LAEALADGED VRDPLLVPRS AEISDDAWRV 
STPASVGDDC RLHGNLRAES IRVGERNEVF GSLRAREGIT VGADTTIHGD VTTRGGTVTV 
EAGARVLGDV SAGDLVVHDG AEIDGTLRAR GEMKLVQETG DGDEGEGETE SDDAGEDEGD 
ADEIGETDAD ELSDEDGTSD GDDSADGEES DSDESGVEES DSGGSDVESP DTEEPDVDAE 
AT