Gene Hlac_1140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1140
Symbol
ID	7400949
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1146596
End bp	1147507
Gene Length	912 bp
Protein Length	303 aa
Translation table	11
GC content	62%
IMG OID	643708205
Product	diacylglycerol kinase catalytic region
Protein accession	YP_002565804
Protein GI	222479567
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1597] Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase
TIGRFAM ID	[TIGR00147] lipid kinase, YegS/Rv2252/BmrU family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGACA CCGTGATTAT CTACAACCCG CAAAGCGGAG GCGGCTCACA TGCCGACGAC 
GTCGAGGACC GCGCGGATCT GAGCGGGTAT GCAGTCGAAC GGTCTGAACA CGCCGGCGAA 
GCGGTCACGC TGACACAGGA GGCTATCGAG GCCGGATACT CGACGATCGT GGCCGGCGGC 
GGTGACGGGA CGGTCAACGA GGTTGTTCAG GGGATCGACC GGGCCGACGC GTTCGACGAC 
GTCACGTTCG GCATCCTGCC TCTCGGGACG GGTAACAACT TCGCGAAGCA GATCGGCATT 
ACCGATCTCG AAACCGCGTT CATTGCCCTC GATGACGGTG TCAGGCGTAC TATCGATATC 
GGGATGGCAA CCGATCGGCC CTTCGTGAAC TCCTGTGTCG CCGGGCTAAC CGCCGAGTCA 
GTGAGCGGGA CGTCCGGAGC GTTGAAGTCT CGTATCGGTG GGTTGGCATA CGTGCTCACG 
ACGCTCCGGA CCGTGACCGA TTTCGAGCCG CTACAGCTTA CGATTGATAA CGAGATGAGC 
GACGGCGACA CGCCGACGTG GAGCGGTGAA GCGCTCTGTG TGGTGGTCGG GAACGGCCGT 
CAGTTCGCGG CGGACGGGAC GACACAGGCC AACATGGAGG ACGGTCTCTT CGAGGTCGCG 
ATCGTCACGG ACGTGCCCGC GATTGATCTG ATGAGTGATG CGGTACTTGA GCGCCTGTTC 
GGCCAGGACT CGCCACACAT CGACCGGTTC CAAGCCGCAT CGGTGGATAT CAGGGGCCAC 
TCGTCGGACC CCATCAGATT CAGCGTGGAC GGGGAGACCA TCGAGCAACG CGACCTCGTG 
CTCACTGTTC GACCGAACAG GCTGCGGCTC GTCGTCGGGG AGGGATACGA CCCCTCTCCG 
ATGGACACGT GA

Protein sequence

MADTVIIYNP QSGGGSHADD VEDRADLSGY AVERSEHAGE AVTLTQEAIE AGYSTIVAGG 
GDGTVNEVVQ GIDRADAFDD VTFGILPLGT GNNFAKQIGI TDLETAFIAL DDGVRRTIDI 
GMATDRPFVN SCVAGLTAES VSGTSGALKS RIGGLAYVLT TLRTVTDFEP LQLTIDNEMS 
DGDTPTWSGE ALCVVVGNGR QFAADGTTQA NMEDGLFEVA IVTDVPAIDL MSDAVLERLF 
GQDSPHIDRF QAASVDIRGH SSDPIRFSVD GETIEQRDLV LTVRPNRLRL VVGEGYDPSP 
MDT