Gene Hlac_0723 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0723
Symbol
ID	7400196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	738785
End bp	739933
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	67%
IMG OID	643707789
Product	2-methylcitrate synthase/citrate synthase II
Protein accession	YP_002565395
Protein GI	222479158
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01800] 2-methylcitrate synthase/citrate synthase II

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.517524
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.584309
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGACG AGTTAAAACG CGGGCTCGAA GGCGTCCTCG TCGCGGAGTC GGATCTGAGC 
TACGTCGACG GCGAGGTCGG CAAGCTCGTG TACCGTGGGT ACGACATCGA GGACCTCGCT 
CGCGGTGCGA GCTACGAGGA GGTGCTGTAC CTCCTGTGGC GCGGCTCGCT GCCGACGCGT 
GAGGAGCTCG ATGCCTTCAC CGCGGATCTC GCCGCCGAGC GCGCCGTCGA CGACGACGCG 
CTCGACGCCG TCCGGACGCT CGCCGACGCC GGCGAACGCC CGATGGCGGC GTTGCGGACC 
GCAGTCTCTA TGCTGTCGGC GTACGAGCCG GAGTCGGATG CCGACCCCGA GGATCTCGAC 
GCGACGCTCC GGCAGGGCCG CCGGATCACG GCGAAGATCC CGACGCTTCT CGCCGCCTTC 
GAGCGCGCGC GGCAGGGCGA GGACCCGGTC GCGCCCGACC CCGACCTCTC ACACGCCGCG 
AACTTCCTCT ACATGCTCAC CGGGACCGAG CCCGACGACG TGAGCGCCGA GACGTTCGAC 
ATGGCGCTGA CGCTCCACGC CGATCACGGA CTCAACGCCT CGACATTCAC CGCGATCGTG 
ATCGGCTCGA CGATGGCCGA CGTGTACTCC GGTGTCACCG GCGGGATCGG CGCACTCTCC 
GGCCCCCTCC ACGGCGGCGC GAACCAAGAC GTGATGGAGG TGCTTCAGGA GGTCGACGCC 
TCCGATAAGG ACCCCGTACA GTGGGTAAAA GACGCCCGCG AAGAGGGTCG GCGCATCCCC 
GGCTTCGGCC ACCGCGTCTA CAAGGTCAAA GACCCTCGTG CGAAGATCCT CGAAGAGAAG 
CTACGTGACC TCTCGGAGTC GTCCGGCGAC ACGAAGTGGC TCGACTACAC CACCGCAATC 
GAGGAGTACC TCACCGAACA GGGATTGCTT GATAAGGGAA TCGCTCCGAA CGTCGACTTC 
TACTCCGGAT CCGTCTACGA CTCGCTGGGG ATCCCGGTCG ACATGTACAC CCCTATCTTC 
GCGATGAGCC GCGCCGGCGG CTGGATCGCT CACATGGTCG AGTACCAGGA GGACAACCGC 
CTCATCCGCC CGCGGGCGCG GTACACCGGT CCCAAAGCGT CCGAGTTCGT TCCCGTCGAC 
GAGCGGTGA

Protein sequence

MSDELKRGLE GVLVAESDLS YVDGEVGKLV YRGYDIEDLA RGASYEEVLY LLWRGSLPTR 
EELDAFTADL AAERAVDDDA LDAVRTLADA GERPMAALRT AVSMLSAYEP ESDADPEDLD 
ATLRQGRRIT AKIPTLLAAF ERARQGEDPV APDPDLSHAA NFLYMLTGTE PDDVSAETFD 
MALTLHADHG LNASTFTAIV IGSTMADVYS GVTGGIGALS GPLHGGANQD VMEVLQEVDA 
SDKDPVQWVK DAREEGRRIP GFGHRVYKVK DPRAKILEEK LRDLSESSGD TKWLDYTTAI 
EEYLTEQGLL DKGIAPNVDF YSGSVYDSLG IPVDMYTPIF AMSRAGGWIA HMVEYQEDNR 
LIRPRARYTG PKASEFVPVD ER