Gene Hlac_0820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0820
Symbol
ID	7400786
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	817935
End bp	819551
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	64%
IMG OID	643707886
Product	AMP-dependent synthetase and ligase
Protein accession	YP_002565489
Protein GI	222479252
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.594452
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAAAAC CGCTACTAAC GACGGACTTC TTGGACCGAG CACGGCGCCA CTACGCCGAC 
GAGGAGGCCG TCCTCGCCAC TGACGGGACG CGGTACACCT ACGCCGAGCT GGGCGAGCGC 
GCGGACCGCT TCTCCGCCGT GCTTCAAGAG TGCGGGATCG AGAAGGGCGA CCGGGTTGCG 
GTGTTGGACC CGAACACTCA CTACCACCTA GAAGCCGCCT ACGGCGCCAT GCAGATCGGC 
GCAGTTCACA CTCCACTAAA CTACCGGCTC ACGCCCGACG ACTTCTCGTA CATGCTCTCC 
GACGCTGGCG TCGACGCTAT CTACGCCGAC GCCGAATACG CCGCGAACGT CGAGGCGATT 
CGCGAGGAGG TGCCAACCGA GACGTTCCTC ACGAACGACG CCGACGCGAT CGAGGGTGAT 
TGGGAGTCGT TCGACGAGGC GCTCGCCGAC GCGAATCCCG ACGCCTACGA GCGCCCGGAG 
ATGGATGAAG ACGACGTGAT CACCATCAAC TACACCTCCG GGACCACGGG CGATCCGAAA 
GGGGTCTGTC GCACGCACCG CGCGGAGACG CTCCACGCCT ACCTGATCAC CATCCACCAG 
GAGATCACCG ACGACGACGT GTACCTCTGG ACGCTGCCGA TGTTTCACGT CAACGGCTGG 
GGACACATCT ACGCGATCAC GGGGATGGGC GCCCGTCACA TCTGTACCCG CGGCGTCGAC 
GTCGAGGCCG TGTTCGACCG GATCCGCGCC GAGGACGTGT CGTACTTCTG TGCGGCGCCG 
ACCGTGCTCA ACATGCTCGG CGACCACTAC GCCGACCACG GCGGCGCGAC GACCGGCGAC 
AACGACGTGC GGGCAGCCAC CGCGGGCGCG GCGCCGCCGG AGGCAACGAT CCGCACCGTT 
GAGGAAGAGT TCGGCTGGGA TCTCAAACAC GTGTACGGCG CGACCGAGAC GGGGCCGCTC 
GTGACGACAT CGGATGCCAA GCGTCACTTT GACGCCGACT CGGACGACCG GTTCGCGGTC 
AAGAAGACAC AGGGGATCGG CTACCTCGGT ACCGACGTGC GCGTCGTCGA CGAAAACGGC 
GAGGACGTGG CTCCCGACGG CGAGACGATC GGCGAAATCG TTGTTCGGGG CAATCAGGTA 
ATGGACCGCT ACTGGAACAA GCCCGATGCC ACCGAAGAGG CGTTCTCAGA GCGGCTGGAG 
GGATACTACC ATATGGGAGA TCTGGCCGTC GTCGACGAGG ACGGCTTCGT CTCGATCCAA 
GATCGAAAAA AGGACATTAT CATCTCTGGC GGGGAGAACA TCTCCTCGAT CGAGTTAGAG 
GACACCCTCT TCGAGCACGA TGTCGTCTCA GACGTGGCCG TTATCCCCGC TCCCGACGAG 
CGGTGGGGCG AGACCCCGAA GGCGTTCGTG GTCCCGGAGA GCGGCGACCC GGACGACGCG 
GGTGCGACAC CGGAGGAGCT CAAGGCGTTC GTTCGAGAGC GCGTCGCTGA CTACAAGACT 
CCGGGCGAGG TGGAGTTCGT CGCTGAACTT CCGACGACGG CAACCGGGAA GATCCAGAAG 
TACGAGCTAC GCGAGCGCGA GTGGGACGAG GAGGACCGGA TGGTCGGGGA AGGGTAG

Protein sequence

MRKPLLTTDF LDRARRHYAD EEAVLATDGT RYTYAELGER ADRFSAVLQE CGIEKGDRVA 
VLDPNTHYHL EAAYGAMQIG AVHTPLNYRL TPDDFSYMLS DAGVDAIYAD AEYAANVEAI 
REEVPTETFL TNDADAIEGD WESFDEALAD ANPDAYERPE MDEDDVITIN YTSGTTGDPK 
GVCRTHRAET LHAYLITIHQ EITDDDVYLW TLPMFHVNGW GHIYAITGMG ARHICTRGVD 
VEAVFDRIRA EDVSYFCAAP TVLNMLGDHY ADHGGATTGD NDVRAATAGA APPEATIRTV 
EEEFGWDLKH VYGATETGPL VTTSDAKRHF DADSDDRFAV KKTQGIGYLG TDVRVVDENG 
EDVAPDGETI GEIVVRGNQV MDRYWNKPDA TEEAFSERLE GYYHMGDLAV VDEDGFVSIQ 
DRKKDIIISG GENISSIELE DTLFEHDVVS DVAVIPAPDE RWGETPKAFV VPESGDPDDA 
GATPEELKAF VRERVADYKT PGEVEFVAEL PTTATGKIQK YELREREWDE EDRMVGEG