Gene Hlac_0231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0231
Symbol
ID	7402160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	250105
End bp	251415
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	72%
IMG OID	643707294
Product	cobyrinic acid a,c-diamide synthase
Protein accession	YP_002564906
Protein GI	222478669
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1797] Cobyrinic acid a,c-diamide synthase
TIGRFAM ID	[TIGR00379] cobyrinic acid a,c-diamide synthase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.383459
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.297913
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGGCC TCGTCCTCGG TGGCACCGCT TCCGGGGTCG GCAAGACTGT CGCGACGCTC 
GCGACGATCC GGGCGCTGGA AGACGCCGGC CACGCCGTCC AGCCGGCGAA GGCAGGGCCG 
GACTTCATCG ACCCGAGCCA CCACGAGCGC GTGACGGGGC GTCCCTCGCG CACGCTCGAC 
CTGTGGTTAC AGGGTGAGGA CGGACTTCGT CGGAACTACG CCCGCGGCGA GGGCGACGTC 
TGCGTCGTCG AGGGCGCCAT GGGGCTGTAC GACGGCGACG GGTCGAGCAC GGCCGCGGTC 
GCCGAGACGC TCGGCCTTCC GGTCGTGCTC GTGGTCGACG CGAGCGCCGG CATGGAGAGC 
GTCGCGGCGA CCGCACTCGG CTTCCGGGCG TACGCCGACC GGATCGGCCG CGGCATCGAC 
GTGGTCGGCG TGATCGCCCA GCGCGCGCAC GGCGGGCGCC ACGCCGACGG AATCCGCGAG 
GCGCTCCCGG ACGACCTCAC GTACTTCGGC CGAATTCCGC CGAACGACGA CCTCGCGGTA 
CCCGACCGCC ACCTCGGCCT ACACATGGGC GACGAGTCGC CCGTGCCCGA CGACGCGCTC 
GACGCGGCCG CGGAGGGACT CCGGACTGAG CGGCTCGTCG ATATCTCGCG GGAGCCGGCG 
GGTGCGTTGG AGCCAGCGAC AGCGGTCGAG TCGACCGACG GCGACCGCCC CCGCGTTGCG 
GTCGCCCGCG ACGACGCCTT CCGGTTCATG TATCCAGCGA CGATCGAACG CCTGCGCGAG 
CGAGCGACGG TGGAGCCGTT CGCGCCGATC GCGGGCGATT CCCTCCCGCC CTGTGACGGC 
GTCTACCTCC CCGGCGGTTA CCCGGAGCTG CACGCCGCAG AACTGGCGAT GAGCCCGGCG 
CTTGACGAGG TCGCGAGCGC GGCCGCCGAG GGGACTCCCG TGCTCGGCGA GTGCGGCGGG 
CTGATGGCGC TCGCCGAGTC GCTGACGACG GTCGACGGCG AGACGCACGC GATGGCCGGC 
GTCCTCCCGG CCGACGTGCG AATGTGCGAC CGGTATCAGG CGCTCGATCA CGTCGAACTT 
CGGGCGACGC GGGACGCGCC GACGGCGTCG GCGGGGTCGA CCCTGCGGGG TCACGAGTTC 
CACTACTCGA CAGCCGAGAT CGGGACCGAC GCCCGGTTCG CCTTCGACGT CGAGCGCGGG 
ACAGGGATCG ACGGCGACAA CGATGGCCTG ATCGAACACC AAACGCTCGG AACGTACTGT 
CACGTCCACC CCGAAAGCGG GGCGTTCGAC GCGTTTCTCG ACGGACTGTG A

Protein sequence

MKGLVLGGTA SGVGKTVATL ATIRALEDAG HAVQPAKAGP DFIDPSHHER VTGRPSRTLD 
LWLQGEDGLR RNYARGEGDV CVVEGAMGLY DGDGSSTAAV AETLGLPVVL VVDASAGMES 
VAATALGFRA YADRIGRGID VVGVIAQRAH GGRHADGIRE ALPDDLTYFG RIPPNDDLAV 
PDRHLGLHMG DESPVPDDAL DAAAEGLRTE RLVDISREPA GALEPATAVE STDGDRPRVA 
VARDDAFRFM YPATIERLRE RATVEPFAPI AGDSLPPCDG VYLPGGYPEL HAAELAMSPA 
LDEVASAAAE GTPVLGECGG LMALAESLTT VDGETHAMAG VLPADVRMCD RYQALDHVEL 
RATRDAPTAS AGSTLRGHEF HYSTAEIGTD ARFAFDVERG TGIDGDNDGL IEHQTLGTYC 
HVHPESGAFD AFLDGL