Gene Hlac_0232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0232
Symbol
ID	7402161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	251421
End bp	252425
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	74%
IMG OID	643707295
Product	cobalamin biosynthesis protein CobD
Protein accession	YP_002564907
Protein GI	222478670
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1270] Cobalamin biosynthesis protein CobD/CbiB
TIGRFAM ID	[TIGR00380] cobalamin biosynthesis protein CobD

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.700118
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.268973
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACTG CTCCCCTCCT TACCCCCGTA CTCGCCTCCC TCGCCACGCT GGCGATCGCG 
GTCGCCCTCG ACCTCGCGCT CGCGGAGCCA CCCGCCCGAG TCCACCCCGT CGCGCTGTTC 
GGGTCGGTCG TCGGTCGGTT CGACCGCTCG TGGTCGCGCC CCCGGCTCGT CGGCGTCGCG 
GTCGCGGTCG GGCTCCCGAT CGGTGTCGCG GCGTTTGCGG GCGGGATCGT CGCAGCCGCC 
TCCTTCGCTC TTCCCGCCTT CTCCGCCCTC CCCGTTCTCG TCGCCGGAAC GATCCTCTTC 
ACGACCGTCA GCCTCCGAAT GCTGCTGGCG ACGACCGCCG AGGTCGTCGA ACTGACGGAA 
ACGGATCCGG ACGCGGCCCG GGAATCGGTG CGCGCGCTCG CGGGCCGGGA CGCGACCGAC 
CTCTCCCCGG CCGACCTCCG GAGCGCGGCC GTCGAGAGCG CGGCCGAGAA CCTCGCCGAC 
GGGTTCGTCG CGCCCCTCGG CGGGTTCGCG CTCGGAGCGA CGGTCGGACT CGCGGTCGGC 
GGTTCCGAAG TCGCGCTCCC GCTTGCCGCG GGGGTTGCCG CCGCGGTCTG GGTGAAGGCC 
GTCAACACGC TCGACTCGAT GCTCGGCTAC CGCTCGAAGC CGGTCGGGTG GGCGAGCGCT 
CGGCTCGACG ACGCCGTGAT GTTCCTCCCG GCCCGCGTGA CCGCCGGCTG TCTTTCGGTC 
GCGGCCGGAT CGATCGAAGC CCTCCGCTGG GCCGCATCGT GGGCCGGGAA GCCCGGATCG 
CCGAACTCCG GGTGGCCGAT GGCGACCGCC GCGGCCGCGC TCGACGTGCG ACTGGAGAAA 
CCCGGTCACT ACGTCCTCAA CCCGGACGCG AGCCCGCCCA GCGTCGTCGA CGCGGAGCGG 
GCGGTACGGC TCGTCGGCGT TTCCGGCGGG GTCGCGGTCG CTCTCGCGGC GGGATGGCTA 
CTCGCGACAA GATGGCTCCC GGCTCCTGCG GGGGTGATCG GATGA

Protein sequence

MATAPLLTPV LASLATLAIA VALDLALAEP PARVHPVALF GSVVGRFDRS WSRPRLVGVA 
VAVGLPIGVA AFAGGIVAAA SFALPAFSAL PVLVAGTILF TTVSLRMLLA TTAEVVELTE 
TDPDAARESV RALAGRDATD LSPADLRSAA VESAAENLAD GFVAPLGGFA LGATVGLAVG 
GSEVALPLAA GVAAAVWVKA VNTLDSMLGY RSKPVGWASA RLDDAVMFLP ARVTAGCLSV 
AAGSIEALRW AASWAGKPGS PNSGWPMATA AAALDVRLEK PGHYVLNPDA SPPSVVDAER 
AVRLVGVSGG VAVALAAGWL LATRWLPAPA GVIG