Gene Hlac_1100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1100
Symbol
ID	7400172
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1105107
End bp	1106366
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	68%
IMG OID	643708166
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_002565765
Protein GI	222479528
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGCG ACGCGGCCAC CGACGGCGGG ACCGCTTCCG ACGACGCGTC GGCCGACGAT 
GACTCCCCCG CCGGCCCCCT CGACGGCGTG ACCGTGATCG AGGCCGGGTC GATGATCTCG 
ATCGGGACGG TCGGACGCCT ACTCGCGGAC TTCGGCGCGG ACGTGATCAA GGTCGAACAC 
CCGGAGACCG GCGACCACCT GCGCCACTTC GGTCCCCAGA AAGAAGGCGT CGGGCTCTGG 
TGGAAGTACC TCGGTCGCAA CAAGCAGTCG GTGACCCTCG ACATCTCCAC CGAGGAGGGG 
AAAGTCGTCT TCGAGGACCT CGTCGCCGAG GCCGACGCGC TCATCGAGAA CTTCCGCCCG 
GGCACCTTAG AGCGGTGGGG ACTCGGCTAT GATCACCTCT CCGATCTCAA CTCCGGGCTC 
GTGATGCTCC GGCTGAGCGG GTTCGGGCAG ACCGGCCCGT ACAGCGACCG CCCCGGATTC 
GGCACACTCG CCGAGGCGAT GTCGGGGTTC GCGTACCTCA ACGGCTACCC CGATCAGGAG 
CCGCTGTTGC CGCCGACCGG GCTGGCAGAC GGGATCGCAG CGATGTTCTC CACGATGGCG 
GTCGCGTTCG CGCTGTACAA CCGCGACGCG AACGGCGGGA CCGGCCAGTA CATCGACACG 
AGCCTCATCG AGCCGATCTT CTCGCTCATC GGTCCCCAGC CGCTCCGCTA CCAGCAGCTC 
GACGAGATCG AAACGCGGTC GGGGAACCGC TCGACGTCGT CCGCGCCGCG GAACGTGTAC 
CAGACGGGCG ACGGACGGGC GGTCGCCATC TCGGCGAGCG CGCAGCCGAT CGCGATGCGG 
GTGTTCGACG CGATCGAGCG GCCAGATTTA AAAGACGATC CCCGCTTCGC GGACAACGAA 
AAGCGGCTGG AGAACGTCGA GGCGCTCGAC GCGGCCATCC AAGACTGGAT GGACGACCAC 
ACCCGCGAGG CGGTCATCGA CCGTTTCGAG GAGTACGAGG CGACGATCGC CCCGATCTAC 
AACGTCGCCG ATATCCTCGC AGACGAGCAC TACCAGGCCC GCGACGCGGT CGTGGAGGTC 
CCGGACGACC AGCTCGGCGC CGGTGCGGTC CAGAACACCG TGCCCCGCTT CTCGGAGACG 
CCGGGGGAGA TCACCCACCT CGGTCCGCAG CTCGGCGCGC ACAACGAGGC GGTGTACGGC 
GAGCGCCTGT CGTACGACGA CGAGACGCTT GCGGAGCTCG ACTCGGAGGG CGTGATATGA

Protein sequence

MSRDAATDGG TASDDASADD DSPAGPLDGV TVIEAGSMIS IGTVGRLLAD FGADVIKVEH 
PETGDHLRHF GPQKEGVGLW WKYLGRNKQS VTLDISTEEG KVVFEDLVAE ADALIENFRP 
GTLERWGLGY DHLSDLNSGL VMLRLSGFGQ TGPYSDRPGF GTLAEAMSGF AYLNGYPDQE 
PLLPPTGLAD GIAAMFSTMA VAFALYNRDA NGGTGQYIDT SLIEPIFSLI GPQPLRYQQL 
DEIETRSGNR STSSAPRNVY QTGDGRAVAI SASAQPIAMR VFDAIERPDL KDDPRFADNE 
KRLENVEALD AAIQDWMDDH TREAVIDRFE EYEATIAPIY NVADILADEH YQARDAVVEV 
PDDQLGAGAV QNTVPRFSET PGEITHLGPQ LGAHNEAVYG ERLSYDDETL AELDSEGVI