Gene Htur_4166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_4166
Symbol
ID	8744794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013744
Strand	+
Start bp	436207
End bp	437703
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	60%
IMG OID	646514715
Product	Carboxylyase-related protein
Protein accession	YP_003405662
Protein GI	284167384
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACCA GTAGCCTCCG GCAGTACCTC CAAACGCTCG AGACGAACGG AGACCTCCAT 
CGAATTAGCG AGCCGGTCTC GTGGAATCTC GAGGCAAGCG CCGTCACGAT GCTGCTGAAC 
GAAGAAGACA GCGCCGTGCC GCTATTCGAG AACGTCGATT CAGCGCGACT CGTCGGCGAC 
CCGTATCGGG GAACCCAACG ACGACCCTGG GAACGGATCG CCCTGGGACT CGGATTGCCG 
TCGGATCTCT CGTACAGAGA GTTCTACGAA GCGGTGATCG AACGGCTGAA AAACCCGATA 
GAACCGGTAA CAGTATCCAC AGACGATGCG CCCTGTAAAG AGGAGATACA GACGGGCGAC 
GACGTTGATC TCCTGGACTT TCCCTGGCCG TACATTCACG CGGGCGACGG CGGACGCTAT 
TCGAATCTCC ATACGCTCGT CGCACCGGAC CCTGATTCCG AGTGGGTCGA CTGGTCGAAC 
CATCGAACGA TGATCCACGA CGGCGAGACG AGCAGCGTCC TCCTGTTGGC GGGTGAGCAA 
ACGCCGAATC TCTACTATTA CAAGTACGAG AAACGGGACG AACCGATGCC GGTCGCGATC 
ACCGTCGGCG CTGAACCTGC CGTTCAGTAC ACGTCCGTGA TGTGGATTCC GACGGGACGA 
AACGAAGCGG AATACGCAGG GGGATTGAAA CAGGAACCGG TTGAACTCGT ACCCTGTGAA 
ACCAACGACC TCTCGGTCCC AGCGACGGCC GAACTCGTCA TCGAGGGCGA AATCCTCCCG 
AACGAGCGTC GTGACGAAGG ACCGTTCGGC GACTACTTCG GCTATATGCA CGGCCCCAGA 
CGGTCGATGC CTTTGTTCCG AGTGACCGGA ATTACTCATC AAACCGATCC GATACTCCCG 
TTCTGCGTCG AGGGGACCGG TGTCGGGCAT TCGGAAAACA CAACCAGTTC GATGGAAATC 
GGCTGTGTCG GGCCGGACGC AACGCTCGGA CTGCGGACCG CCGGGTTCGA CGTCGAATGC 
TGTGCCCCTT GGAAGTCGAC GCCGAGGACG ATCTACGCGA TCTCGACCGA GAAGACCAAC 
CCCAGCTATC TCCACGATAT GGCGAATTTC ATCTTCACGA CGTGGGGAAT GCTCCACGTC 
GACTTCTTCA TCTTCGTCGA CGCTGACGTC AACCCGCTCA ATCAGCGCGA AGTGCTCGAG 
GCGCTCGCCC TCCACGCGGA TCCCGACGCG GATTTCCATC AGTTCGGCGT CGAGACGATG 
CCGAAGGTGC CGCTCAACAT CTATCAGACG CCGACCGAGA AGGGGGACAT CCAGACCGGA 
ACGTCGAAAG CGAAGACGGC GAAGGCGTAC ATCGACGCGA CCAGCGACGG AGCTGGCCGG 
GAGGCGCAAC CGACCCACGA CATCGAGCGC AGATATCGGG CGCAAAAGAT ACTGGAACGG 
GCCGGCGTCG AATCGAGCGA GCTGTCGTTC GTCGATCCCG GGGAGGCCAC GCAATGA

Protein sequence

MTTSSLRQYL QTLETNGDLH RISEPVSWNL EASAVTMLLN EEDSAVPLFE NVDSARLVGD 
PYRGTQRRPW ERIALGLGLP SDLSYREFYE AVIERLKNPI EPVTVSTDDA PCKEEIQTGD 
DVDLLDFPWP YIHAGDGGRY SNLHTLVAPD PDSEWVDWSN HRTMIHDGET SSVLLLAGEQ 
TPNLYYYKYE KRDEPMPVAI TVGAEPAVQY TSVMWIPTGR NEAEYAGGLK QEPVELVPCE 
TNDLSVPATA ELVIEGEILP NERRDEGPFG DYFGYMHGPR RSMPLFRVTG ITHQTDPILP 
FCVEGTGVGH SENTTSSMEI GCVGPDATLG LRTAGFDVEC CAPWKSTPRT IYAISTEKTN 
PSYLHDMANF IFTTWGMLHV DFFIFVDADV NPLNQREVLE ALALHADPDA DFHQFGVETM 
PKVPLNIYQT PTEKGDIQTG TSKAKTAKAY IDATSDGAGR EAQPTHDIER RYRAQKILER 
AGVESSELSF VDPGEATQ