Gene Hlac_1238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1238
Symbol
ID	7399506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1249702
End bp	1251867
Gene Length	2166 bp
Protein Length	721 aa
Translation table	11
GC content	65%
IMG OID	643708302
Product	formate dehydrogenase, alpha subunit
Protein accession	YP_002565900
Protein GI	222479663
COG category	[R] General function prediction only
COG ID	[COG3383] Uncharacterized anaerobic dehydrogenase
TIGRFAM ID	[TIGR01591] formate dehydrogenase, alpha subunit, archaeal-type

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.768724
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0266527
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACTG AGGGAGACGA GCCGGTGAAG ACCATCTGCC CGTACTGCGG CGTCGGCTGC 
GGGATCAAAG TGAACCAGGG CGACGACCCC GGCGACGTGA GTTTCATGCC GTGGGGGGAG 
GCGCCGGTCA ACGAGGGGCG GGTGTGTATC AAGGGCGGCG CGGCGACGCA GGTCGTCGAC 
CACGAGGACC GCCTGACGGA GCCGCTGATA AAGGAAGATG GCGAGTTCCG CGAGGCGACG 
TGGGAGGAAG CCTACTCGCG GATCGTCTCG GAGATGGAGC GGATCCGCGA CGAGAACGAC 
CCAGACGCGA TGGGATTCTT CGGCTCCTCG AAGACGATGA ACGAGGAGAA CTACCTCCTC 
CAGAAGATCG CGCGCCGATA CGGCACGAAC AACGTCGACA ACTGCACGCG GATGTGCCAC 
GCCTCGACGG TGTGGGCGCT CCGGAGGAGC TTGGGGGCGG GCGCGATGAC GAACAGCATG 
GTCGACCTAG AGGAATCGGC CGACGTGTTC TGGATCCAAG GGGCGAATCC CGGCGAACAA 
CACCCGATCG CCAACAGCCA GTACTTCCGG CAGGCCGTCT TGGAGGGTGC GACCGTCATC 
CAGGTCGACC CGCACGCCAA CAAGACCACC CGGTCGTTCA AGATCGGCGA GACCGACCGG 
CACATGCACC TTCAGGTGAA CCCCGGCGCC GATATTCCCC TGCTCAACAT CGTCTTGAAG 
ACGATCCTTG AACGCCACGA GGAAGAGCCG GACGCGGGCT GGATCGACGA GGCGTTCATC 
GACGAGCGCA CCGAGGGGTT CGATCACTTG AAAGAGACCC TCGAAGACTT CGACAAGGAG 
GCGGCCGCGG AGGAGGCCGG CGTCCCCCTC GAAGACATCG AACTCGCCGC CGAGAAGTAC 
GCGATGGCGA ACAACGCCGC CATCTTCACC GGGATGGGGA TGAGCCAGCA CACCTGCGGC 
GTCGACAACG TGCAGAACGA GATCAACCTC GCGCTGATCA CTGGGAACCT CGGGAAGCCC 
GGCACCGGCG TCAACCCGCT TCGTGGACAG AACAACGTCC AAGGGACCAG CGACGTGGGT 
GCGATGCCGA ACGTCCTCCC CGGCTACCAG CCCGTCAACG ACGACGAGGC CCGCGGGAGC 
GTCGAGGACG TGTGGGGGTT CGAGGTGCCC GACGAGCCCG GGCTCACCAA CGTGGAGATT 
TCCCACGAGG CGGGTCACTC GGTGAAGGGG CTGTACGTGA TGGGCGAGAA CCCGATCATG 
AGCGAGCCCG ACGGCAACGA GGTCGAAGAG CGCTTGAAGT CGCTGGAGTT CATGGTCGCA 
CAGGACATCT TCATGACCGA GACCGCGGAG TTCGCGGACG TGGTCCTCCC GGCGACGACG 
TGGGCGGAAC GCGGCGGCAC AGTCACCAAC ACCGACCGCC GAGTCCAACG CATGCGCGGC 
GCCGAGATGG TCCACGAGAA CACGAAACAC GACCTCGACA TCCTGATGGA GGTCGGGAGC 
CGCCTCTTTA GCGAAGACGA GTTCCGCTTC GACGACGTGG AGGCCGTCTT CGAGGAGCTG 
CGCGAGGTGT GTCCGATCTA CCACGGGATG ACCTACGACG CGCTCGGCGA GACCGGGATC 
CAGTGGCCCT GCTACGAGGA GGGCGACCAG GGCGACCAGT ACCTCTACGA GGACTCCTTC 
GACACAGAGA GCGGGCTCGG ACATATCGAG GGCGTCCGCC ACCAGCCACC GGCGGAGGTG 
CCCGACGAGG AGTACCCGCT GATCCTCACC ACTGCGCGGC TCGAAGAGCA CTACAACACG 
GGGACGATGA GCCGGCGCTC GCCGACGCTG ATGCGACAGC ACCCGGAGAA CTTCGTCGAC 
GTGCACCCGA ACGACGCCGA AGAGTACGGG ATCGAGGACG GCGACATGGT GACGCTCCGG 
TCGCGACGCG GCGAGATCGA AGTGAAAGCG CAGGTGACCG AGGACATCAA GGAGGGCGTC 
GTCTGGACGA CGCCGCACTT CGCGGCCGCC TCCGCGAACC GGCTCACGAA CGACGTGCTC 
GACGAGCGGG CGAAGATACC CGAGTACAAG GCCGCGGCGG CGGACATCGC GGTCACCGTC 
TCTGACGGCG GGGAACGCGT GGACGACGCT GAGCCCGACG CGGGTTCGGA GCCGGGCGAC 
GACTGA

Protein sequence

MSTEGDEPVK TICPYCGVGC GIKVNQGDDP GDVSFMPWGE APVNEGRVCI KGGAATQVVD 
HEDRLTEPLI KEDGEFREAT WEEAYSRIVS EMERIRDEND PDAMGFFGSS KTMNEENYLL 
QKIARRYGTN NVDNCTRMCH ASTVWALRRS LGAGAMTNSM VDLEESADVF WIQGANPGEQ 
HPIANSQYFR QAVLEGATVI QVDPHANKTT RSFKIGETDR HMHLQVNPGA DIPLLNIVLK 
TILERHEEEP DAGWIDEAFI DERTEGFDHL KETLEDFDKE AAAEEAGVPL EDIELAAEKY 
AMANNAAIFT GMGMSQHTCG VDNVQNEINL ALITGNLGKP GTGVNPLRGQ NNVQGTSDVG 
AMPNVLPGYQ PVNDDEARGS VEDVWGFEVP DEPGLTNVEI SHEAGHSVKG LYVMGENPIM 
SEPDGNEVEE RLKSLEFMVA QDIFMTETAE FADVVLPATT WAERGGTVTN TDRRVQRMRG 
AEMVHENTKH DLDILMEVGS RLFSEDEFRF DDVEAVFEEL REVCPIYHGM TYDALGETGI 
QWPCYEEGDQ GDQYLYEDSF DTESGLGHIE GVRHQPPAEV PDEEYPLILT TARLEEHYNT 
GTMSRRSPTL MRQHPENFVD VHPNDAEEYG IEDGDMVTLR SRRGEIEVKA QVTEDIKEGV 
VWTTPHFAAA SANRLTNDVL DERAKIPEYK AAAADIAVTV SDGGERVDDA EPDAGSEPGD 
D