Gene Htur_1038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_1038
Symbol
ID	8741625
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	+
Start bp	1073726
End bp	1077118
Gene Length	3393 bp
Protein Length	1130 aa
Translation table	11
GC content	67%
IMG OID	646511616
Product	formate dehydrogenase, alpha subunit
Protein accession	YP_003402603
Protein GI	284164324
COG category	[R] General function prediction only
COG ID	[COG3383] Uncharacterized anaerobic dehydrogenase
TIGRFAM ID	[TIGR01591] formate dehydrogenase, alpha subunit, archaeal-type

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGCG AGGACCCGGC GAGCCACGTC GACGACGTGG AGACCGAGCG GCGGCCGACC 
GCCGTCGAGA AACTCCCCTC AGTACCGAAC GTCGCCGATC CGCGGCCGAG CACCCCGCTG 
ACCGAACAGT TCGAGACCGG AACCGCCAAC GATCCGGACG TCCGCTCCGG AGACGGCAAG 
GACGGAATGA CCCACCTCAC GGTCGACGGG ACGCCCGTCT CGGTGCCGCC GGGCTCGACG 
ATCATCGACG CGATCGAGTC CGTCGAACCG GCCGACGAGT TGGCCGCGCT CTGTTACTAC 
GACCGCGACA CCGAACAGGC CGACGAGATC GGTCCGCGCG GCGAGTGTCG GACCTGCACC 
GTCCACACCG AGGAGCACGG GCTCGTGACG TCCTGCTCGC ACCCCGTCGA GGAGGGGATG 
ACGGTCCGGA CCGACGAGGA CGACGCGGCC GAGGCCCGCG AGGTCAACCT CGACCTCCAG 
CTGTCGGACC ACAACCTCCG CTGTACGACC TGCGGCCAGA ACGGCCGCTG CGAACTGCAG 
GACACCTCCA TCGAGCAAGG CGTCGAGGAG CCCCGTTGGG GCGTCTTCGA GGACCGCGAT 
CAGTACGAGC CGCTCGACGA CACCTCGCCG GCCATTCAGA TCGACCGCAA CAAGTGCATC 
CTCTGTAACC GCTGCGTCGA GGCCTGCAAC GACGTGCAGG TCGAGGGCGT CCTCCGGATG 
GAGGGCAACG GCCAGGACAC CCGCATCGCC TTCCAAAACG GCGAGGACAC CTTCGACGAG 
TCCACCTGCG TCTCCTGTGG CCACTGCGCG ACCGTCTGTC CGACCGGCGC CCTGGTCGAG 
CAGGGACTGA CCGACGCTGC GACGATTCCC CTGCCCGGCT TCACCCAGGA GAACTCGATC 
GGGAAAGTCC TCGAGAGTCC GAAGGCCGAA ACGGCCGATC AGACCGAGGC GCCGAACCGG 
GACCTCCCCT ACGACGTGGG CGGGCGAGGG AAGCCCGAGG AGGACCTGTC CGGCGTCGCC 
CGCTTCATGT CGATCGCGAG AGCGCGCGCC GGGGACTCGA AGCGGCAGAT GAGCCATACC 
CTGAAAGAGG TCGGCGACCG CGCGCTCGAG GAGTTCGAAC ACTTCTCCGA GGGGATCGCC 
AGCGAGGCGA TGCCGGCCGG TCAGCTGTTC AACGTCGCGA CGACGATCGG CGACGCGCGC 
CTCTCGCGGA TCGAGAAGGC CGAGACCACC TGTAACTACT GCGCGGTCGG TTGTCGGTTC 
GAGCTCTACG GCAAGGACGG CGAGGTGCTC GGCGTCCGAC CCGCCGAGCC CGACTCGGCG 
CCGGCGAACG ACTTCTCGAC CTGCGTGAAG GGGAAATTCG GCTACGATTA CGTCGATGCC 
GACGACCGAC TCGAGAAACC GCTGATCCGG AAGGAGGACG CGCCGGACGG GCCGGTCGGC 
CGTGAGGGCT TCCGCGAGGC CACGTGGAAG GAAGCGCTCG AGCGCGTCTA CGAGGGGCTC 
TCGGAGGTCC GCGAGGAACA CGGCAGCGAG AGCCTCTCGG TCATCTCCTC GTCGAAGACG 
ACCAACGAGG AGAACTTCCT CTGCCAGAAG TTCGCTCGGC AGGTGCTGGG GACGCCCCAC 
GTCGACAACT GCGCGCGGCT CTGTCACTCC TCGACCGTGG CCGCGCTGCA GCAGACGGTC 
GGTTACGGCG CGATGACCAA CCGGATCAAC GAGGACATCG CGGAGACCGA CTGCTATCTC 
ATCACCGGTT CGAACACGAC CGAGTCCCAC CCCGTCCTCG CGACGCGGAT CAAGCAGAAC 
GTCCGGGACG GCGCCGACCT CATCGTCATC GACCCCCGTG AGATGGGACT GGCCGAGCAC 
GCCGACCAGT ACATCCGGAC GACGCCCGGC GAGGACGTGG CCTGGATGAA CGGGATGATG 
CGGTACATCA TCGAGAACGA CCTCCACGAC GAGGAGTTCA TCGAGGAGCG GACGAAGCAC 
TTCGAGAAGT TGAAAGAGAA GGTCGAGCCG TTCACGCCCG AGAAGGTCGA GGAACTGACG 
GCCGTCCCCG CCGAGGAACT GAAGCAGGCC GCGGAGACGA TCGCCACCGC GGACACCTGC 
ATCTTCGGCT GGGCGATGGG GCTGACCCAG CACAACACCG GCACGCGGAA CGTGATGTCG 
ATCGCCAACC TCGCGCTGCT GACGGGCAAC CTCGGCAAGC CCGGGGCCGG CCTCTCGGCG 
TTCCGCGGAC AGAACAACGT CCAGGGCGGG GGCGGCGACA TGGGACCGGC CCCGCACACG 
CTCCCGGGAT ACCAGGACCT CGCCGACGAG GAGGTGCTGG ACAAGTTCGC CGACGCGTGG 
GGAGAGCGCC CGCCCAACGA GATCGGGCTT CGGCTCCCGG AGATGTTCCA CGCGATTAAC 
GACGACGAGC TCCGCGGCAT GTTCATCATG GGCGAGAATC CCGTCCTCTC GGAACCGGAC 
GTCGACAACG CCGAGGAGGG GCTCGAGAAT ATCGACTTCC TCGCCATGCA GGACATCTTC 
CTGACCGAGT CGGCCGAGTA CGCCGACGTC GTCCTCCCGG CCGCCTCCGC CGCCGAGAAG 
TCCGGCACGT TCACGAACAC CGAACGGCGC ATCCAGCGGG TCCGTCCCGC GGTCGACTCG 
CCGGGGAAGG CGAAACCCGA CCAGGAGATC CTCATCCAGC TCGCTCGACG GTTCGGCTAC 
GACTGGGACT ACGACGGTCC GGCCGAGGTG ATGGAGGAGA TCAACGACCT CGTCCCCATC 
TACGGCGGCG TCACCTACGA GCGACTCGAG GAGGAGACCA AGGGCATCCA GTGGCCCTGC 
TTCGACGAGG ACCACCCCGG GACCCCCTAC CTCTACGAGG ACGAGTTCAA CTTCGAGGAC 
GGGAAGGCCC GCTTCGTCCC CGCCGACTAC GCCAAGCCGC CGGACATGCC CGACGAGGAG 
TACCCGATCA CGCTCTCCTC GGGGCGGGTC CTGTACCACT GGCACACCGG CACGATGACC 
CGCCGGGTCG GGACGCTCAT GAACCACGTC CCCGAGAGCT TCGTGACGAT CCACCCCGAG 
ATGGCCGACC AGTTGGGCAT CGACGATCAG GAGTACGTCC GCGTCCAGTC CCGGCAGGGC 
GAGATCGTCG TGAAGGCCAA CGTCGAGGAC ACCTCCGATC CCGGCGTCGT CTTCATACCG 
ATGCACTTCC CGCAGGGGGC GATCAACAAG CTCACCCAGC ACGAACTCGA CCCGACGTCG 
TTCATCCCGC AGTACAAGGT GACGAGCGTC CGCATCACGC CGCTCGACGT TCCCCCCGAG 
GAGGCGGCCA ACGTCGTCTC CCCGACGCCC GGCCAGCTCG AGGGCCAGGA CGGCGACCCC 
GAGGACGTCG GCGGTCGGCG GGCTGACGAC TGA

Protein sequence

MSSEDPASHV DDVETERRPT AVEKLPSVPN VADPRPSTPL TEQFETGTAN DPDVRSGDGK 
DGMTHLTVDG TPVSVPPGST IIDAIESVEP ADELAALCYY DRDTEQADEI GPRGECRTCT 
VHTEEHGLVT SCSHPVEEGM TVRTDEDDAA EAREVNLDLQ LSDHNLRCTT CGQNGRCELQ 
DTSIEQGVEE PRWGVFEDRD QYEPLDDTSP AIQIDRNKCI LCNRCVEACN DVQVEGVLRM 
EGNGQDTRIA FQNGEDTFDE STCVSCGHCA TVCPTGALVE QGLTDAATIP LPGFTQENSI 
GKVLESPKAE TADQTEAPNR DLPYDVGGRG KPEEDLSGVA RFMSIARARA GDSKRQMSHT 
LKEVGDRALE EFEHFSEGIA SEAMPAGQLF NVATTIGDAR LSRIEKAETT CNYCAVGCRF 
ELYGKDGEVL GVRPAEPDSA PANDFSTCVK GKFGYDYVDA DDRLEKPLIR KEDAPDGPVG 
REGFREATWK EALERVYEGL SEVREEHGSE SLSVISSSKT TNEENFLCQK FARQVLGTPH 
VDNCARLCHS STVAALQQTV GYGAMTNRIN EDIAETDCYL ITGSNTTESH PVLATRIKQN 
VRDGADLIVI DPREMGLAEH ADQYIRTTPG EDVAWMNGMM RYIIENDLHD EEFIEERTKH 
FEKLKEKVEP FTPEKVEELT AVPAEELKQA AETIATADTC IFGWAMGLTQ HNTGTRNVMS 
IANLALLTGN LGKPGAGLSA FRGQNNVQGG GGDMGPAPHT LPGYQDLADE EVLDKFADAW 
GERPPNEIGL RLPEMFHAIN DDELRGMFIM GENPVLSEPD VDNAEEGLEN IDFLAMQDIF 
LTESAEYADV VLPAASAAEK SGTFTNTERR IQRVRPAVDS PGKAKPDQEI LIQLARRFGY 
DWDYDGPAEV MEEINDLVPI YGGVTYERLE EETKGIQWPC FDEDHPGTPY LYEDEFNFED 
GKARFVPADY AKPPDMPDEE YPITLSSGRV LYHWHTGTMT RRVGTLMNHV PESFVTIHPE 
MADQLGIDDQ EYVRVQSRQG EIVVKANVED TSDPGVVFIP MHFPQGAINK LTQHELDPTS 
FIPQYKVTSV RITPLDVPPE EAANVVSPTP GQLEGQDGDP EDVGGRRADD