Gene Htur_2472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_2472
Symbol
ID	8743081
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	-
Start bp	2535599
End bp	2537110
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	66%
IMG OID	646513058
Product	hypothetical protein
Protein accession	YP_003404023
Protein GI	284165744
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5434] Endopolygalacturonase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGACC GAACGCCCCG GCTCGGACTC GAGACGTTCG AGGAGGGCGA CGCGTGGGAT 
CACACCGACA CGGTCGAAGC CGTCGACGAA CACGCGATTG TCCGGGGACC GATCGCCGAC 
CGTCCGGACG AGGGCGAGTA CGACGACGAA CTCTACCACG CGAACGATCA GGGGATCACG 
TGGCGCTGGG ACGCCTCGAG CGAGGACTGG ACGTACTTCG GCGGCAAGGG CTGTTCGGAG 
CAGCCGATAC CGGGGACGAG TCACTTCGAG GCGGCGGAAC TCGTCCACGC GCGCACCGAG 
GAGACCCCCG TCTGGAACGT CGAAGCCCAC GGGATCGAGG GCGACGGCGA GACGGAAGTC 
GGGGCGGCCG TCCACGACCT CCTCGCGGAC GTCGCTGAGG CCGGCGGCGG GATCGTCTAC 
TTCCCGCCCG GCCGATACCT CCTCGAGCGG ACGCCGCTGA TCGGCGACGA TACGCTCCTG 
CTGGGCGCGG GTCGCGCGAC GGTCCTCGAG GGAACGCGCC CCGAGGACGA GGAAGGCCGG 
GCGCTGCTCT CCAACAGGGG CTACGACGCG GTCGATTTCG ACGGCGCGTC GGATTGGGCG 
ATCTGTAACG TCCGAATCGA TTCGCCGGCC ACGAACGGGA TCATGCCTGC ACACGCGGAG 
AACGTCCGGC TGGAACGAAT CTACGGCGAC CGGATCTACT ACCACCACAT CGACGTCGTG 
TCCTCGAAAA ACGTCGGGAT CGACGGCTAC TGGGCGACTC GAGGCGGCGA GGCCGACTCG 
GACGCGCCGA TTCAGTTCGA CAACCAGACC ACGGAAATCG CGTCGAACAG CGTCTGGAAC 
GGTAACGAGG AGCTACTGGC CGGGAGCGAC GGCACCCCGA CGCGGAACTG CACGCTCGAG 
AACTTCGAGA TCGACCCTGC GAACGGTCCG GAGTACGGCG TCCACATGCA CCGGAACGGC 
AACGAGTCGA TCACCATCAG GGACGGGTAC ATCACCGGTT GCCTCTATTC GGCGATCCGA 
GGCGACACCG GCGACGCGAT CGAGGACCTG ACGATCGACT CCGTCTCGTG TATCGAGAAC 
GCGCGGGGGA TCTCGCTCGG ACATATCAAG GGCGGCCGAC GAGAGCTGAC CATCAGCAAC 
GTCACGATCA GAACCGACAA CAGGGGGCTG GCCGCCGGCT CGGGACTGTA CGCGGCCGGG 
TTCGACGGCG CCGAGATCTC GAACACCGTC GTCGACGGCG AGTTCACGAA CGCGATCCTC 
TTCGACGACA TGGACGACCT GAAGCTGAGC ACCGTGACGG CCAAGGGCGC GAGGGATCAG 
GCGTTCCGAT TCCGGAATAA CGTCGACGCG ACGCTGACGA CCGCTCGAGC GGCCGAGTGC 
GGCGACGCGG GCGTCTACGT GGGAGACGGC AGTAGCATCG CCTACGGCGG CGTCACGTTC 
GACGATGTCG GCAGCGAAGT CGACATCCAC GACGATGGGA CGTTACGGGA GTGGACCACC 
TCCTCGTCGT GA

Protein sequence

MSDRTPRLGL ETFEEGDAWD HTDTVEAVDE HAIVRGPIAD RPDEGEYDDE LYHANDQGIT 
WRWDASSEDW TYFGGKGCSE QPIPGTSHFE AAELVHARTE ETPVWNVEAH GIEGDGETEV 
GAAVHDLLAD VAEAGGGIVY FPPGRYLLER TPLIGDDTLL LGAGRATVLE GTRPEDEEGR 
ALLSNRGYDA VDFDGASDWA ICNVRIDSPA TNGIMPAHAE NVRLERIYGD RIYYHHIDVV 
SSKNVGIDGY WATRGGEADS DAPIQFDNQT TEIASNSVWN GNEELLAGSD GTPTRNCTLE 
NFEIDPANGP EYGVHMHRNG NESITIRDGY ITGCLYSAIR GDTGDAIEDL TIDSVSCIEN 
ARGISLGHIK GGRRELTISN VTIRTDNRGL AAGSGLYAAG FDGAEISNTV VDGEFTNAIL 
FDDMDDLKLS TVTAKGARDQ AFRFRNNVDA TLTTARAAEC GDAGVYVGDG SSIAYGGVTF 
DDVGSEVDIH DDGTLREWTT SSS