Gene Htur_4229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_4229
Symbol
ID	8744857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013744
Strand	-
Start bp	499470
End bp	500858
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	64%
IMG OID	646514775
Product	selenium-binding protein
Protein accession	YP_003405722
Protein GI	284167444
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTCTG ACTCACACCA CACCCCTGAG AGCCACGCCC ACGAACACCA CGCAGGGGCG 
GTCGGATACG ACACCCCGCA AGCCGCTATC GAACAGTCCG CTCGCGAGCG CCTCGCGTAC 
GTTCCGGCCC TCTACGTGGG GACCGACATC GACGCGCCCG ACATGCTGAC CGTCGTCGAC 
GTCGACCCCG ACTCGTCGAC TTACTGCGAG ATCGTTGACC GGATCGAGAT GCCGACCAAA 
GGCGACGAAC TGCATCACTT CGGCTGGAAC GCCTGCTCGT CGTCCTGCCA CGTCGAGGGA 
GCGGAGCGGC GGTACCTCGT CGTTCCCGGA AACCGCTCGT CGCGAATCCA CATCGTCGAT 
ACCGAGGACC GGGAGCACCC CGAACTCGTG AAGGTCATCG AACCGGAAGA CGTCTTCGAG 
CACGACCTCT CCGCCCCTCA CACCGTCCAC TGCATCCCCG AGGGGAAGAT CATGATCAGC 
ATGCTCGGGA ACGCCGACGG CGACCTCCCT GGCGGCTTCC TCCTGCTGAA CGAGGACTTC 
GAAATCGACG GCCGCTGGGA CGAGCCCGGA GACATCGAGA TGAACTACGA CTTCTGGTAC 
CAGCCCCGTC GGAACGTGAT GGTCTCGAGC GAGTGGACCG CGCCGAAGAC CTACCAACCG 
GGATTCGATC TCGAAGACGT CGAAGCCGGG AAGTACGGAC AGCGGCTCCA CGTCTGGAAC 
TGGGACGAGA AGACGGTCGA ACAGACGATC GACCTCGGCG AGGAGGGACT GGTGCCCCTC 
GAGGTGCGCT TCCTCCACAC CCCCGAATCC GAACACGCCT ACGTCGGCGC CGCGCTCTCG 
TCGAACATGT TCCACCTGTT CAAGGAGGGC GACGAGTGGC GTGCGACGAA GGTCATTGAC 
GTCGAGCCGC GCGAACACGA GGACTGGGAC ATGCCGGTTC CCGGGCTGAT CACCGATCTG 
CTGGTCTCGA TGGACGATCG GTACCTGTTC TTCGCGAACT GGCTCCACGG GGAGGTCCGC 
ATGTACGACG TCTCCGATCC GTCGAACCCG CGGCTGACCG ATACGATCTC GGTAGGCGGC 
CTCTTCGGCG ACGTCCGCGA GGTGAAGGGC CGGAAGATCA CCGCCGGGCC GCAGATGCTT 
CAGCTCTCGC TGGACGGCAA GCGCCTCTAC TGGACCACCT CGCTGTACTC CTCGTGGGAC 
GACCAATTCT TCCCCGAGGA GGGCGAGCGT GGGTCTGTCA TGCTCAAAGC CGACGTGAAC 
CCGCGCGAGG GAACGATGAC CCTCGACGAG GAGTTCCTCG TCGACTTCGG AACGCTTCCC 
GAAGGCCCGG CCCGCGCCCA CGAGATTCGG TGGCCCGACG GCGACTGCAC CAGCGACGTC 
TGGATGTAG

Protein sequence

MSSDSHHTPE SHAHEHHAGA VGYDTPQAAI EQSARERLAY VPALYVGTDI DAPDMLTVVD 
VDPDSSTYCE IVDRIEMPTK GDELHHFGWN ACSSSCHVEG AERRYLVVPG NRSSRIHIVD 
TEDREHPELV KVIEPEDVFE HDLSAPHTVH CIPEGKIMIS MLGNADGDLP GGFLLLNEDF 
EIDGRWDEPG DIEMNYDFWY QPRRNVMVSS EWTAPKTYQP GFDLEDVEAG KYGQRLHVWN 
WDEKTVEQTI DLGEEGLVPL EVRFLHTPES EHAYVGAALS SNMFHLFKEG DEWRATKVID 
VEPREHEDWD MPVPGLITDL LVSMDDRYLF FANWLHGEVR MYDVSDPSNP RLTDTISVGG 
LFGDVREVKG RKITAGPQML QLSLDGKRLY WTTSLYSSWD DQFFPEEGER GSVMLKADVN 
PREGTMTLDE EFLVDFGTLP EGPARAHEIR WPDGDCTSDV WM