Gene Htur_5274 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_5274
Symbol
ID	8745922
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013749
Strand	-
Start bp	5346
End bp	6803
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	56%
IMG OID	646515728
Product	glycosyl hydrolase BNR repeat-containing protein
Protein accession	YP_003406675
Protein GI	284176400
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	110
Plasmid unclonability p-value	0.0502188
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGGAAG GGGAACGCAA AGTCTCGAGA CGAGCAGTGC TCGCAGCCGC CGGGGGAGTC 
ACCGCTGTTG GAACAGCGCT GAGTCAATCC AGCCAGAAAA AACTCGGAAA TCTGTTCGGG 
GGGACCATGG GGCTTAACGA AGCCTACAAC GTGAGCGGCG ATCTCTGGAT CGGCCCGGAC 
TCGGCGAAGG GCGACGTCGC TGCCGAGAGT GGACGGGTCT ACATGGCGGT AGATACGCAA 
GTCGAATATT ACGGCACCGG AGACAGCTGG GACGGAATGG GGCTTGGGAG CGCCTCGAAC 
CCAGTCTCCG AGATCCACAG CGAATCGGTA AGTACAGAAG AAGCCGTTAC CGCTCGCCAT 
AAAAGACTGG GGAGCGTTAC TACGACACCG AGTTATTGGG GTCCAGACCT TCAACTGGAT 
AACGTCTATC AGACGTTTGA CTCGCAGCAC GTCAAAGGCC GTCTGATTGG CAAATACTAC 
TGGTCTGACC CTCCGTATGG CACCGAAAAC GCGGGTGTGG ACTCATACGA TCCCGACGAC 
GGGGCAAACA ACAACGGGGT TGCTATGGAT GGGGACGCAA CACCGTGTCT GGTAGCCGAC 
GATTCGATTT TCGTTTTCAA AGACAAGGAC GAAACGAACG GTCTTCCGGT TCGGATCTAC 
CGCGCTCCAG ACTATCAAAC CACGTTCGAC AACAGCGGCA CGCTCCAGTA TGAGCGTGTG 
CTTGATTTTG ATGACGGTGG GGCGACGATG ATCGGCAAAG GTGGGCGATT TAACTACCAA 
ATTTCAGCCC ATCCTGATTC GGGGACTATC GTTGTTGGCG AATACAATCA GACGGAAGGG 
GCTGACCCGA AACTCTACCG CTCGACGGAC AACGGCCAAA CGTGGAGTGT CGTTTATCAA 
GAGACAGGGG TCCCGGATCA CGTCCACTCG GTCGCTCCAG ATCCATACGA GCCGGATCAC 
TGGATTGTCT GCCTCGGAGA CAACGGCGAA GATCGGTATC TCGAGTCGTG GGACGATGGT 
GCGACTTGGT CGCGAGAACC GCTTGGATTC GACCCCAAAA CGCACGCTGT TGGGATTGAC 
TACGGTCCTG ATTACATCTA CTTCGCGCAA GACCAAGGCT CAGGGTCCTA TCATGGTCCG 
TGGGTCGTCC GGCGCGAAGA TCGCGAGATG TTCTCCCTCT GTTCAACGAA CCCACGGTTC 
AAGTACCGGG GCGTCGTTGA CGGCATGATC GAGCTCGGTC TCATCCACGA CAGGGCTCAC 
GGAATCACGT ACATTCGTGG GCGAGACGGG ACAAATGGCA CGAATTACGT GTACTATGTC 
GACGGAATTG GAGGAGAACC ACAGATGATT GACGATGCAT GGGGCTCACC ACAAATGCAC 
CCTGTTGATG GCTACATATC GTCCGCTCAG GGGAAGATGT ACGCCCGACT GTCGCCGGTT 
CCTGCCAATA AATTGTAA

Protein sequence

MSEGERKVSR RAVLAAAGGV TAVGTALSQS SQKKLGNLFG GTMGLNEAYN VSGDLWIGPD 
SAKGDVAAES GRVYMAVDTQ VEYYGTGDSW DGMGLGSASN PVSEIHSESV STEEAVTARH 
KRLGSVTTTP SYWGPDLQLD NVYQTFDSQH VKGRLIGKYY WSDPPYGTEN AGVDSYDPDD 
GANNNGVAMD GDATPCLVAD DSIFVFKDKD ETNGLPVRIY RAPDYQTTFD NSGTLQYERV 
LDFDDGGATM IGKGGRFNYQ ISAHPDSGTI VVGEYNQTEG ADPKLYRSTD NGQTWSVVYQ 
ETGVPDHVHS VAPDPYEPDH WIVCLGDNGE DRYLESWDDG ATWSREPLGF DPKTHAVGID 
YGPDYIYFAQ DQGSGSYHGP WVVRREDREM FSLCSTNPRF KYRGVVDGMI ELGLIHDRAH 
GITYIRGRDG TNGTNYVYYV DGIGGEPQMI DDAWGSPQMH PVDGYISSAQ GKMYARLSPV 
PANKL