Gene Htur_4698 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_4698
Symbol
ID	8745294
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013745
Strand	-
Start bp	289601
End bp	290734
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	61%
IMG OID	646515202
Product	Rieske (2Fe-2S) iron-sulphur domain protein
Protein accession	YP_003406149
Protein GI	284172767
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.412068
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCAGT GGGACGATTC ACAGGCGAAA GCGGTGAGCG AGGACATCAC GGAGAAGTCG 
AACGCGCTGC CGGCCCGGTA CTTCACCGAC GATGACGTCT TCGAGATGGA GAAAGACAAG 
GTGTTCGGCC AGTACTGGGT GTACGCCGGC CACGCCAACT GTATCAAGGA ATCGGGCCAG 
TACTTCACCC GGACGATCGG TGATCGCCAA CTGATCGTCG TTCGCGGTCA CGACGGCGAG 
GTCAAAGCGT TCGACAACGT CTGTGCCCAC CGCGGCTCGA AGATGGTCGA GGACACGCCG 
ATGACCGACC CCGGCGATGC AAAGCGAATC AAGTGTCCGT ACCACCTCTG GACGTACGAC 
CTCGACGGAG AGCTCAAAAG CACGCCCAAG AGCTTCGAAG AAGCGGGCCT GAACCCCGAC 
CTCGAGGACG AAGACGTTCA GAAGTTCGAC GCCGAAGAGA ACGCCCTGAA CGATGTGCAC 
GTCGACACCA TCGGCCCGCT GATCTTCGTG AACCTCAGCG AGGATCCGAT GCCGCTGGCC 
GAACAGGCCG GCGTGATGAA AGACCGCCTC GAGGCGCTGC CCCTCGGGGA GTACGAACAC 
GCCACCCGAA TCGTCTCGGA GGTCGAGTGC AACTGGAAGG TGTTCGCGAG CAACTACTCG 
GAGTGCGACC ACTGCCAGGC CAACCACCAG GACTGGATCA AAGGCATCTC GCTCAACGAG 
TCCGAACTCG AAGTCAACGA CTACCACTGG GTGCTCCACT ACACCCATGC AGAGGACGTC 
GAGGACGAGA TGCGGATCCA CGACGAACAC GAGGCCCAGT TCCACTACTT CTGGCCGAAC 
TTCACGGTCA ACATGTACGG CACTGCCGAC GGCTACGGCA CCTACATCAT CGATCCGATC 
GACACCAACC GGTTCCAGCT CATCGCGGAC TACTACTTCC GCGACAGCGA ACTCTCCGAG 
GAAGAGCGCG AGTTCGTTCG CACGAGCCGC CAGCTCCAGG AAGAGGACTT CGAATTAGTC 
GAACGTCAGT GGGAAGGGCT CAGAACGGGC GCGCTCGCCC AGGCTCAGCT CGGCCCCAAC 
GAACACACCG TCCACCGCTT CCACCAGCTC GCGCAGGAAG CCTACGACTC GTGA

Protein sequence

MTQWDDSQAK AVSEDITEKS NALPARYFTD DDVFEMEKDK VFGQYWVYAG HANCIKESGQ 
YFTRTIGDRQ LIVVRGHDGE VKAFDNVCAH RGSKMVEDTP MTDPGDAKRI KCPYHLWTYD 
LDGELKSTPK SFEEAGLNPD LEDEDVQKFD AEENALNDVH VDTIGPLIFV NLSEDPMPLA 
EQAGVMKDRL EALPLGEYEH ATRIVSEVEC NWKVFASNYS ECDHCQANHQ DWIKGISLNE 
SELEVNDYHW VLHYTHAEDV EDEMRIHDEH EAQFHYFWPN FTVNMYGTAD GYGTYIIDPI 
DTNRFQLIAD YYFRDSELSE EEREFVRTSR QLQEEDFELV ERQWEGLRTG ALAQAQLGPN 
EHTVHRFHQL AQEAYDS