Gene Htur_3497 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_3497
Symbol
ID	8744117
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	+
Start bp	3597814
End bp	3598854
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	71%
IMG OID	646514078
Product	luciferase family oxidoreductase, group 1
Protein accession	YP_003405032
Protein GI	284166753
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03558] luciferase family oxidoreductase, group 1

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCTCT CGATCGTCGA TCTCGCACCG ATGCCGGAGG ACGGTACCGC GACGGAGGCG 
TTCGAACACA CGATCGAACG CGCCCGGCGG GCCGAGCGAC TCGGCTACTC GCGGTTCTGG 
GTGGCCGAAC ACCACGACTT CACCGACTCG GTGGCGAGCA CGACGCCGGA GGCCCTGATC 
CCCTACGTCG CCGCGAAGAC GGAGGACATC CGGGTCGGCT CGGGCACCGT CCTGTTGAAC 
CACTACAGCC CGTACAAGGT CGCGGAGACG TTCGGCGTCC TCGACGCCTT GGAGCCCGGC 
CGGATCGACC TCGGCCTTGG CCGGGCGACG GGAAACCCCG CGAGCGATCT CGCCCTCCAG 
CCGGATCGCA GCCAACGGCG GCGAACCGGC GACGATCAGG CGGAGAAGGT CGAGGAGGTC 
GCCAACCATC TCTACGGCGG CTTCGACGAC GACCACCCGT TCCGCGACCT CGAGGTACCC 
CGATCGGGCG ACTCCGCGCC CGAAATCTGG GTCCACGGCT CGAGTCCACA GAGCGCGACG 
ATCGCCGGCG AACTGGGACT GCCGTACTGT TTCGCCGCGT TCATCCGCCC CGAGCCGGCG 
GTACAGGCGT TCGAGACCTA CCGGGAGCAC TTCGAGCCCT CGCCGGACGG CGCCGGCCTC 
GAGGCGCCCC GCGGCGCCAT CGCGGTGAAC ATGACCTGTG CCGAGACGGA CGAAGAGGCC 
GCGCGGCTCC GCGCGACCGC CGAGGCCTCG TCGCGACTGC TCCGCAGCGG GCGGGTCGAC 
CGACTCCCGA TTCGGTCGGT CGACCGGGCG ATCGACGTCC TCGGCGACGC TCCCGACCCG 
ACGCCGACGG ACATCGAGCC CGGCGAGTGG CCTCGGCACC TCTCCGGCGG ACCGGAGACG 
GCCCGCGAGA TCCTCGAGGA ACTGACCGCA CAGGCCGGGG TCGACGAGGT CGTGATCCAG 
AGTCAGCACG CCGACCCCGA GACGACGCTG CGCTCGCACG AACTGCTCGC CGACGCCGTC 
GGCCTCGAGG CGCGCGAATA G

Protein sequence

MELSIVDLAP MPEDGTATEA FEHTIERARR AERLGYSRFW VAEHHDFTDS VASTTPEALI 
PYVAAKTEDI RVGSGTVLLN HYSPYKVAET FGVLDALEPG RIDLGLGRAT GNPASDLALQ 
PDRSQRRRTG DDQAEKVEEV ANHLYGGFDD DHPFRDLEVP RSGDSAPEIW VHGSSPQSAT 
IAGELGLPYC FAAFIRPEPA VQAFETYREH FEPSPDGAGL EAPRGAIAVN MTCAETDEEA 
ARLRATAEAS SRLLRSGRVD RLPIRSVDRA IDVLGDAPDP TPTDIEPGEW PRHLSGGPET 
AREILEELTA QAGVDEVVIQ SQHADPETTL RSHELLADAV GLEARE