Gene Htur_5166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_5166
Symbol
ID	8745714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013747
Strand	+
Start bp	58822
End bp	59892
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	67%
IMG OID	646515523
Product	dihydroorotate dehydrogenase
Protein accession	YP_003406470
Protein GI	284176193
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.313486
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCTGT ACTCGCGGGT TCGCCCCCTC GCGTTCAAGC TGCCGGCCGA GACGGCCCAC 
GACCTCGGCA AGCGAACGCT CCGGGCGGCC CAGTCGACGT GGCCGACGCG GCGAGCCCTC 
GCCGCGGCCT ATCGGTATGA CCATCCCGCG CTCGAGGTCG ACCTGTTCGA CTCGACGTTT 
CCGAACCCGG TGGGGATCGC GGCCGGCTTC GACAAGAACG CCGAGGTGAC CCACGCCCTC 
GAGGCGCTCG GCTTCGGGTT CGTCGAAATC GGCACCGTCA CGCCCTATCC GCAAGAAGGC 
AACGACCGTC CCCGGCTATT CCGGCTGCGG GAGGACGAGG GGATGATCAA TCGGATGGGC 
TTCAACGGGC AGGGAATGGA GACCGTCAAG GAACGACTCG AGGAAGACGG CACGCCGGGA 
TTCCCGCTTG GCGTCAACAT CGGGAAGATG AACTCCTCGA CCGAACGGGA GGCGATCGAG 
GACTACCGAC GGGTCTTCGA TCGGGTCTCG CCGTTCGCCG ACTACGTCGT CGTCAACGTC 
TCCTGTCCGA ACACGCCCGA CGAGTTCAAC GAGGCCTCGC CCGAGCATCT GCGGGCGATC 
TTCGAAACCC TCGAGGCCGA GAACGACGGG AACGTGCCGA TGCTGGTGAA GATCGGTCCC 
GACGAGCCCG AGGACGCGAT TTTGGATCTC GTCGATATCG TTCAGGAGTT CGGTCTGGAC 
GGGATCGTCG CGACGAACAC CTCGACGGCT CGCGAGGGGC TCGAGTCGCC CGCCCGTGAG 
GAGTGGGGCG GACTCAGCGG CGCCCCCATC GAAGACAGAT CCACCGACGT GATCCGAACG 
ATCGCCGGGC ACACGGACGG CGAACTCCCG ATCGTCGGCG TCGGCGGCGT CGATTCGGCC 
GCGAGCGCCT ACGAGAAGAT TCGCGCGGGC GCGTCGCTCG TGCAACTCTA TACGGGGTTC 
GTCTACCGGG GGCCGTCGAC GGCCGGGCGG ATCAACCAGG GACTGGTCGA CCTGCTCGAG 
CGCGACGGAT TCTCGTCGGT CGAGGACGCG GTCGGCGCCG ATCTCGAGTA G

Protein sequence

MTLYSRVRPL AFKLPAETAH DLGKRTLRAA QSTWPTRRAL AAAYRYDHPA LEVDLFDSTF 
PNPVGIAAGF DKNAEVTHAL EALGFGFVEI GTVTPYPQEG NDRPRLFRLR EDEGMINRMG 
FNGQGMETVK ERLEEDGTPG FPLGVNIGKM NSSTEREAIE DYRRVFDRVS PFADYVVVNV 
SCPNTPDEFN EASPEHLRAI FETLEAENDG NVPMLVKIGP DEPEDAILDL VDIVQEFGLD 
GIVATNTSTA REGLESPARE EWGGLSGAPI EDRSTDVIRT IAGHTDGELP IVGVGGVDSA 
ASAYEKIRAG ASLVQLYTGF VYRGPSTAGR INQGLVDLLE RDGFSSVEDA VGADLE