Gene Hhal_0211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0211
Symbol
ID	4710987
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	243786
End bp	244814
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	70%
IMG OID	639854670
Product	dihydroorotate oxidase
Protein accession	YP_001001807
Protein GI	121997020
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.203581
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACGCCC TGATCCGCCA ACTGCTGTTC CGCCTCGAGC CCGAACAAGC CCATCGCGTG 
AGTATGCAGC TCGCCCGCTT GGGTCTGCGT ATCGCCGCCG TCCCCGGGGT GCGCAGCCTG 
CCGGCCGTGC CGCGGCGGGT GATGGGTATC GATTTCCCCA ATCCGGTGGG CCTGGCCGCC 
GGCTTTGATA AGGATGGCGA GTACATGGAC GTACTCGAGC AGCTCGGCTT TGGCTTCCTG 
GAGTTGGGCA CGGTAACGCC CCGCGCGCAA CCGGGTAATC CGCAGCCGCG GGTCTTCCGC 
ATCCCCGAGC ACGAGGCCCT GATCAACCGC ATGGGTTTCA ACAACCAGGG GGCCGAGCCG 
CTGGTCCGCC GGCTGGAGGT CTCGCGCCAC CGCGGTGTGG TGGGTATCAA CATCGGCAAG 
AATCGGGATA CACCCCCCGA GCGGGCCGTC GAAGACTACG CCCAGGCGCT GGGGATGGTT 
TACGGGGTGG CCGACTATGT GGCGGTCAAC CTCAGCTCGC CGAACACCCC GGGGCTGCGC 
GACCTGCAGC ACGAGGGCGC GCTGCGCAAC CTGATCGACC GCCTGCAGAC CGAGCGCAAG 
CGGTTGGCCG AGCTGCACGA CAAACGGGTG CCGCTGGTGG TCAAGATCGC CCCGGACTGG 
GAGGCCGGGG AGCTGGACGC CACCCTGGAT ATCCTGCTCG AACGCCGGGT GGACGGCATC 
GTCGCCACCA ACACCACCCT CGGGCGCACC GGGGTGGAGC AGACCCCCCA GGCCCGCGAG 
AGTGGGGGGC TCAGCGGTGC GCCGTTGCGG GAGCAGGCCG AGTGGGTCCT GGAGCAGGTG 
GCGGCCCGCC GTGATCGGCG GACGGCCCTG ATCGCTGCCG GGGGGATCAT GAGCGGTGAG 
GACGTGACCC GGCGCCTCGA TCTCGGTGCG GATCTGGTCC AGCTCTATAC CGGCATGATC 
TACCGCGGTC CCGGCCTGGT CCAGGAGGCC GTGCGAGCCG CCGCCCGCCA CGCCGGGCAG 
CCCGCCTAG

Protein sequence

MYALIRQLLF RLEPEQAHRV SMQLARLGLR IAAVPGVRSL PAVPRRVMGI DFPNPVGLAA 
GFDKDGEYMD VLEQLGFGFL ELGTVTPRAQ PGNPQPRVFR IPEHEALINR MGFNNQGAEP 
LVRRLEVSRH RGVVGINIGK NRDTPPERAV EDYAQALGMV YGVADYVAVN LSSPNTPGLR 
DLQHEGALRN LIDRLQTERK RLAELHDKRV PLVVKIAPDW EAGELDATLD ILLERRVDGI 
VATNTTLGRT GVEQTPQARE SGGLSGAPLR EQAEWVLEQV AARRDRRTAL IAAGGIMSGE 
DVTRRLDLGA DLVQLYTGMI YRGPGLVQEA VRAAARHAGQ PA