Gene Pnec_1080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnec_1080
Symbol
ID	6183263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polynucleobacter necessarius subsp. necessarius STIR1
Kingdom	Bacteria
Replicon accession	NC_010531
Strand	+
Start bp	937003
End bp	938037
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	48%
IMG OID	641671691
Product	Dihydroorotate oxidase
Protein accession	YP_001797868
Protein GI	171463755
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.106041
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	0.333003
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGATC GTTACTCCCT CCTGCGCCCT TGGCTTTTTT GCATAGACCC TGAAAAAGCC 
CACAACCTTA CCCTAAGTAA TTTAGATCGC GCACAGCGTT GGGGATTTTT GGAACGCTTG 
ATTACCAAAC CGATTAACGA TCCTCAAGTA TTGTGTGGGA TTGAGTTTTC CAACCCTGTT 
GGTCTAGCCG CTGGATTAGA CAAAGATGGC AAGTATATCG ATGCACTGGC TGCATTAGGA 
TTTGGATTTT TAGAAATCGG CACCGTTACA CCCCGACCAC AACCTGGCAA TCCCAAGCCA 
CGAATGTTTC GACTCCCGGA AGCACAAGCC ATCATTAATC GTATGGGCTT CAATAACGAT 
GGTGTTGAGG CCTGCGTAGC AAGAGTACGC TGTTCAAAAT TTTGGCAAAA CGGCGGCGTT 
CTTGGGATGA ATATTGGCAA AAATGCCAGC ACACCAATTG AAGAGGCGTC GCGCGATTAC 
ATCTTGGCTA TGGAAGCTGT TTACGAAATT GCTACTTACA TTACCATCAA TATCTCTTCC 
CCTAATACTC AAAATCTACG CGCACTCCAG GGCGAAGAAA TGCTCCGCGA ATTACTCGGC 
AGCTTAGGTG AAGCCAGAAA ACATTTATGC GATCGTCATG GCGTACGAAA ACCACTATTC 
CTGAAAATTG CACCAAACTT AGATCAGGGC GATATCAATC TCATTGCCGA CCTCCTACTT 
GAGTTTGGCA TCGATGCAGT TATTGCCACC AACACAACTA TCTCCCGCGA TGCAGTCAAG 
GGAATGGAAT TTGGCGAAGA AGCTGGCGGC CTATCTGGCG CACCTGTTCG CAATGCCTCG 
AATATCGTCA TCAAAGCTTT GAAAGCAAGG CTTGGCAATC AACTACCGAT CATCGGCGTT 
GGCGGCATCA TGTCTGGAGT TGATGCACGA GAAAAGATCA TGGCTGGTGC TAGCCTGGTC 
CAACTCTATA GCGGCCTGAT CTATCGCGGC CCAGACTTGG TCTACAAGTG CGCTACCGTC 
CTAAGGCAAC CCTAA

Protein sequence

MIDRYSLLRP WLFCIDPEKA HNLTLSNLDR AQRWGFLERL ITKPINDPQV LCGIEFSNPV 
GLAAGLDKDG KYIDALAALG FGFLEIGTVT PRPQPGNPKP RMFRLPEAQA IINRMGFNND 
GVEACVARVR CSKFWQNGGV LGMNIGKNAS TPIEEASRDY ILAMEAVYEI ATYITINISS 
PNTQNLRALQ GEEMLRELLG SLGEARKHLC DRHGVRKPLF LKIAPNLDQG DINLIADLLL 
EFGIDAVIAT NTTISRDAVK GMEFGEEAGG LSGAPVRNAS NIVIKALKAR LGNQLPIIGV 
GGIMSGVDAR EKIMAGASLV QLYSGLIYRG PDLVYKCATV LRQP