Gene Apar_0811 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0811
Symbol
ID	8413676
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	892494
End bp	893420
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	50%
IMG OID	645022393
Product	dihydroorotate dehydrogenase family protein
Protein accession	YP_003179831
Protein GI	257784614
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01037] dihydroorotate dehydrogenase (subfamily 1) family protein

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0183468
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.536442
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAGACC AGGTAAAAAT GGCCGTCAAT CTGGGTGGAA TCCAGATGAA AAATCCTATT 
AATACTGCTG CAGGTACCTT TGGTTATGGC TGGCAGTTTG AAGGCTTTTA CGACGTCTCC 
CTGCTTGGCG CCATTACTAT GAAGGGTGTT GCCCGCGTTC CTTGGGAAGG AAATCCTGCT 
CCTCGTATGT GTGAGCTTAA CGGCGGCATG ATGAACAGCG TTGGCCTTGC TAATCCGGGA 
GTGGATGATT TTATCGCTCA CACTGATGAC TACATGAAAG ACCTTGAAGA CCGTGGTACG 
CGCGTTATCA TGCAGATGGC AGCACATTCC GTGCAAGAAA TGATTGACGT TGTCGAGCGT 
CTTGAGGAGC TTAATCCGCA CATTTCAGCT ATTGAGCTTA ACGTGAGCTG TCCAAATCTC 
GAGAAGGGCG GCAGACCTCT TGGCGGCACT CCTGAGCAGG CAACAGAGAT TATGAAAGCG 
GTTCGTCCTC TAACGAAGCT GCCTATCTTG GTTAAGATGG CTCCCGTCAA TGTTGCTGAG 
ATTGGCAAGG CTTTTGAGGC TGAGGGTGCT GATGGCCTCA CATTGATTAA CTCTATTCCA 
GGCATGTCTA TCAATGTTCA TACTAGAAAG AGCAGGCTTT CTAAGCCAAC AGGCGGCCTC 
AGTGGTCCTT TATGTCATAA CGCTGCTGTC CGTATGGTTT GGGAGTGCGC TCAGGCAGTC 
TCTATCCCTA TCTGTGGTGT AGGTGGTGTG GAAACAGGCG AAGATGCTGC GGAATTTATT 
CTGGCAGGCG CTACGGCCGT CTCGGTTGGT TCTGCAAACC TTTACGACCC TATGTGTGCT 
CCACGTATTC TGAACGAGCT TACTGATTGG GCAAAGTCTC AGGGCGTATC TGACATCCAC 
GAACTGATTG GAGCTGTTGA ATGTTAA

Protein sequence

MVDQVKMAVN LGGIQMKNPI NTAAGTFGYG WQFEGFYDVS LLGAITMKGV ARVPWEGNPA 
PRMCELNGGM MNSVGLANPG VDDFIAHTDD YMKDLEDRGT RVIMQMAAHS VQEMIDVVER 
LEELNPHISA IELNVSCPNL EKGGRPLGGT PEQATEIMKA VRPLTKLPIL VKMAPVNVAE 
IGKAFEAEGA DGLTLINSIP GMSINVHTRK SRLSKPTGGL SGPLCHNAAV RMVWECAQAV 
SIPICGVGGV ETGEDAAEFI LAGATAVSVG SANLYDPMCA PRILNELTDW AKSQGVSDIH 
ELIGAVEC