Gene Acid345_0389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0389
Symbol
ID	4069211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	446925
End bp	447890
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	60%
IMG OID	637982392
Product	dihydroorotate oxidase B, catalytic subunit
Protein accession	YP_589468
Protein GI	94967420
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01037] dihydroorotate dehydrogenase (subfamily 1) family protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.42122
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.593329
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCGA TGGCCACCCA ACCCAAACCC GCCGAGGACG ACGAGCTCCT GTTTGACATG 
AGCGTGAGCT TCTGCGGTAT CAAGCTCAAG AACCCCGTGC TCGCCGCCAG CGGGACCTTC 
GGCTACGGCG TGGAGTTCGA AGACATCGTC ACCATCGAAA AGCTTGGAGG GTTCGTTTCC 
AAGGGCCTCT CCAGAGAACC GATGCCCGGC AATCCTCCGC CTCGACTTTG GGAAACCGCC 
GCCGGCATGC TCAACGCCAT CGGCCTCCAG AACATCGGCG CAAAAGCATT CGTCGAAGAA 
AAGCTCCCGC TGCTGCGCAA ACTGAAAAAC GTCCCCGTCT TCTGCAACGT CTACGGAACC 
TGCAACGAAG ACTACGAAGA GACCATCCGC ATTCTCAACG ACGGCGAAGG CATCACCGCC 
TACGAACTCA ACGTCTCCTG CCCCAATACA CAGCACGGCG GCATGACCTT CGGCGCCGAT 
CCCACGCTGC TCGCCGAAGT CGTCACCGTC GCCAAAAAAG CCGCCACCCG CCCGCTCATC 
GTAAAGCTCT CACCCAACGT CACCAGCATC CCGCAAATGG CGAAAATTGC GCAGGACGCT 
GGCGCCGACG CGATCTCCCT GGTCAACACC TTCGTCGGCA TGGCCATCGA CGTCGAAACC 
CGCAAACCCC GCATCTCCAA CATCGTCGCC GGCCTCTCCG GCCCCGCAAT CAAGCCGATC 
GCCCTCCGCA TGGTCTACGA AGCCGCCAAA ACTGTCACCA TCCCGGTCAT CGGCATCGGC 
GGCATCAGCA CCGCCGAAGA CATCGTCGAG TTCATGCTCG CCGGCGCCAC TGCCGTTGAA 
GTAGGTACCG CCAACTTCTG GGACCCCTGC GCCAGCGAAC GCCTCGTCGA CCAGCTAGAA 
AAATGGTGCC TCGAACACCG AGTCCAAAAA ATCTCCGAAC TCACCGGCGG AATGCTCCTC 
TCCTAA

Protein sequence

MKSMATQPKP AEDDELLFDM SVSFCGIKLK NPVLAASGTF GYGVEFEDIV TIEKLGGFVS 
KGLSREPMPG NPPPRLWETA AGMLNAIGLQ NIGAKAFVEE KLPLLRKLKN VPVFCNVYGT 
CNEDYEETIR ILNDGEGITA YELNVSCPNT QHGGMTFGAD PTLLAEVVTV AKKAATRPLI 
VKLSPNVTSI PQMAKIAQDA GADAISLVNT FVGMAIDVET RKPRISNIVA GLSGPAIKPI 
ALRMVYEAAK TVTIPVIGIG GISTAEDIVE FMLAGATAVE VGTANFWDPC ASERLVDQLE 
KWCLEHRVQK ISELTGGMLL S