Gene Apar_0244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0244
Symbol
ID	8413092
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	286697
End bp	288052
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	50%
IMG OID	645021812
Product	dihydropyrimidinase
Protein accession	YP_003179267
Protein GI	257784050
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type [TIGR02033] D-hydantoinase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.20857
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.276303
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGTAT TAAAGAATGG TTTTCTTGTA TTGCCTGAAG GCGTCTTCTG TGGAGACTTA 
GTGCTCGATG GTACAAAAAT CATCCAGGTG GGAGGTACGT ACGAGGCACG TATAGATGAC 
AACGTTATCG ATGTTACGGG TAAATACGTA TTCCCTGGTT TTATTGACGC TCATACGCAT 
ATGCAATGCT GGACAGGCAT GGACTGGACA GCAGATAGCT TTGAGACGGG AACCCGTGCT 
GCTGCTTGCG GCGGTACCAC CACTATTGTG GATTATGCCA CACAAGACAA AGGCATGACG 
CTACCCGAAG CGCTTGATGA GTGGCATAAA CGTGCAGATG GTACCTGTAC TGCTAACTAT 
GCATTTCATA TGGCCATTGC TGATTGGAAT GAACAAACTA AAGCAGATAT GCAGGCTATG 
CGCGATGCAG GCGTTATGTC ATTTAAGACC TATTTTGCCT ACGATCATCT GCGTTTAGAT 
GACGCTCAGA CGCTTGAGGT ACTTGAATAT ATCCGTGATA TTGACGGTGT CCTGTGCGTT 
CACTGCGAGA ATGGCACGCT TGTGAATGAG CTACAAAGAC GTATGCTCGC AGCTGGTATT 
ACTGGTCCTG AGGGTCATCC TATGAGTCGT CCTGCAGCTT GTGAAGCAGA GGCTATTTCT 
CGTCTGTGTT ATCTTGCGGA GCTTGCCGAT GCTCGTATCA ACATTGTTCA CCTGTCCAGC 
GCTCTTGGTC TTGAGGCGGT TCGTGCGGCT AAGGCACGCG GCAAGGTAAA GATGGATGTT 
GAGACCTGTC CTCAGTATCT GTTGCTGGAT GATTCCCGCT ATCTTGAGAG TGACTTTGAG 
GGTGCCAAGT ACGTTATGAG TCCACCTTTG CGCAAGCCGC ACGATATTGA GGTATTGCGT 
CGGGCCGTAT GTGACGGCGA GATTGATACC ATTGCTACCG ATCACTGCAG TTTCAATCTT 
CACGGTCAAA AAGATCGCGG CATCGACGAT TTCACTCACA TTCCCAATGG CGGTCCTGGT 
GTAGAACATC GACCCGGTCT TATCATGACC TCGTTTGAGA ATCGCTTGGG CGTCCAAGAC 
TTTGCTCGTC TCATGAGTGA GGGACCCGCT CGTGTCTTTG GTATGTATCC GCGCAAGGGT 
GTCCTGCGTG TTGGCTCCGA TGCTGACGTG ACGGTATGGG ATCCAAGTGT GACGTGGACC 
ATCAGCGAGA AGAACCAGCA TCAAAACGTT GACTATACGC CATATGAGGG CTTTGAGGTC 
CACGGACGTC CGGCGTATGT TTTTGTCAAC GGAGAGCTGG CAGTGGTTGA TGGTGAGCCA 
ACCGGCGTGA AGCCAGGCGC ATACGTCAAA CGGTAA

Protein sequence

MNVLKNGFLV LPEGVFCGDL VLDGTKIIQV GGTYEARIDD NVIDVTGKYV FPGFIDAHTH 
MQCWTGMDWT ADSFETGTRA AACGGTTTIV DYATQDKGMT LPEALDEWHK RADGTCTANY 
AFHMAIADWN EQTKADMQAM RDAGVMSFKT YFAYDHLRLD DAQTLEVLEY IRDIDGVLCV 
HCENGTLVNE LQRRMLAAGI TGPEGHPMSR PAACEAEAIS RLCYLAELAD ARINIVHLSS 
ALGLEAVRAA KARGKVKMDV ETCPQYLLLD DSRYLESDFE GAKYVMSPPL RKPHDIEVLR 
RAVCDGEIDT IATDHCSFNL HGQKDRGIDD FTHIPNGGPG VEHRPGLIMT SFENRLGVQD 
FARLMSEGPA RVFGMYPRKG VLRVGSDADV TVWDPSVTWT ISEKNQHQNV DYTPYEGFEV 
HGRPAYVFVN GELAVVDGEP TGVKPGAYVK R