Gene Apar_0475 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0475
Symbol	pyrG
ID	8413324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	542650
End bp	544299
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	46%
IMG OID	645022043
Product	CTP synthetase
Protein accession	YP_003179497
Protein GI	257784280
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0504] CTP synthase (UTP-ammonia lyase)
TIGRFAM ID	[TIGR00337] CTP synthase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.984094
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGC ACATATTTGT AACAGGCGGC GTTGTTTCTT CTCTTGGAAA AGGAATCACT 
GCTGCATCTC TCGGCCGACT TCTTAAGGCT CGTGGCTATA AGGTCATGAT GCAAAAAGCT 
GACCCTTATC TCAATGTTGA TCCAGGCACC ATGAGTCCTT TCCAGCATGG TGAGGTTTTT 
GTAACTGAGG ATGGTAAAGA GACTGACCTT GACCTTGGTC ATTATGAGCG TTTTATTGAT 
GAGAACCTTA CTAGGGAGTC TAACTTCACC ACTGGTCTCA TTTATCAGTC TTTGATTCAG 
CGTGAACGTG CTGGAGACTT TCTTGGTGGT ACAGTTCAGG TAATTCCTCA TGTAACTGAC 
GCAATTAAAG CTCGTTTTGC TCGCATTGAA GAGGTTACTA ATGCTGATGT AGTTATCACG 
GAGCTGGGTG GCACTATTGG CGATATTGAG TCACAACCTT TTGTTGAGGC AATTCGCCAA 
TTCAGAAAAG AGCGAGGCGC AAGTAACGTT GCTATTATTC ACGTCAGTCT TGTTCCTTAT 
ATCGCAGCTG CTCATGAGGT CAAGACTAAG CCTACGCAGC ACTCCGTAAA AGAGCTTCGT 
TCCCTTGGTA TTCAGCCAGA CTTTATCGTA TGTCGTTCAA GCCATTCTGT GGATGAATCT 
ATTCGCGAGA AAATCGCTAA TTTCTGTGAT GTTGATGCAG ATTGCGTTTT TGAGAACAAT 
GATTTGCCTT CAATTTACGA CGTCCCAGCG CACTTGGCAG CACAGGGATT TGACAAGAAG 
GTACTTGAGC GTCTTGGTCT TGAAGTTCGT CCAAGTGATC TTGGTGGCTG GGAAGCATTT 
ACTACTGCTA TGCATAAGGC AAATGCGCTT GAAGACACAA CAAGAATTTA TGTTGTTGGT 
AAGTATACGC AGTTACCTGA TGCATATCTT TCCGTTATTG AGGCACTTCA CCACTCTGGT 
ATTTTCTACG GCAGACACGT TGATATCCGT CTGGTAAATG GTGAAGAGCT AACAGAAGAA 
GACGTGGAGC AAGAGCTTGC CGGCGCAGAT GGTATTTTGG TTCCCGGCGG CTTTGGTCTT 
CGTGGTGTAG AAGGCAAGAT GGTTGCTATT CGTCGTGCCC GTGAGCTTAA GATTCCTTAT 
CTTGGTGTCT GCCTTGGTAT GCAGATGGCT GTTACTGAGT TTGCTCGTGA TGTTTGTGGA 
ATGGAGGGCG CAAATTCAGC AGAGTTTGGT CCAGATACTC CATATCCTGT CATCGATCTT 
ATGCCTGATC AGGAGGATAT TACCGATAAA GGCGGTACTA TGCGCCTTGG TTCTTATCCT 
TGTAAGGTTG TTGAGGGAAC TCTTGCGCAT GAGGCTTATG GTGACAACTT GGTTTATGAG 
CGTCATCGTC ACCGCTATGA GGTTAGCAAC GTATTCCGTA ATCAGCTTGT TGAGGCTGGT 
TTGGTAGTTT CCGGCATTTC TCCAGACGAT CGCCTTGTAG AGATGATTGA GCTTCCAGAG 
TCTGTTCACC CTTGGTTTGT TGCAAGCCAA GCACACCCAG AGTTCAAGAG CCGTCCAACT 
CATCCTGCAC CTTTGTTCCG TGAGTTTGCA CGTGCAGCAA TCGCTCATCA TGAGGGTGTT 
GATCGTCATG ATGTTAATCA GACTCTCTAA

Protein sequence

MTKHIFVTGG VVSSLGKGIT AASLGRLLKA RGYKVMMQKA DPYLNVDPGT MSPFQHGEVF 
VTEDGKETDL DLGHYERFID ENLTRESNFT TGLIYQSLIQ RERAGDFLGG TVQVIPHVTD 
AIKARFARIE EVTNADVVIT ELGGTIGDIE SQPFVEAIRQ FRKERGASNV AIIHVSLVPY 
IAAAHEVKTK PTQHSVKELR SLGIQPDFIV CRSSHSVDES IREKIANFCD VDADCVFENN 
DLPSIYDVPA HLAAQGFDKK VLERLGLEVR PSDLGGWEAF TTAMHKANAL EDTTRIYVVG 
KYTQLPDAYL SVIEALHHSG IFYGRHVDIR LVNGEELTEE DVEQELAGAD GILVPGGFGL 
RGVEGKMVAI RRARELKIPY LGVCLGMQMA VTEFARDVCG MEGANSAEFG PDTPYPVIDL 
MPDQEDITDK GGTMRLGSYP CKVVEGTLAH EAYGDNLVYE RHRHRYEVSN VFRNQLVEAG 
LVVSGISPDD RLVEMIELPE SVHPWFVASQ AHPEFKSRPT HPAPLFREFA RAAIAHHEGV 
DRHDVNQTL