Gene Cag_0898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0898
Symbol	pyrC
ID	3748088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1231394
End bp	1232722
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	50%
IMG OID	637773429
Product	dihydroorotase
Protein accession	YP_379206
Protein GI	78188868
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTATA TTTTTCAAAA CGCCCACCTA CTTAATCCCC TTGAAAAACT TGATGCCGTT 
GGCACCCTCA CCGTTACAAG CGATGGCACT ATTGCCGCCG TAACGCTTGG CAACGAAGCC 
CCTCCCATTA CCGCTGACGA CCAGCTTATT AATTGTGAAG GAAAGATGAT TGTGCCGGGG 
CTTTTTGATA TGCACTGCCA TTTTCGTGAA CCGGGGCAGG AGTACAAGGA GACGCTTGAG 
AGCGGGGCAG AAGCCGCTTT AGCGGGTGGC TTTACCGGTG TGGCGCTTAT GCCCAACACA 
CGCCCCGTCA TTGATAGCCC ACTTGGCGTT GCCTACATTC GCCACCACAG CACCACGCTT 
CCCGTTGATT TGGAGGTTAT TGGCGCCATG ACGGTAGAAA GCAAAGGCGA ACATCTTGCA 
CCGTATGGCA AGTTTAGCTC TTACGGCGTT ACCGCAATTT CGGATGATGG TGCCGCAATT 
CAAAGCAGCC AAATGATGCG CTTAGCGCTG GAGTATGCTT CAAATTTTGA TTTACTCATT 
ATTCAGCATT GCGAAGATCG CTCGCTGAGT GCAGGCGGCG TTATGAACGA AGGGCTGTAC 
TCAACACGGT TGGGCTTAAA GGGGATTCCC GAAGTAGCCG AAGCCATCAC ACTTGGGCGC 
GACCTCATGC TGTTGCGTTA CCTTGAAGAG CACAAATTAC ACACGCCACT GCGTCGCCCA 
CGCTACCACG TTGCCCACAT AAGCACCCGT CAAGCAATTG AGTTGGTGCG CCAAGCAAAA 
ATGGAAGGGT TGCAAGTAAC CTGCGAAATT ACCCCTCACC ACTTCACTTT GTGCGATCAA 
GAGCTTTTTG AAGCCGAACG CAAAGGCAAT TTTATTATGA AACCGCCGCT TGCCTCACAA 
GCCACGCGCG AGCACCTGCT TGCTGCCCTT GCTGATGGCA CCATTGATGC CATTGCCACC 
GACCACGCTC CACACGCTCT GCACGAAAAA GAGTGCCCAC CCGACCAAGC CTCATTTGGC 
ATTATTGGGC TTGAAACCTC GCTTGCGCTT ACCATTACAG AGTTAGTACA AAAAGAGGTT 
ATTTCAATGG CACGCGCTAT TGAGTTACTC TCGGTTAATC CACGCGCTAT TATGCGGCTC 
AAACCAATTC GCTTTGCAGC AGGTGAAGCT GCCAACTTCA CCATTATTGA TCCCAATGCA 
GAATGGGTTG TAACGGCTGA ACATATTCGC TCAAAATCAT CCAACACACC ATTTATTGGA 
CGCACCCTTC GCGGTAAATC GTTAGGAACA TTCCATAAAG GTGCATTGCG TATGACGGTT 
GAGGAATAA

Protein sequence

MNYIFQNAHL LNPLEKLDAV GTLTVTSDGT IAAVTLGNEA PPITADDQLI NCEGKMIVPG 
LFDMHCHFRE PGQEYKETLE SGAEAALAGG FTGVALMPNT RPVIDSPLGV AYIRHHSTTL 
PVDLEVIGAM TVESKGEHLA PYGKFSSYGV TAISDDGAAI QSSQMMRLAL EYASNFDLLI 
IQHCEDRSLS AGGVMNEGLY STRLGLKGIP EVAEAITLGR DLMLLRYLEE HKLHTPLRRP 
RYHVAHISTR QAIELVRQAK MEGLQVTCEI TPHHFTLCDQ ELFEAERKGN FIMKPPLASQ 
ATREHLLAAL ADGTIDAIAT DHAPHALHEK ECPPDQASFG IIGLETSLAL TITELVQKEV 
ISMARAIELL SVNPRAIMRL KPIRFAAGEA ANFTIIDPNA EWVVTAEHIR SKSSNTPFIG 
RTLRGKSLGT FHKGALRMTV EE