Gene Plut_1013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plut_1013
Symbol	pyrC
ID	3745793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium luteolum DSM 273
Kingdom	Bacteria
Replicon accession	NC_007512
Strand	-
Start bp	1150727
End bp	1152076
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	60%
IMG OID	637769048
Product	dihydroorotase
Protein accession	YP_374918
Protein GI	78186875
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0448021
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATAG TTTTTCAGGA GGCGCATATC ATCAGCCCCT CTGACGGCAT TGACGCCAGG 
GGCTCAATCA GGGTATCCGA CAGCGGGGTC ATCGAGACCC TCTCGATTGG AGAGACCCCG 
CTTGAGCCTT ATGCAGAAGA AAAAGTCATT GCTATGAGGG GTAAAATACT CTCCCCCGGC 
CTTTTCGACA TGCACTGCCA TTTCCGCGAA CCCGGACAGG AATACAAGGA GACGCTTCTG 
AGCGGCTCGG CCGCCGCCGC AGCCGGAGGA TTCACCGGAG TGGCGCTGAT GCCGAACACC 
ACGCCCGTCA TCGACAGCCC TCTTGGGGTC ACCTTCATCG GCTACCATGC CGGGAACCTC 
CCTGTCGACC TTGAGGTGAT TGCCTCCATG ACGGAAGGAA GCCGCGGTGA GAAGCTCACG 
GCGTTCGGAA GCCTGAAAGC CTACGGAGTG AGGGCCGTCT CGGATGACGG CACCGCCATC 
CAGGCAAGCC AGTCGATGCG CCTGGCGTTT GAATACGCCT CCAACTTCGA CATGCTCATC 
ATCCAGCACT GTGAAGACCG GTCCCTGACG ACGGGAGGAG TCATGAATGA AGGAATGTGG 
TCGTCGAAAC TCGGACTCAA GGGAATCCCC GACATCTCAG AGGCCATGAT GCTTGCCCGT 
GACCTCATGC TGCTCCGCTG GCTCGAAGAG CACAAGCTGC ACGACCCGCT CTGCCGCCCC 
CGATACCACG CAGCCCACGT CAGCACGGCA GCATCGCTCC AGCTGATCCG GGAAGCCAAG 
CGGGACGGCC TGCAGGTGAC CTGCGAGGTC ACCCCGCACC ACTTCACCCT GACCGACCAG 
GACCTCTACC TGGCCGAAAA GAAAGGCAAC TTCATCATGA AGCCTCCGCT TACCTCCCCG 
AAAAACCGGG ACGCGGTGCT GGAAGCCCTT GCCGACGGCA CAGCGGACGC CATTGCCACC 
GACCATGCGC CGCATGCCCT CCACGAAAAG GAGTGCCCCC CCGGCGAAGC TTCGTTCGGC 
ATCATCGGAC TGGAAACCTC GCTGGGCCTC ACCATGACGG AGCTGGTGAT GAAAGGAGTC 
ATCACGATGC ATCGGGCTAT TGAACTTCTG TCGGTCAATC CGAGAAGAAT CCTGCGGCTC 
CCCCCCATCC GCATCCGCGA AGGGGAAAAA GCCAACTTCA CCCTCATCGA TCCTGAAGCC 
GTCTGGACCG TATCTGCCGA TCATCTCCGC TCCAAATCCG CCAACACCCC GTTCATCGGC 
CGCCAGCTGA AAGGCCGCCC TATGGGAATC TTCCACAAGG GCCGACTTAC TGCAAGCGCC 
CGGGGCATAA TTGACGCCCC GGAAGGGTGA

Protein sequence

MSIVFQEAHI ISPSDGIDAR GSIRVSDSGV IETLSIGETP LEPYAEEKVI AMRGKILSPG 
LFDMHCHFRE PGQEYKETLL SGSAAAAAGG FTGVALMPNT TPVIDSPLGV TFIGYHAGNL 
PVDLEVIASM TEGSRGEKLT AFGSLKAYGV RAVSDDGTAI QASQSMRLAF EYASNFDMLI 
IQHCEDRSLT TGGVMNEGMW SSKLGLKGIP DISEAMMLAR DLMLLRWLEE HKLHDPLCRP 
RYHAAHVSTA ASLQLIREAK RDGLQVTCEV TPHHFTLTDQ DLYLAEKKGN FIMKPPLTSP 
KNRDAVLEAL ADGTADAIAT DHAPHALHEK ECPPGEASFG IIGLETSLGL TMTELVMKGV 
ITMHRAIELL SVNPRRILRL PPIRIREGEK ANFTLIDPEA VWTVSADHLR SKSANTPFIG 
RQLKGRPMGI FHKGRLTASA RGIIDAPEG