Gene Acel_1300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1300
Symbol	pyrC
ID	4485455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	1450765
End bp	1452051
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	70%
IMG OID	639730080
Product	dihydroorotase
Protein accession	YP_873058
Protein GI	117928507
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.115312
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0109534
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACCGGT GGCTGCTGCG CGGCGGGCGA ATCCTCGGTG GTGACCCGGC GGACATCCTG 
ATTGCCGGTG ACTCGATTGC CGAGATCGGT GCCGGGCTGA CCGCCGCTGG TGCCGAGATC 
GTCGACGCCG GCGGGCTCGT CGTCCTGCCT GGTCTCGTTG ATCTGCACAC GCATCTGCGG 
GAGCCGGGAC GGGAAGACGC CGAGACGATC GAGTCCGGCA CGCTGGCTGC CGCCCTCGGC 
GGTTTCACCG CTGTCCATGC GATGGCCAAC ACCGATCCGG TCGCCGACAC CGCCGGTGTC 
GTTGAGCAGG TGTGGCTCGC CGGCCATGAG GCCGGGCACT GCGACGTCGC TCCGGTCGGT 
GCGGTGACGG TGGGCCTCGC CGGCGAGCGG CTCGCCGAGC TCGGTGCGAT GGCGGACTCG 
CACGCCCGGG TCCGGGTCTT CTCCGACGAC GGCAGGTGCG TCGCCGACCC TCTGCTCATG 
CGCCGAGCCC TGGAGTACGT CAAGGCGTTT GACGGCGTCA TCGCCCAGCA TGCGCAGGAG 
CCTCGGTTGA CCGAGGACGC TCAGCTGAAT GAAGGGGAGG TGTCGGCCCG GCTCGGGTTG 
GCCGGCTGGC CGGCTGCAGC CGAAGAGTCG ATCATTGCCC GGGACGTGCT CCTCGCCGGC 
CACGTCGGTT CGCGCGTCCA CATCTGCCAC GTCTCCACCG CCGGGTCGGT GGAACTGATC 
CGGTGGGCCA AGGCCCGCGG GATCGCCGTC ACCGCGGAGG TCACCCCGCA TCACCTCCTG 
CTCACCGACG ATCTCGCGGT GAGCTACGAC CCGGTGTTTA AGGTGAACCC GCCGCTGCGG 
ACCGCGGCGG ACGTCGCCGC CCTGCGCGCC GGGCTTGCCG ACGGCACGAT CGACGCGGTC 
GCCACCGATC ACGCCCCCCA CCCGGTGGAA GCCAAGGAAT GCGAATGGGC GGCGGCCGCA 
CCCGGGATGA TCGGGCTGCA GACCGCGCTC TCTGTCGTCG CACTGGCGAT GGTCGAGACC 
GGCCTGCTCG ATTGGGCCGG AGTCGCGGAC CGGATGTCGA TCCGGCCCGC CCGGATCGGG 
CGGCTCACCA CCCACGGCCG GCCCATCGCT GTCGGCTCAC CCGCCAACCT CACCCTCATC 
GACCCCACGG CCCGGTGGGT CGTCGAGCCG TCGGTCCTCG TGTCCAAATC GCGCAACACC 
CCATTTCTCG GAAAGGAGTT ACCGGTGCGC GTCGTCCACA CGTTCCTTCA CGGCACCCCG 
ACAGTCCTCG ACGGGAAGCC GGCATGA

Protein sequence

MNRWLLRGGR ILGGDPADIL IAGDSIAEIG AGLTAAGAEI VDAGGLVVLP GLVDLHTHLR 
EPGREDAETI ESGTLAAALG GFTAVHAMAN TDPVADTAGV VEQVWLAGHE AGHCDVAPVG 
AVTVGLAGER LAELGAMADS HARVRVFSDD GRCVADPLLM RRALEYVKAF DGVIAQHAQE 
PRLTEDAQLN EGEVSARLGL AGWPAAAEES IIARDVLLAG HVGSRVHICH VSTAGSVELI 
RWAKARGIAV TAEVTPHHLL LTDDLAVSYD PVFKVNPPLR TAADVAALRA GLADGTIDAV 
ATDHAPHPVE AKECEWAAAA PGMIGLQTAL SVVALAMVET GLLDWAGVAD RMSIRPARIG 
RLTTHGRPIA VGSPANLTLI DPTARWVVEP SVLVSKSRNT PFLGKELPVR VVHTFLHGTP 
TVLDGKPA