Gene Paes_1038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_1038
Symbol	pyrC
ID	6459999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	1140380
End bp	1141702
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	52%
IMG OID	642725038
Product	dihydroorotase
Protein accession	YP_002015724
Protein GI	194333864
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.933737
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00310904
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCATCA TTTTTCATCA GGCGAGAATC ATCAATCCCG CCCAGAACCT TGATACGACA 
GGATCGATCC GTATTTCCGA TTCAGGCCGG ATTGAAACCA TCGTTACAGG AAACGATCCC 
CTGCCCCCTC AGGATACCGA CCGCGTCATT GATATGAACG GCAAACTTCT CGTTCCGGGC 
CTGTTCGATA TGCACTGCCA CTTCAGAGAG CCTGGACAGG AATACAAAGA AACACTCGAA 
ACAGGATCAA GAGCCGCTGT CGCAGGAGGA TTTACGGGTG TGGCTCTTAT GCCGAATACC 
AAACCCGTCA TCGACAACCC GCAGGGAGTC GCCTATATCC GTCAGACGGC CATGGAGCTG 
CCGATCGACA TCGAAGTCAT CTCGGCGATG ACCAAAGAAA GCAGGGGGGA AACTCTGGCC 
CCTTTCGGAA AACTCTTTGC AAGCGGCGTC AAAGCCGTAT CGGATGACGG AACCGCTATT 
CAGAACAGCC AGATCATGCG CCTGGCGTTT GAGTACGCCG CCAACTTCAA CTTACTCTTC 
ATCCAGCACT GTGAAGACAC CAGCCTTACC TCGGGCGGGG TCATGAATGA AGGTGAATAT 
TCTGCGATGA TGGGTCTTAA AGGAATTCCC GACGTCGCAG AAGCAATCAC GCTCAGCCGT 
GACCTGCTGC TTATCGACTA CCTCCGAAAA CATAAACTCT CACCGCCTCT GACTGCACCA 
CGTTATCATG TCGCCCATAT CAGCACAAGA AGCGCCCTGG ATCTTGTACG CAAAGCAAGG 
AAAGAAGGCA TGGCAATAAC CTGCGAAGTC ACGCCGCATC ATTTCACCCT CACCGAAGAG 
GCCCTTTTCA AGGCAGAGCA CAAAGGCAAC TTCATCATGA AACCGCCACT CTGCAGCCTT 
GATAACCACG CAGCAATCCT TGAAGCGATT GTCGACGGCA CGATCGACGC CATTGCAACC 
GATCACGCGC CACATGCCGA ACATGAAAAG CAATGCCCTC CCGATCAGGC ATCATTCGGC 
ATCATCGGTC TGGAAACAGC GGTGGGACTG ACCTTCAGCG AACTGGTCCA CACAGGACGC 
ATATCCGTCA GCCGGGCTAT AGAGATGCTC TCAGTCAACC CAAGACGGAT TATGGATATT 
GAACCTGTGC TTTTCGAACC CCAGAGAGCG GCTAACTTTA CGCTGATAGA TCCCGATGCC 
ACCTGGACCT GGAAGAGCGA GCATATCAAG TCGAAAGCAA AAAACTCTCC GTTTATCGGC 
CGAACAATGA AAGGCAAAGC GATCGGTATC TGTCATAAAG GAAAACTGCT TGGACTTGAC 
TGA

Protein sequence

MSIIFHQARI INPAQNLDTT GSIRISDSGR IETIVTGNDP LPPQDTDRVI DMNGKLLVPG 
LFDMHCHFRE PGQEYKETLE TGSRAAVAGG FTGVALMPNT KPVIDNPQGV AYIRQTAMEL 
PIDIEVISAM TKESRGETLA PFGKLFASGV KAVSDDGTAI QNSQIMRLAF EYAANFNLLF 
IQHCEDTSLT SGGVMNEGEY SAMMGLKGIP DVAEAITLSR DLLLIDYLRK HKLSPPLTAP 
RYHVAHISTR SALDLVRKAR KEGMAITCEV TPHHFTLTEE ALFKAEHKGN FIMKPPLCSL 
DNHAAILEAI VDGTIDAIAT DHAPHAEHEK QCPPDQASFG IIGLETAVGL TFSELVHTGR 
ISVSRAIEML SVNPRRIMDI EPVLFEPQRA ANFTLIDPDA TWTWKSEHIK SKAKNSPFIG 
RTMKGKAIGI CHKGKLLGLD