Gene SbBS512_E2265 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2265
Symbol	pyrC
ID	6271911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	2060577
End bp	2061623
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	52%
IMG OID	641726282
Product	dihydroorotase
Protein accession	YP_001880766
Protein GI	187730925
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0418] Dihydroorotase
TIGRFAM ID	[TIGR00856] dihydroorotase, homodimeric type

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGCAC CATCCCAGGT ATTAAAGATC CGCCGCCCAG ACGACTGGCA CCTTCACCTC 
CGCGATGGCG ACATGTTAAA AACTGTCGTG CCGTATACCA GCGAAATTTA TGGACGGGCT 
ATTGTAATGC CCAATCTGGC TCCGCCCGTG ACCACTGTTG AGGCTGCCGT GGCGTATCGC 
CAGCGTATTC TTGATGCCGT ACCTGCCGGG CACAATTTCA CCCCATTGAT GACCTGTTAT 
TTAACAGATT CGCTGGATCC TAATGAGCTG GAGCGCGGAT TTAACGAAGG CGTGTTCACC 
GCTGCAAAAC TTTATCCAGC AAACGCAACC ACTAACTCCA GCCACGGCGT GACGTCAATT 
GACGCAATCA TGCCGGTACT TGAGCGCATG GAAAAAATCG GTATGCCGCT ACTGGTGCAT 
GGTGAAGTGA CACATGCAGA TATCGACATT TTTGATCGTG AAGCGCACTT TATAGAAAGC 
GTGATGGAAC CTCTGCGCCA GCGCCTGACT GCGCTGAAAG TCGTTTTTGA GCACATCACC 
ACCAAAGATG CTGCCGACTA TGTCCATGAC GGAAATGAAC GGCTGGCTGC CACCATCACT 
CCGCAGCATC TGATGTTTAA CCGCAACCAT ATGCTGGTTG GTGGCGTGCG TCCGCACCTG 
TATTGTTTAC CCATCCTCAA ACGCAATATT CACCAACAGG CATTGCGTGA ACTGGTCGCC 
AGCGGTTTTA ATCGAGTATT CCTCGGTACG GATTCTGCGC CACATGCACG TCATCGCAAA 
GAGAGCAGTT GTGGCTGCGC GGGCTGCTTC AACGCCCCAA CCGCGCTGGG CAGTTACGCT 
ACCGTCTTTG AAGAGATGAA TGCTCTGCAG CACTTTGAAG CATTCTGTTC TGTAAACGGC 
CCGCAGTTCT ATGGCTTGCC GGTCAACGAT ACATTCATCG AACTGGTACG TGAAGAGCAA 
CAGGTTGCTG AAAGCATCGC ACTGACTGAT GACACCCTGG TGCCATTCCT CGCCGGGGAA 
ACGGTACGCT GGTCCGTTAA ACAATAA

Protein sequence

MTAPSQVLKI RRPDDWHLHL RDGDMLKTVV PYTSEIYGRA IVMPNLAPPV TTVEAAVAYR 
QRILDAVPAG HNFTPLMTCY LTDSLDPNEL ERGFNEGVFT AAKLYPANAT TNSSHGVTSI 
DAIMPVLERM EKIGMPLLVH GEVTHADIDI FDREAHFIES VMEPLRQRLT ALKVVFEHIT 
TKDAADYVHD GNERLAATIT PQHLMFNRNH MLVGGVRPHL YCLPILKRNI HQQALRELVA 
SGFNRVFLGT DSAPHARHRK ESSCGCAGCF NAPTALGSYA TVFEEMNALQ HFEAFCSVNG 
PQFYGLPVND TFIELVREEQ QVAESIALTD DTLVPFLAGE TVRWSVKQ