Gene CPR_1640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1640
Symbol	purB
ID	4205473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1831762
End bp	1833192
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	30%
IMG OID	642566190
Product	adenylosuccinate lyase
Protein accession	YP_698955
Protein GI	110802188
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0015] Adenylosuccinate lyase
TIGRFAM ID	[TIGR00928] adenylosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.591721
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAAATT TATATAGCAC ACCATTGAAT TCAAGATATG CGTCAAAAGA GATGTCATAT 
ATTTTCTCAG ATGATATGAA ATTCTCAACA TGGAGAAAAT TATGGGTTGC TCTTGCAGAG 
GGTGAAAAAG AATTAGGATT AAATATAACT GACGAGCAAA TAGAAGAACT TAAAAGTCAT 
ATTTCAGATA TAAATTACGA AGAAGCAATA AAAAAAGAAA AAGAAGTTAG ACACGATGTT 
ATGAGTCACG TTTATGCATA TGGACTTCAA TGTCCTTCAG CAAAAGGTAT CATACATTTA 
GGAGCAACAA GCTGCTATGT TGGAGATAAT ACAGATGTAA TAATAATGAG AGATGCATTA 
TTATTAATAA AGAAAAAAAT AGTTGCAGTT TTAAATAATT TAAAAAGATT TGCTTTAGAA 
TATAAGGATA TGCCTACTCT AGGATTTACT CATTTCCAAC CAGCACAGCT TACTACTGTA 
GGTAAGAGAG CTACATTATG GATGCAAGAT TTAGTAATGG ATATGGAGAA CATAGATTTT 
CTATTATCAA CTTTAAAATT AAGAGGGGTA AAAGGAACTA CTGGTACTCA AGCAAGCTTT 
ATGAATCTTT TTGAAGGTGA TGAAGAAAAG GTTAAGGCTT TAGATAAAAT CGTTGCAGAA 
AAAATGGGAT TTAAAAAGAG TTTTGGAGTT ACAGGTCAAA CTTATCCAAG AAAATTAGAT 
TCTATAATTT TAAATACATT ATCAGAAATT GCACAAAGTG CATATAAATT CTCAAATGAC 
TTAAGATTAC TTCAAAGTAT GAAAGAAATA GAAGAACCAT TTGAAAAAAA TCAAATAGGG 
TCATCAGCTA TGGCATATAA GAGAAATCCT ATGAGAAGTG AAAGAATGGG AGCATTAGCT 
AGATATGTTA TAGTAGATGC CTTAAATCCA GCTATTACGG CTTCAACTCA ATGGTTTGAG 
AGAACACTAG ATGATTCAGC TAATAAGAGA ATTGCAGTAG CAGAAGCTTT CTTAGCTTTA 
GATGGAGTTT TAAATCTTTA TATAAATATT GCTGAGAATA TGGTAGTTTA TGATAAAGTT 
ATTGAAGCTC ATGTAAATCA AGAATTACCT TTCATGGCAA CTGAAAATAT AATGATGGAA 
TCAGTTAAAA AAGGTGGAGA TAGACAAGAA CTTCATGAAA GAATAAGAGT TCATTCTATG 
GATGCTGCTC AAAGAGTTAA AGGAGAAGGG CTTAATAATG ATTTAATAAA AAGAATAATA 
AATGATCCTT CATTTAATCT TTCTAAAGAA GAAATTATAG CTATAATAGA TCCAGTTAAA 
TTTGTTGGTA GAGCTCCAAG CCAAGTTGTA GAGTTTATTG ATGAGTATGT AAACCCTATA 
ATAGAAGCTA ATAAGGATGC AGCTAGCTTA AGTAGTGATA TAACAGTTTA A

Protein sequence

MKNLYSTPLN SRYASKEMSY IFSDDMKFST WRKLWVALAE GEKELGLNIT DEQIEELKSH 
ISDINYEEAI KKEKEVRHDV MSHVYAYGLQ CPSAKGIIHL GATSCYVGDN TDVIIMRDAL 
LLIKKKIVAV LNNLKRFALE YKDMPTLGFT HFQPAQLTTV GKRATLWMQD LVMDMENIDF 
LLSTLKLRGV KGTTGTQASF MNLFEGDEEK VKALDKIVAE KMGFKKSFGV TGQTYPRKLD 
SIILNTLSEI AQSAYKFSND LRLLQSMKEI EEPFEKNQIG SSAMAYKRNP MRSERMGALA 
RYVIVDALNP AITASTQWFE RTLDDSANKR IAVAEAFLAL DGVLNLYINI AENMVVYDKV 
IEAHVNQELP FMATENIMME SVKKGGDRQE LHERIRVHSM DAAQRVKGEG LNNDLIKRII 
NDPSFNLSKE EIIAIIDPVK FVGRAPSQVV EFIDEYVNPI IEANKDAASL SSDITV