Gene CPF_0690 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0690
Symbol	aroC
ID	4203801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	826544
End bp	827617
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	32%
IMG OID	638081575
Product	chorismate synthase
Protein accession	YP_695142
Protein GI	110800421
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.140082
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAGGAG TTTGGGGTAA TAAAATAAAA TTATCTATAT TTGGAGAATC TCATGGAGAA 
GGAATAGGAA TAGTAATAGA TGGAATAGAA CCTGGAATAA AAATAAATAT GGATAACATA 
GAAAAAGATA TGGAAAGAAG AGCACCAGGA AGAAATAGTT TATCAACTCA AAGAAAAGAA 
GGGGATAAAC CAGAAATTTT AAGTGGAATA TTTAATGGAA TCACCACAGG GGCTCCTATT 
TCAATGATAA TAAGAAATAC AGATAAAAGA TCTAGGGATT ATTCAAAAAT AAAAGATGTA 
ATGAGACCAG GCCATGCAGA TTTCCCAGGA TACATAAGAT ATAATGGCTT TAATGATTAT 
AGAGGGGGAG GACATTTCTC AGGAAGAATA ACAGCGCCCT TAGTTTTTGC TGGAGCCTTA 
GCTAAGGAAA TACTTAAGGA AAAAGATATA ACTATTGGTT CTCATATTAA GCAAGTTGGA 
AAAGTTAAGG ATTCTTCTTT TGATGCATTA AATTTAAAGA AAGAAGATTT AGAAGAACTT 
TTAACTAAAG AACTTCCAGT AATAGATACA AATAAAATAG AAGAAATTAA GGAAGAGATT 
ACTTCATATA GAATGGAAGG AGATTCTATT GGAGGAATTG TTGAGTGCGC CATAGTAGGA 
TTAGAGGCTG GTATAGGAAA TCCATTCTTT GATTCTTTAG AAAGTACCAT AGCTCATTTA 
GCTTTTTCAG TGCCTGCTGT AAAGGGAATT GAATTTGGAG CAGGTTTTGA CTTTGCAAAT 
ATGAAAGGTT CAGAAGCAAA TGACGAATAT TTCATAGAAT ATGAAAAAGT TAAGACATAC 
TCTAATAATA ATGGAGGAAT AACTGGTGGA ATATCAAATG GAATGCCAGT TATATTCAGA 
GTTGTTATAA AACCTACACC ATCTATTTCT AAAGAACAAA GAACTATAAA TATAAAAAAT 
ATGACAGAGG AAGTTCTAAG TGTAAATGGT AGACATGATC CTTGTATAGT TCAAAGAGCC 
TTAGTTGTTA TAGAAGCCAT TGCAGCTATT TCTATATTAG AGTTAATAAA ATAA

Protein sequence

MGGVWGNKIK LSIFGESHGE GIGIVIDGIE PGIKINMDNI EKDMERRAPG RNSLSTQRKE 
GDKPEILSGI FNGITTGAPI SMIIRNTDKR SRDYSKIKDV MRPGHADFPG YIRYNGFNDY 
RGGGHFSGRI TAPLVFAGAL AKEILKEKDI TIGSHIKQVG KVKDSSFDAL NLKKEDLEEL 
LTKELPVIDT NKIEEIKEEI TSYRMEGDSI GGIVECAIVG LEAGIGNPFF DSLESTIAHL 
AFSVPAVKGI EFGAGFDFAN MKGSEANDEY FIEYEKVKTY SNNNGGITGG ISNGMPVIFR 
VVIKPTPSIS KEQRTINIKN MTEEVLSVNG RHDPCIVQRA LVVIEAIAAI SILELIK