Gene CPR_0689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_0689
Symbol	aroB
ID	4204308
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	809310
End bp	810362
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	28%
IMG OID	642565249
Product	3-dehydroquinate synthase
Protein accession	YP_698015
Protein GI	110802526
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTTT TAAGAGTAAA TTTAGATGAA AAAAGTTATG ATATAGTAAT TCAAAAGGAT 
TTAAAAGATT ATTTTGGAGA ATACATAAAA ACTGTATTTG ATGGGAAAAA AGTAGCTATT 
ATAACTGATG ATAATTTAAA TGATATATAT GGAGAGGCTA TAAAGAAAAA TATAGAAAAT 
GAAGGTTTTG AAGTTGAAGT TATTTCTGTT ACACCAGGAG AAAAGAGTAA ATCTTTTAGT 
ATATTACCAG GAATATATAA TAAACTTTTA GATTTTAAAC TAACTAGAAG TGATTTAATC 
ATAGCTCTAG GTGGCGGTGT TGTTGGAGAC CTTGCAGGTT TTGTTGCCTC AACTTTTTTA 
AGAGGAATTA GCTTTATACA AATACCTACA TCATTATTAG CTCAAGTTGA TTCTAGCGTT 
GGTGGTAAAG TAGCTGTTGA CTTAGAAAGA GGTAAGAATT TAGTAGGAAG CTTTTATCAT 
CCACAATTAG TATTAATAGA TCCAAATATG CTTGGAACAC TTCCAGAAAA ATATTTTAAT 
GATGGCCTTG GAGAGGTAAT AAAATATGGA TGCATTAAGA GCAAAGAGTT ATTTGAAAAG 
TTAGAGGGCT TTAAAAATAA AGAGGATCTA AAAGAGAATA TTGGAGAAAT TATTTATGAA 
TGCTGCAATA TAAAAAGAGA ATTGGTTGAA AATGATGAAA AAGATTTAGG AGAAAGAATG 
ATTCTAAACT TTGGTCATAC TTTAGGTCAT GCCATAGAGC AAATTTATAA TTATGAAACT 
TATTCTCATG GAGAAGCTGT TGCTATAGGA ATGAATATGA TAAGTAAGAT TGCAGAAGAA 
AAGGATCTTA CTAAAAAAGG AACAGCAGAA AGGATTGAGA GTTTATTAAA GAAGTATGGA 
TTAAATACTG ATGTTAACAT TGAAGATAAT GGATTAGCTA GAGAAGCTAT AAAATTAGAT 
AAGAAAAATT TAAATGGAAA TTTAAATGTT ATTCTTTTAA AAGATATTGG GGAAGGATAT 
ATATATAATA CAACTGTAGA ATTTTTTGAA TAA

Protein sequence

MKVLRVNLDE KSYDIVIQKD LKDYFGEYIK TVFDGKKVAI ITDDNLNDIY GEAIKKNIEN 
EGFEVEVISV TPGEKSKSFS ILPGIYNKLL DFKLTRSDLI IALGGGVVGD LAGFVASTFL 
RGISFIQIPT SLLAQVDSSV GGKVAVDLER GKNLVGSFYH PQLVLIDPNM LGTLPEKYFN 
DGLGEVIKYG CIKSKELFEK LEGFKNKEDL KENIGEIIYE CCNIKRELVE NDEKDLGERM 
ILNFGHTLGH AIEQIYNYET YSHGEAVAIG MNMISKIAEE KDLTKKGTAE RIESLLKKYG 
LNTDVNIEDN GLAREAIKLD KKNLNGNLNV ILLKDIGEGY IYNTTVEFFE