Gene CPR_1852 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1852
Symbol	pheS
ID	4206257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2052873
End bp	2053892
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	32%
IMG OID	642566402
Product	phenylalanyl-tRNA synthetase subunit alpha
Protein accession	YP_699166
Protein GI	110803656
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0016] Phenylalanyl-tRNA synthetase alpha subunit
TIGRFAM ID	[TIGR00468] phenylalanyl-tRNA synthetase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGATA AGTTAAATCA AATTAAAGAA TTAGCTTTAG TAGAAATTAA AAAAGCTAAA 
GATAGTACTA CTATTGATAC AATAAGAGTT AAATATCTTG GTAAAAAGGG AGAACTTACA 
ACTATATTAA GAGGAATGGG ATCTCTATCT AAAGAGGAGA GACCAATAGT TGGTAAGTTA 
GCTAATGAGG TAAGAGAGGT TTTAGAAGCT GAATTAGAGG CTGTAACAAA GGCTGTTAAA 
GAAGCTGAAA AACAAGAAAA GCTTAAAAAT GAAGTAATAG ATATTTCAAT GCCTGGTAAA 
AAACAAACAA TAGGAAAGAA ACATCCATTA GAGCAAACTT TAGATGAAAT GAAAAAAATA 
TTTGTTTCAA TGGGATTTGC TATAGAAGAT GGTCCAGAGG TTGAGAAAGA TTACTATAAC 
TTTGAAGCCT TAAACATTCC TAAGAATCAT CCAGCTAGAA GTGAGCAAGA TACATTCTAC 
ATAAATGATA ATATAGTTTT AAGAACTCAA ACTTCTCCAG TTCAAGCTAG AGTAATGGAA 
AAACAACAAC CACCAATAAA AATGATATCA CCTGGTAAGG TATTTAGATC AGATGCTGTT 
GATGCTACGC ATTCACCAAT ATTCTACCAA ATGGAAGGTC TAGTTATAGA TAAAGATATA 
ACTTTTGCAG ATCTTAAAGG AACTTTAGAA TTATTTGCTA AGAAAATGTT TGGTGATAAA 
GTAAAAACTA AGTTTAGACC ACATCATTTC CCATTCACTG AGCCATCAGC TGAAATGGAT 
GCTACATGCT TTGTATGTAA CGGAAAAGGA TGTAAAGTAT GTAAGGGAGA AGGTTGGATA 
GAAATACTAG GTTGTGGTAT GGTTCACCCT CAAGTCTTAA GAAACTGTGG AATAGACCCA 
GAAGTTTATA GTGGATTTGC TTTCGGCTTT GGTGTAGACA GAATGGTTAT GCTTAAGTAT 
GGAATAGATG ACATAAGATT ATTATACGAA AGTGATATGA GATTCTTAAA TCAATTCTAG

Protein sequence

MQDKLNQIKE LALVEIKKAK DSTTIDTIRV KYLGKKGELT TILRGMGSLS KEERPIVGKL 
ANEVREVLEA ELEAVTKAVK EAEKQEKLKN EVIDISMPGK KQTIGKKHPL EQTLDEMKKI 
FVSMGFAIED GPEVEKDYYN FEALNIPKNH PARSEQDTFY INDNIVLRTQ TSPVQARVME 
KQQPPIKMIS PGKVFRSDAV DATHSPIFYQ MEGLVIDKDI TFADLKGTLE LFAKKMFGDK 
VKTKFRPHHF PFTEPSAEMD ATCFVCNGKG CKVCKGEGWI EILGCGMVHP QVLRNCGIDP 
EVYSGFAFGF GVDRMVMLKY GIDDIRLLYE SDMRFLNQF