Gene CPF_2738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2738
Symbol	proS
ID	4203146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2998432
End bp	3000144
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	33%
IMG OID	638083604
Product	prolyl-tRNA synthetase
Protein accession	YP_697117
Protein GI	110799310
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00409] prolyl-tRNA synthetase, family II

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATGT CAAATATGTT AGTAGGAACT TTAAGAGAAG TTCCAGCTGA AGCAGAAATA 
GAAAGTCACA AGCTTATGCT TAGAGCAGGT CTTATGAGAA AGATGGCTGC AGGGATTTAT 
AACTATATGC CTTTAGGATT AAAGGTTATA GAAAATGTTA AAAATATAGT AAGAGAAGAA 
ATGAATAATG CAGGTGCTCA AGAATTCTTA GCATCAGCTT TAATACCAGC TGAGTTATGG 
CAAGAATCAG GAAGATGGGA TGCTTATGGA GCAGAAATGT TTAGATTAAA AGATAGACAT 
AACAGAGATT TTTGCTTAGG ACCAACTCAC GAAGAGGTAT TTACTGATAT AGTTAGAAAT 
GAAATAAAGT CATATAAGCA ATTACCATTA AATCTTTATC AAATACAAAC TAAGTATAGA 
GATGAAAGAA GACCAAGATT TGGAGTTATG AGATCAAGAG AATTCATAAT GAAAGATGGA 
TATAGCTTTG ACAAAGATCA AGAAGGATTA GATTTAGCAT ATGAAAAAAT GAGAAAAGCA 
TATGTTAATA TATTCAATAG ATGTGGATTA GATGCTAAGG CAGTTGCAGC TGATTCAGGA 
GCTATAGGTG GATCAGGTTC AGCTGAGTTT ATGGTTAAAT CAGAAGTTGG AGAAGATGAT 
GTAGTATTCT GTACAGCTTG TGATTATGCA GCTAACATAG AAAAAGCTCC ATCAACACCA 
GAACATGCAG AAAAAGAAGA ATTAATGGAA GTAGAAAAAG TTGAAACTCC AGCTGTTAAA 
TCAATTGAAG ATTTAGCAAA ATTCTTTGAA TGCTCACCAA AGAAAATAGC AAAAACTTTA 
ATATTCCAAG CTGATGATAA AGTGGTTGCT GTTGTATTAA GAGGAGATAG AGAAGCTAAC 
GAAGTTAAGA TAGCTAATGC TATTGGAGAA GTTATAGAAT TAGAAATGGC AAGTGAAGAG 
GCTGTTAAAG AAGCTACTGG CGCAGCTGTT GGATTTGCAG GTCCTATGGG AATAAAAGTA 
GATATGTTAT TAGTTGACCA AGAAGTAGCT AATATGTATA ACTTCATAAT TGGTGCTAAT 
GAAACTGATA TGCACTTAAA AAATGTAAAC TATGGAAGAG ACTTTGAAGG AATAGTTGGT 
GACTTTAGAA ATGTTACTAT AGGAGAAAAA TGTCCTGAGT GTGGAAAAGA AATAACTATT 
TCAAGAGGTA CTGAGGTTGG ACATATATTC AAACTTGGAA CTAAGTATTC AGAGTCTATG 
GGTGCAACAT TTATTGATGA AGATGGAAAA GCTAAACCAT TTATAATGGG ATGCTATGGA 
ATAGGGGTTA CAAGAACTGT AGCTTCAATA ATAGAGCAAC ACAATGACGA AAACGGAATA 
ATATGGCCAT TAGAAGTAGC TCCATACCAT GTATCAGTTA TACCAGCTAA TGTTAAAAAT 
GAAGAACAAG CAACTAAAGC TGAAGAAATA TACAATGAAT TAAGAAAAAT GGGAGTTGAA 
GCTCTACTTG ATGATAGAAA AGAAAGAGCA GGAGTTAAAT TCAAAGATTC TGAATTAATG 
GGAATTCCAA TGAGAATAAC TGTTGGAAAG ATGATTGGTG AAGGTCAAGT TGAATTTAAA 
CTTAGAAACG GTGGAGAAGT TGAGACTTTA TCTATAGAAG AAGTTTATAA TAGAGTAAGA 
GAAGAATTTG AAAGAGCAAA TTTATCTTTA TAA

Protein sequence

MKMSNMLVGT LREVPAEAEI ESHKLMLRAG LMRKMAAGIY NYMPLGLKVI ENVKNIVREE 
MNNAGAQEFL ASALIPAELW QESGRWDAYG AEMFRLKDRH NRDFCLGPTH EEVFTDIVRN 
EIKSYKQLPL NLYQIQTKYR DERRPRFGVM RSREFIMKDG YSFDKDQEGL DLAYEKMRKA 
YVNIFNRCGL DAKAVAADSG AIGGSGSAEF MVKSEVGEDD VVFCTACDYA ANIEKAPSTP 
EHAEKEELME VEKVETPAVK SIEDLAKFFE CSPKKIAKTL IFQADDKVVA VVLRGDREAN 
EVKIANAIGE VIELEMASEE AVKEATGAAV GFAGPMGIKV DMLLVDQEVA NMYNFIIGAN 
ETDMHLKNVN YGRDFEGIVG DFRNVTIGEK CPECGKEITI SRGTEVGHIF KLGTKYSESM 
GATFIDEDGK AKPFIMGCYG IGVTRTVASI IEQHNDENGI IWPLEVAPYH VSVIPANVKN 
EEQATKAEEI YNELRKMGVE ALLDDRKERA GVKFKDSELM GIPMRITVGK MIGEGQVEFK 
LRNGGEVETL SIEEVYNRVR EEFERANLSL