Gene CPR_1403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1403
Symbol
ID	4205702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1577147
End bp	1578292
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	30%
IMG OID	642565957
Product	aminotransferase, class V
Protein accession	YP_698722
Protein GI	110802957
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.862736
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGTTT ATTTTGATAA TAGTTCTACT ACTAAGTCTT TAAAGGAAGT TAGAGATGAA 
GTTTATTATG CTATGGATGA ATTCTGGGGT AATCCATCAT CTTTACATAA ATTAGGGGTA 
AAGATGCAAA GAAAGATTGA AGAGCTTCAA GAGAGGATTG CAAAAAAAAT AAATGCTTCT 
AAGGAAGAAA TAATTTTTAC TTCAGGAGGA AGTGAAAGCA ATAATATGAT TATTAAAGGA 
TTAGCTAGAG AAAATAATCA TATTATAACT ACAACCTTTG AACATTCTAG TGTTTTAAAC 
ACTTATAGGG AATTAGAAAA GCAAGGTGTA AGTGTAACAT ATTTAAAGGT TAATAATAAA 
GGTTTTATAG ATTTAAAAGA ATTAGAAGAG GCAATAAATA AAAATACGAT TTTAGTATCT 
ATAATGCAGA TTAACAATGA AGTGGGAAGC ATACAAAAGA TTAAGGAAAT AGGAAGATTA 
ATTAAAGAAA AAAGTAAAAG AGCAAAATTT CATGTAGATG GAGTACAGGG TTTTGGAAAA 
TTTGAAATTG ATGTTAAGGC ATGTAATATA GATTTTTATT CTGTTTCAGC TCATAAATTT 
CATGGACCAA AGGGAGTTGG ATTCATGTAT ATGAGAAAGG GGTTAAATTT AAAATCCCTA 
ATAACTGGTG GAGAACAACA AAGAGGATTA AGGGCAGGAA CGGAAAATAC TCCTTCGTAT 
ATGGGCATGG TAAAGGCTAT GGATATTGCC TATGATGCCT TAGAAGACTC TTATAATCAT 
GTAAAAAATC TTAAGGAGTA TTTTATAGAA AAACTTTCTA AAATAGAAAA TGTAGTAATA 
AATAGTCCTA GTAGTGAAGA ATATAGTCCT TACATATTAA ATGTTTCTTT TTTAGGAACT 
AGATCAGAGG TTTTACTTCA CATCTTAGAG GAGGATAACA TATTTGTTTC AACAGGGTCA 
GCCTGTTCTT CAAAAGCTTC CGTAGCCAAG GGAAGTTACG TATTAAATGC TATGGGATTA 
GAACCAAAGT GCATTCAAGG GGCTATAAGA TTTAGTTTTT CTAGATATAA CACTTTAGAA 
GAAGTTGATT ACACCATAGC TTCACTAGAA AAAGCTTTAA AATTTTTAAG GAGAATAAAA 
ATATGA

Protein sequence

MEVYFDNSST TKSLKEVRDE VYYAMDEFWG NPSSLHKLGV KMQRKIEELQ ERIAKKINAS 
KEEIIFTSGG SESNNMIIKG LARENNHIIT TTFEHSSVLN TYRELEKQGV SVTYLKVNNK 
GFIDLKELEE AINKNTILVS IMQINNEVGS IQKIKEIGRL IKEKSKRAKF HVDGVQGFGK 
FEIDVKACNI DFYSVSAHKF HGPKGVGFMY MRKGLNLKSL ITGGEQQRGL RAGTENTPSY 
MGMVKAMDIA YDALEDSYNH VKNLKEYFIE KLSKIENVVI NSPSSEEYSP YILNVSFLGT 
RSEVLLHILE EDNIFVSTGS ACSSKASVAK GSYVLNAMGL EPKCIQGAIR FSFSRYNTLE 
EVDYTIASLE KALKFLRRIK I