Gene CPR_1547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1547
Symbol
ID	4203993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1734526
End bp	1735815
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	31%
IMG OID	642566099
Product	permease
Protein accession	YP_698864
Protein GI	110801721
COG category	[R] General function prediction only
COG ID	[COG2252] Permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0198208
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAGT TCTTTAAGCT TAAAGAAAAT AACACTGATG CAAAAACAGA ATTTATTGCT 
GGATTAACTA CTTTTATGAC TATGGCTTAT ATACTTATAG TAAATCCATC AATATTATCA 
GCAACAGGAA TGGATCAAGG AGCTGTATTT ACAGCAACGG CTTTATCAGC AGTAATAGCA 
ACTTTAATAA TGGGACTTTA TGCTAAGTTA CCATTTGCAC AAGCTCCAGG AATGGGACTA 
AATGCATTTT TTGCTTATAC AATAGTTATT CAAATGGGAT ATTCATTTGA ATTTGCTTTA 
ACTGCAGTTT TATTAGAAGG AATAATATTT ATACTTTTAA CTATATTTAA CGTACGTGAA 
GCAATAGTAG ACTCAATACC AAGGGGAATA AAAAATGCTA TATCAGTAGG TATAGGATTA 
CTTATTTCTT TAATAGGATT AGAGGGAGCA GGAATCGTAG TACATACAGA TGGTGGAACT 
ATAGTTTCTT TAGGAAATAT AGTTTCAGGA TCAGGACTTT TAGCAATAAT AGGTCTTTTA 
ATAACAAGTG TTTTAATAGC TAAAAACGTT AAGGGAGCAT TATTTATAGG TATGATTATT 
ACAGCAATAA TAGGAATACC TATGGGAATA ACTCCTATGC CAAGCAAGAT TATTAGTACG 
CCACCTTCAA TAGCACCTAC TTTCTTCAAG TTCGATTTTC ATAACATATT CTCTTTAGAC 
ATGGTAATAG CATTATTTAC ATTATTATTC ATGGATATGT TTGATACAAT AGGAACTTTA 
GTTGGTGTTG CAACTAAGGC TAAAATGTTA GATAAGGATG GAAAAGTACC TAACATAAAG 
AAAGCTTTAT TTTCTGACGC AGTAGGTACA ACATTAGGAG CTTTTTTAGG AACAAGTACA 
GTAAGTACTT TTGTAGAGAG TGCATCAGGG GTTGCAGAAG GAGGAAGAAC TGGATTAACA 
GCAGTTTCAA CTGCGTTTAT GTTTTTCTTA GCTTTATTCT TTGCTCCATT ATTTGCAATT 
ATAACTCCAG CAGTTACAGC GTCAGCTTTA GTTTTAGTTG GATTATTTAT GATAGAACCA 
ATAAAAGAAA TAGACTTACA TGATTTTACA GAAGCTATAC CAGCTTTCTT AACAATAATC 
ATGATGCCAT TTGCTTACTC AATATCAGAT GGTATAGTAT TTGGAGTTAT ATCATACATA 
ATATTAAAAT TATTCACTGG AAAAAGAAAA GAGATAAGTT TAACTACTGT TATCTTAGGA 
TTAGTATTTT TACTTAAGTT TTTAATATAA

Protein sequence

MEKFFKLKEN NTDAKTEFIA GLTTFMTMAY ILIVNPSILS ATGMDQGAVF TATALSAVIA 
TLIMGLYAKL PFAQAPGMGL NAFFAYTIVI QMGYSFEFAL TAVLLEGIIF ILLTIFNVRE 
AIVDSIPRGI KNAISVGIGL LISLIGLEGA GIVVHTDGGT IVSLGNIVSG SGLLAIIGLL 
ITSVLIAKNV KGALFIGMII TAIIGIPMGI TPMPSKIIST PPSIAPTFFK FDFHNIFSLD 
MVIALFTLLF MDMFDTIGTL VGVATKAKML DKDGKVPNIK KALFSDAVGT TLGAFLGTST 
VSTFVESASG VAEGGRTGLT AVSTAFMFFL ALFFAPLFAI ITPAVTASAL VLVGLFMIEP 
IKEIDLHDFT EAIPAFLTII MMPFAYSISD GIVFGVISYI ILKLFTGKRK EISLTTVILG 
LVFLLKFLI