Gene CPR_0540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_0540
Symbol
ID	4204494
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	640231
End bp	641616
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	34%
IMG OID	642565097
Product	ABC transporter, substrate-binding protein
Protein accession	YP_697868
Protein GI	110803174
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAA AATTAGTTAA AATGCTAACT GTTGCATGTG TTACAGCTAT AGCTGCCTCT 
GCATTTGTTG GATGTGGAAA TAAAGAAGAG ACACCAAAAG ATAATGAAAA ACCATCAACT 
GAACAAGCTG AAGGTTCAGG AGAGAAAAAG GTTTTAGAAA TAGCTGTTTT TGAAGGTGGA 
TTTGGTAAGG ATTACTGGGA AGCTTGCATA GAGGCTTTTG AAGCTGAACA TCCTGATGTA 
GAAGTTAAGA TGGAAGCTAA TCCTAAAATA GGTGATATTA TAAGGCCTAA ATTATCATCA 
GAAAAAACAC CTGATTTTAT ATATTTAAGT ACAAATGATC CATCAGGTAT AGCTAATGCT 
TTAATAAAGG ATAAAGCTTT AGTAGATTTA AGTGATGTAT TCGATAGAGA AGATCCAGAT 
AATCCAGGAC AAAAATTAAA AGATAAAATA TTACCAGGAT TTTTAGATAC ACCACTTACA 
ACTCCATATG GAGATGGAAA AGTATTTTTA GCACCACTTT ACTATAATGT TACAGGTATG 
TGGTATAACA AAGCATTATT CAAAGAAAAA GGATGGGAAG TTCCAAAAAC TTGGGATGAG 
TTCTTTGAAT TAGGTAAGAA GGCAAAAGAT GAGGGAATAG CTCTTTATAC TTATCAAGGA 
CAAGCGCCAG GATACAATGA GGCTGTAATA TTCCCAATGT TAGCTAGTGC AGCTGGAGAA 
GAAACTGTAG AAAAGATATT CAACTATGAA GAAGGTGCAT GGAAAGATCC AAATGTTAAA 
AAAGCATTAG ATATATTCCA AAGGATGGCT GACGAGGACA TGGTTCTTAA TGGAACTGTT 
GGTATGACTC ATACTCAAGC ACAAGTTGAA TTCTTAAATG GAAAAGCATT ATTCTTACCA 
TGTGGTAGCT GGTTAGAAGG AGAAATGAAA GATGCTATAC CAGAAGGATT TGAGTTTGGA 
TTTATGGCTC CACCAGCATT TAAAGAAGAG GATACTCCAT ATGTAACTAC TACAATAGAG 
CAAATGTATA TCCCAGCTAA ATCAGATCAA GTTGAATTAG CAAAAGAATT CTTAGCATTC 
CAATATACAG ATGCTATGGT TAAAAAGAAT GCTGAAATAG CTAAGGCTGT AGTTCCAGTT 
AAGGGAGCAG TTGAAAAAGC TAAATCTTCA TTAGATGCAT CAGGATATGA GTCTTATAAG 
GTTGTTGAAG AAGGTGCTAA ACCAATTCCA CTTTCATTTA AACCAACAAA CTCTAAATTA 
GATTTTAGAA ATGATAGTTT ATTTGGACCA GTAGGAAGTA TCATAAATAA AGAATTAACA 
GTTGATGAAT GGATTAATAA CTTAGAATCT GATTCACAAA CTCTTGCTAA AGAAGTTGTT 
GAATAA

Protein sequence

MKRKLVKMLT VACVTAIAAS AFVGCGNKEE TPKDNEKPST EQAEGSGEKK VLEIAVFEGG 
FGKDYWEACI EAFEAEHPDV EVKMEANPKI GDIIRPKLSS EKTPDFIYLS TNDPSGIANA 
LIKDKALVDL SDVFDREDPD NPGQKLKDKI LPGFLDTPLT TPYGDGKVFL APLYYNVTGM 
WYNKALFKEK GWEVPKTWDE FFELGKKAKD EGIALYTYQG QAPGYNEAVI FPMLASAAGE 
ETVEKIFNYE EGAWKDPNVK KALDIFQRMA DEDMVLNGTV GMTHTQAQVE FLNGKALFLP 
CGSWLEGEMK DAIPEGFEFG FMAPPAFKEE DTPYVTTTIE QMYIPAKSDQ VELAKEFLAF 
QYTDAMVKKN AEIAKAVVPV KGAVEKAKSS LDASGYESYK VVEEGAKPIP LSFKPTNSKL 
DFRNDSLFGP VGSIINKELT VDEWINNLES DSQTLAKEVV E