Gene CPR_0907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_0907
Symbol	msmK
ID	4205441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1039170
End bp	1040297
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	31%
IMG OID	642565465
Product	sugar ABC transporter, ATP-binding protein
Protein accession	YP_698231
Protein GI	110802176
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0858146
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTTTTA TAGAATTTAA GAATGTAGAA AAACAATATA AGAATGCAAC AAAGAAGTCA 
GTTACTGATT TTAATTTATC CATAGATGAA AAAGAATTTA TAGTATTTGT AGGACCATCA 
GGATGTGGTA AATCAACAAC TTTAAGAATG CTTGCAGGTT TTGAAGAAAT AACTGGAGGA 
ACTATTTCAA TAGATGGAAA TATAGTCAAT AATACGCCGC CAAGAGAACG TGGAATATCT 
ATGGTGTTCC AAAACTATGC ATTATATCCT CATATGACAG TAGAAGATAA TATAGCTTTT 
GGATTAAAGA ATATTAAAAC TCCAAAAGAT GAAATAAAGA AAAAAGTAAA CTGGGCAATT 
GAGATTTTGG GTTTAGAAGA ATACAGAAAG CGTAAGCCTA AGAATTTATC TGGAGGACAA 
CGTCAAAGGG TTGCACTTGG AAGAGCAATA GTACGTAATC AAAAAGTATT CTTAATGGAC 
GAGCCTTTAA GTAATTTAGA TGCTAAATTA CGTGTCAGTA TGCGTAATGA GATAAGTAAA 
TTGCATAGAG AACTTGGAAG TACTACAATT TATGTTACCC ATGATCAGGT TGAAGCTATG 
ACTATGGCAG ATAGAATTGT TGTTATGAAA GATGGAATAA TACAACAAAT AGGAACACCT 
ATGGACTTAT ATGACAATCC TAGAAACAAA TTTGTTGGAA GCTTCATAGG CTCACCACAA 
ATGAACTTTC TTAATGTTGA AGTTAAAGGA AATAAAGCTA TATTAGAAAA TGGAAGCAAA 
ATAACGCTTC CAGAAGGAAT ATTAAAAAGA ATGAACAACA GACAAGGCAA ATTATGTATG 
GGATTTAGAG CTGAAGATAT AAAGCTTGAT AATCTAAATA TTGGATTATT TGAAGACAGT 
ATTATTACTT CAGCTATAGA AAATACAGAA ATCATGGGAA ATGAAAATAA CTTGTATTTT 
AAAATAGGAA ACACTACAGC AGTAGCAAGA GTAGGAAAAG AAGACGTAAA GGAAATTGGA 
GAGCAATTCA AATTTGTAAT CAATGTAAAT AAAGTTCATT TCTTTGACTT GGATACTGAA 
GAAAATATAC TAAACTTAGG AAATACCCTA ACTTTAGATT ATAATTAA

Protein sequence

MGFIEFKNVE KQYKNATKKS VTDFNLSIDE KEFIVFVGPS GCGKSTTLRM LAGFEEITGG 
TISIDGNIVN NTPPRERGIS MVFQNYALYP HMTVEDNIAF GLKNIKTPKD EIKKKVNWAI 
EILGLEEYRK RKPKNLSGGQ RQRVALGRAI VRNQKVFLMD EPLSNLDAKL RVSMRNEISK 
LHRELGSTTI YVTHDQVEAM TMADRIVVMK DGIIQQIGTP MDLYDNPRNK FVGSFIGSPQ 
MNFLNVEVKG NKAILENGSK ITLPEGILKR MNNRQGKLCM GFRAEDIKLD NLNIGLFEDS 
IITSAIENTE IMGNENNLYF KIGNTTAVAR VGKEDVKEIG EQFKFVINVN KVHFFDLDTE 
ENILNLGNTL TLDYN