Gene CPR_2338 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2338
Symbol
ID	4204429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2564446
End bp	2565672
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	33%
IMG OID	642566888
Product	maltose-binding periplasmic protein precursor
Protein accession	YP_699603
Protein GI	110802374
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2182] Maltose-binding periplasmic proteins/domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAAAC GTACAAAAAT TCTAGCAACT GTAATGGCTG CAACAATGTT ATTTGCAGGA 
TCATTAGTAG GATGTGGAGA GAAAGCTGAT TCAGGTAGTA CTGATGGTTC AGGAAAAGAA 
CTTACAGTAT GGTCACATTT AACTACTCCA GAAGTAGAAG AATTAAATAA AATAGCTTCA 
AAATGGGGAG AAGAAAATGG AGTTAAAGTT AAGGTTGTAG AAGACAAATC AGAAATGCAA 
GCTTACATAC AAGCTGCAAA TAGTTCAAAG GGACCAGATA TAATGTTTGG ACTAGCTCAT 
GATAACTTAG GAACATTCCA AAAGGCTGGA CTTTTAGCAG AGGTTCCAGA AGGAATTATA 
AATGATTCTG ATTATGCATC ACATCAAGTT TTAGATGCTG TAACAATAGG TGGAAAAAGA 
TATGCAGTTC CAATAGCACA AGAAACATCA GCTCTTTTCT ATAATAAGGA TAAAGTTAAA 
GAAGTTCCAA AAACCATGGA AGATTTAGTT AAGGTTGCAA AAGATGGAGT TGGATTTGAA 
TATGATATTA ATAATTTCTA TCCTACTTAT GGATTTATAG CAGCAGATGG AGGATATGTT 
TATAAAGATA ATAATGGAAC TCTTGACCCA ACTGATATCG GATTAGGAAC ACCAGGAGCT 
ATAAAAGGAT ATCAATTTGT TCAAGATTTA GTTCAAAAAG ATAAATTAAT GCCAGCTGAT 
ATAACTGGAG ATATAGCAAA GGGAGATTTC TTATCTAAGA AATCAGGATT TTATATTTCA 
GGACCTTGGG ATATATCAGC ATTTAAAGAT GGAGGAGTAA ATTTTGGAGT AGCTCCAATG 
CCAACATTAT TTGAAAAACA AGTACCAACT TTCTTAGGTG TTCAAACTGC TTTCGTAAGT 
GAAAAATCTC AGAATAAAGA TTTAGCATGG AAATTAGTTA AATACTTATC AGAAAATTCA 
GGTGATGTAT TGTTAAGTAA AGGTAACAGA ATTCCAGTAT TAAATAAATA CTTAGATAGT 
GCAGATTTCA AAAATAATGA GTATATGAGT GCTTTCGCAG AACAAGCTAA ATTCGCTACA 
CCAATGCCTA ATATACCAGA AATTCAAGCT ATGTGGGGAC CTGCTGGAGC TAACTTACAA 
TTATTAACTT CAGGACAAGT TACACCAGAA AAATGTGCTG AAATGACAGT AGAACAAATT 
AAACAAGGTA TATCTCAACA AAAATAA

Protein sequence

MGKRTKILAT VMAATMLFAG SLVGCGEKAD SGSTDGSGKE LTVWSHLTTP EVEELNKIAS 
KWGEENGVKV KVVEDKSEMQ AYIQAANSSK GPDIMFGLAH DNLGTFQKAG LLAEVPEGII 
NDSDYASHQV LDAVTIGGKR YAVPIAQETS ALFYNKDKVK EVPKTMEDLV KVAKDGVGFE 
YDINNFYPTY GFIAADGGYV YKDNNGTLDP TDIGLGTPGA IKGYQFVQDL VQKDKLMPAD 
ITGDIAKGDF LSKKSGFYIS GPWDISAFKD GGVNFGVAPM PTLFEKQVPT FLGVQTAFVS 
EKSQNKDLAW KLVKYLSENS GDVLLSKGNR IPVLNKYLDS ADFKNNEYMS AFAEQAKFAT 
PMPNIPEIQA MWGPAGANLQ LLTSGQVTPE KCAEMTVEQI KQGISQQK