Gene CPR_1551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1551
Symbol
ID	4205729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1738678
End bp	1740213
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	31%
IMG OID	642566103
Product	sugar ABC transporter ATP-binding protein
Protein accession	YP_698868
Protein GI	110802771
COG category	[R] General function prediction only
COG ID	[COG3845] ABC-type uncharacterized transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.048612
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATATG TAGTAGAAAT GCTTAATATC CGTAAAGAAT TTCCTGGTAT AGTAGCAAAT 
GATGATATAA CTTTGCAACT TAAAAAAGGA GAGATACATG CTTTACTTGG AGAAAATGGA 
GCTGGTAAAT CTACTTTAAT GGGAATTCTT TTTGGAATGA ACCAACCAGA TAAAGGGGTT 
ATAAAGGTTA GAGGTAAAGA AGTAAAAATT ACTAATCCAA ATGTTGCAAA TGATCTTGGA 
ATAGGAATGG TACACCAACA TTTTAAATTA GTTGAAAATT TTACAGTAAC TCAAAATATA 
GTTTTAGGAT GCGAGCCTAA GATTCTTTTA GGATTAGGAA TGGATTTAAA CAAGGCAGCT 
AAAAGAATTG AAAAATTGTC AAATCAATAT GGATTAAATG TTGACCCAAA TGCAAAGATT 
GAAAATATAT CTGTTGGTAT GCAACAAAGG GTTGAAATAT TAAAAATGCT TTATAGAGAT 
GCTGATGTTC TTATATTAGA TGAGCCTACT GCAGTTTTAA CCCCTCAAGA AATTGATGAA 
CTTATAAAAA TAATGAAAAA TCTTATAAAT GAGGGAAAAT CAATAATAAT TATAACTCAT 
AAACTTAAGG AGATAAAAGC TGCTGCAGAT AGATGTACAG TTATAAGAAG AGGTAGATAC 
ATTGGTACTG TAGATGTAAA AACTACTAGC GAAGCTGAAA TGGCTAAAAT GATGGTAGGA 
AGAGAAGTAT CATTTAAAGT TAATAAAAAG CCTGCTAAGC CTGGGGAGAT AGTATTAGAT 
ATTAAAAATC TTTCAGTTAA GAATAATAAG AAAGTATTAG GATTAAAGGA CTTTTCTATT 
GATGTTAGAG CAGGAGAAAT AGTAGGTATA GCAGGGGTAG AAGGTAATGG TCAAAGTGAA 
CTTATTGAGG CTATTACAGG ACTTAGAAAA AGTGAAAGTG GAACTATAAA CTTCAAAAAC 
AAGGATATAA ATAGAGAATC TATAAGAAAT AGAATAAACT CAGGGATTGC ACATATTCCA 
GAAGATAGAC ACAAGAGAGG ACTAGTTTTA GATTATACAA TTGAAGAGAA TATGGTTCTA 
GAAGTGTATG ATAAGAAACC TTTTTCAAAT AAAGGTTTAT TAAACAAAAA AGAAATAAAA 
AAATATGCAG AAAAAATAAT AGATGAATTT GATGTAAGAT CTGGAGAAGG GGCTGAATCA 
ATAGCAAGAT CTCTTTCAGG AGGAAATCAG CAAAAAGCAA TTATAGGTCG TGAAATAGAA 
TTAAATCCAG AACTTTTAAT AGCAGCACAA CCTACTAGAG GACTTGATGT AGGATCTATA 
GAGTATATTC ATAAAAGGCT TGTCGAGCAA AGAGATAGAG GAAAAGCTGT GCTTTTAGTT 
TCCCTTGAAT TAGATGAAAT ATTAAATGTC TCAGATAGAA TTGCCATAAT AAATAACGGA 
GAACTTATAG GTATTGTAAA TGCAGATGAA ACTAATGAAA ATGAGGTAGG TCTTATGATG 
GCTGGTATAA GAGGAGGAGA AAAGCATGAA GTTTAA

Protein sequence

MEYVVEMLNI RKEFPGIVAN DDITLQLKKG EIHALLGENG AGKSTLMGIL FGMNQPDKGV 
IKVRGKEVKI TNPNVANDLG IGMVHQHFKL VENFTVTQNI VLGCEPKILL GLGMDLNKAA 
KRIEKLSNQY GLNVDPNAKI ENISVGMQQR VEILKMLYRD ADVLILDEPT AVLTPQEIDE 
LIKIMKNLIN EGKSIIIITH KLKEIKAAAD RCTVIRRGRY IGTVDVKTTS EAEMAKMMVG 
REVSFKVNKK PAKPGEIVLD IKNLSVKNNK KVLGLKDFSI DVRAGEIVGI AGVEGNGQSE 
LIEAITGLRK SESGTINFKN KDINRESIRN RINSGIAHIP EDRHKRGLVL DYTIEENMVL 
EVYDKKPFSN KGLLNKKEIK KYAEKIIDEF DVRSGEGAES IARSLSGGNQ QKAIIGREIE 
LNPELLIAAQ PTRGLDVGSI EYIHKRLVEQ RDRGKAVLLV SLELDEILNV SDRIAIINNG 
ELIGIVNADE TNENEVGLMM AGIRGGEKHE V