Gene CPR_1601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1601
Symbol	rbsA
ID	4205167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1792231
End bp	1793736
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	30%
IMG OID	642566152
Product	ribose transport ATP-binding protein rbsA
Protein accession	YP_698917
Protein GI	110802039
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0126293
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGAAA GAACACCAAT GCTAAAAATG GTAGGTGTAT CAAAATCCTT TCCAGGAGTC 
AAAGCTTTAG ATAATGTTAG CTTAATGGCT TATGGTGGAG AAGTTACTGC TTTAATGGGA 
GAAAATGGAG CAGGAAAATC AACTTTAATG AAAATACTAA GTGGAGTATA TAAAAAAGAT 
GAAGGTAAAA TATTCATTGA AGGAAGGGAA GTAGAAGTAA AGGGAATTAA ATCAGCAGAA 
GAAGCTGGTA TAACAATAAT TCACCAAGAA CTTAGTGTTT TAAATAACTT AACTGTTTCA 
GAAAATATAT TTTTAGGTAA TGAAAAACAT AGTAAATTTA CAGGAAGAAT AAATAAAAAG 
TTATTAGATG AAAGAAGTAA AATGTTCTTA GAACAAATTG GTTGTGATAT AGATCCAAAT 
AGATTAGTTA GTACTCTTAA TGTAGGTGAA AAGCAAATGA TAGAAATAGC AAAAGCCTTA 
ACTAAGAATG CTAGAATAAT TATTATGGAC GAGCCTACTA CAGCCTTAAC TGATGTAGAG 
ACTGAAAACC TTTTTAAAGT AATAGAGAAT TTAAGAAAAA AGGGAATAGC AATAATATAC 
ATATCACATA GAATGGAAGA AATATTTAAA ATATGTCATA GAGTAGAAGT ATTAAGAGAT 
GGTAAATATA CAGGAAGTGC AGAAATAAAA GACATAGATA ATGATAAGCT TATAGCAATG 
ATGGTTGGAA GAACCATAGA GGATCAATTT CCATACAGAG ATGTTAAAAA AGGAGATTTA 
GCTTTAGAAG TTAAAAATCT TAGCTGTAAG GAAGGAGTTA AAGGAGCTTC ATTTACTCTT 
AGAAAGGGAG AAATATTAGG AATTGCAGGT CTTATGGGAT CTGGCAGAAC AGAGCTTGCA 
AAAACAATAT TTGGAGAATA TAAAAAAACA AGTGGTGAAA TTTCTTTAAA TGGAAGTCTT 
ATTAATATAA ATTGCATAAG TGATGCCATA AATAATGGTA TATGTTATCT TTCAGAGGAT 
AGAAAAAAAG AGGGCTGTAT TTTAGGAATG TCTGTTGGAG AAAATATGAC CTTATGTAAC 
TTAAAGAAAT ATGAAAATAA GTTTAAATCT CTTGATAAAA AAGAAGAAGC AAAGGATATA 
GAGTACTATA TTAAGAAGAT AAACATAAAA ACTCCAAATA AGGAACAATT TATTAAGAAT 
TTAAGTGGAG GTAATCAACA GAAGGTTATA CTTGCTAAAT GGCTTATGCT ATCTCCAGAA 
GTATTAATAA TTGACGAGCC AACTAGAGGA ATAGACGTAG GTGCAAAAAA AGAAATTTAT 
GAACTTTTAA ATGAACTTAA AGCTAGTGGA AAAGCCATAA TAATGATTTC TTCAGACTTA 
CCAGAGGTTT TAGGAATTAG TGATAGAATT ATGGTTATGA GTGAAGGAAG AATCTCTGGG 
GAATTAAATA GAGATGAAGC AAATCAAGAA AGTATAATGA AATTAGCCGT TGGAATAAAC 
AATTAG

Protein sequence

MGERTPMLKM VGVSKSFPGV KALDNVSLMA YGGEVTALMG ENGAGKSTLM KILSGVYKKD 
EGKIFIEGRE VEVKGIKSAE EAGITIIHQE LSVLNNLTVS ENIFLGNEKH SKFTGRINKK 
LLDERSKMFL EQIGCDIDPN RLVSTLNVGE KQMIEIAKAL TKNARIIIMD EPTTALTDVE 
TENLFKVIEN LRKKGIAIIY ISHRMEEIFK ICHRVEVLRD GKYTGSAEIK DIDNDKLIAM 
MVGRTIEDQF PYRDVKKGDL ALEVKNLSCK EGVKGASFTL RKGEILGIAG LMGSGRTELA 
KTIFGEYKKT SGEISLNGSL ININCISDAI NNGICYLSED RKKEGCILGM SVGENMTLCN 
LKKYENKFKS LDKKEEAKDI EYYIKKINIK TPNKEQFIKN LSGGNQQKVI LAKWLMLSPE 
VLIIDEPTRG IDVGAKKEIY ELLNELKASG KAIIMISSDL PEVLGISDRI MVMSEGRISG 
ELNRDEANQE SIMKLAVGIN N