Gene CPR_1618 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1618
Symbol
ID	4204381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1808961
End bp	1810247
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	26%
IMG OID	642566169
Product	hypothetical protein
Protein accession	YP_698934
Protein GI	110801765
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0613735
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAATT TTATAAAGTT TATAAGTTTA ATTTTAATTA GTGCATTACT AGGAAGTATA 
ATATGTTTTT TTACTAATAA AGATGGTAAA TATTTAGAAA GTGAAAGTTT TAGTGAAGAG 
TTAATACTAA AGGGATTAAA GGGAGCAAGA GCCTTATGTA ATGATGAAGA GAATATTTAT 
ATAGCATTAG AAAATAAGAT TTTGAAAATA GATAGAAATA ATAATGTGTT TTTGGAATTA 
AAAGAAGAGG GAAATATATA TGATTTAGAA TATTATAATA AATTTTTATA TTACACTTTA 
GATGAAAAGT TAGTATCTTA TAACATAAAA AGTTCAGAAA GAGAAGTTTT AATTGAGGAT 
ATTCCTAATA AGGGGATAAA TAAAGAGGAT ACTAGGATTT TAATAAATGA TGGAAAGCTT 
TATTTAACCA TAGGAACTTC TACAAATTCT GGAATAGTAG ATAAAGAGGG AGAAAATCCT 
GATATTCCTC CAGTAGATAT TGTTTTAAGT GGAAGAAATT ATGATGAAAA TAAAAAGGGA 
GCTTTTGTGC CATATAATAC TAAGACAGTA AAGGGAGAAA AGGTAAAAGG AAATATATTA 
GGTAATGGAG CTATTATAGA ATTTGATATA GAGAGCAAGA AAAAGCAATT ATATTCCTAT 
GGAATAAGAA ATGTTAAAGG TTTTGATTTA AATAGTTCAG GAGAGATTTT TGCAGTTGTT 
GGAGGAATGG AAGATGAGGG GGTTAGACCT TTAAGTGGAG ATTCAGATTA TATATATAAA 
ATAGAAGGAA AGGGAACTTG GTATGGTTGG CCAGATTATA GTGGAGGAGA TCCTGTTAAT 
TCTCCAAGAT TTAGAGAAGA AGGAAAACCT ATAATTAACT TTGTAACAGA TGCACATAAA 
AGCTATGTAA TGCCTAAACC ACTATACCAA AGTGAAGACA CTAGAAATAT AAATACATTA 
TTAATAGATA AAAAAGGAAT AATTCTAGAA GATGAGAATT CATTTTTATT CTTTAACAAC 
AAAAACAATA CTCTTTTAAA ATTATTAAAG GAGGGAGAAG TTAAAGAGTT AATATATTTA 
GATAAAAATT CATATATAAA TGATATGAAA ATAATAGGGA AGAATCTTTA TATACTAGAT 
GGAAATAAGG GGGTACTTTT TAGACTAGAA AAAAGTAACA CTATAAATAA CATACCTATT 
TATAATTACT TTGTTATATT AGGAATAAAC TTTATATTAA TTGGAGTTTT AGGTATTAAG 
TTCCTACTAT CCTTAAAGAA AAAATAA

Protein sequence

MKNFIKFISL ILISALLGSI ICFFTNKDGK YLESESFSEE LILKGLKGAR ALCNDEENIY 
IALENKILKI DRNNNVFLEL KEEGNIYDLE YYNKFLYYTL DEKLVSYNIK SSEREVLIED 
IPNKGINKED TRILINDGKL YLTIGTSTNS GIVDKEGENP DIPPVDIVLS GRNYDENKKG 
AFVPYNTKTV KGEKVKGNIL GNGAIIEFDI ESKKKQLYSY GIRNVKGFDL NSSGEIFAVV 
GGMEDEGVRP LSGDSDYIYK IEGKGTWYGW PDYSGGDPVN SPRFREEGKP IINFVTDAHK 
SYVMPKPLYQ SEDTRNINTL LIDKKGIILE DENSFLFFNN KNNTLLKLLK EGEVKELIYL 
DKNSYINDMK IIGKNLYILD GNKGVLFRLE KSNTINNIPI YNYFVILGIN FILIGVLGIK 
FLLSLKKK