Gene CPR_1466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1466
Symbol
ID	4204492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1645389
End bp	1646357
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	30%
IMG OID	642566020
Product	hypothetical protein
Protein accession	YP_698785
Protein GI	110803172
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0764811
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTATTAT TTTCATTAAG TATATTAGTA GGATGTAATA CTTCTAAGAA AGAAGAAGCT 
AAGGCGCCTG AAGAAAAAAC ATCCATAGAA ATAGTAGTAC CAGATGGACT TCCAGCTATT 
AGTATAGTTA AAATGATAAA AGAAAAACCA GAAATAATGA AAAACTTAGA TATAAATTAT 
TCAATAGTAA AGGGATCAGA TGCTTTAGTT TCTAAAGTGT TAAAAGGAGA GGGAGATATA 
TGTATAGTTC CTTCAAATGT AGCTGCTATT GCATATAACA AAGAAGCTAA ATACAAACTT 
GCAGGAACAG TAGGTTTTGG ATCATTATAT GTTATAAGCA GTGATAATTC TGTTAATAGC 
TTAGAAGACC TTAAAGGAAA AGATGTTTAC AATGTTGGTC AAGGATTGAC TCCAGATTTA 
ATATTTAAAA TATTACTTCA AAATGATGGA ATAAATCCTG AAAAAGATTT AACACTAAGT 
TATGTAAATG CAGCTTCAGA ATTAGCTCCT TTATTTATAG AAGGAAAGGC TAAATATGCA 
GTCGTTCCAG AACCTATGTT AACTCAAATA ATGACAAAGA AACCAGAAAC AAAAATAGTA 
GCATCATTAA ATGAACAGTG GAAAAAAATG AGTGATTCAA AAATAGGATA TCCTCAGTCT 
AGTATTATAG TTAAAGAGGA CTTAGCAAAA AATAATTCAG AGGCTGTTCA AAAGATCCTA 
AAGGAAATAG ATAATAGTAC TAAGTGGGCA AATGAAAATA AAGAAGAAGC AGGTGCCTTT 
GCAGAAGAAG TAGGCATAAC AGGCAAAAAA GAAATAATAG CTAAATCTCT AGAAAGAGCA 
AACTTAAATT ATGTAAGTGC TTTAGATAGT GAAAGTGAAT ATATTAATTT TTATGACAAG 
ATTTACAGCT TAGAGCCTAA AGCTATAGGA GGTAAAAAGG TAAATGAAGA AATTTTCTTA 
CAAAAATAA

Protein sequence

MVLFSLSILV GCNTSKKEEA KAPEEKTSIE IVVPDGLPAI SIVKMIKEKP EIMKNLDINY 
SIVKGSDALV SKVLKGEGDI CIVPSNVAAI AYNKEAKYKL AGTVGFGSLY VISSDNSVNS 
LEDLKGKDVY NVGQGLTPDL IFKILLQNDG INPEKDLTLS YVNAASELAP LFIEGKAKYA 
VVPEPMLTQI MTKKPETKIV ASLNEQWKKM SDSKIGYPQS SIIVKEDLAK NNSEAVQKIL 
KEIDNSTKWA NENKEEAGAF AEEVGITGKK EIIAKSLERA NLNYVSALDS ESEYINFYDK 
IYSLEPKAIG GKKVNEEIFL QK