Gene CPR_0072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_0072
Symbol
ID	4204543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	80628
End bp	81692
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	27%
IMG OID	642564618
Product	extracellular solute-binding protein
Protein accession	YP_697413
Protein GI	110802721
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGGAA TAAAGAAAAT ATTATCATTA GGTTTGCTTT TAGTATTTTC ATTTTCAATG 
GTATCTTGTG GTGGATCAAA AGAAAATACT TTAGAGGATA CAGTAGTAGT AACAAGTAAA 
TATCCTGATG AAGTTAATAG TTATATAGCT GAAGAATTTA AGAAAGAAAC TGGAATATCA 
GTTAAATATG AAGTGAAAGA TGAAATAAAA GAAGATGATT TTAAAAATTC TAATACTGAT 
ATTATCTTAG GTGGAAATAG CGAATTATAT AAAAAAATGG CTTCAGATAA TATTCTTAAA 
GGATATAAAA CAAGTTGGTA TAGCGATGTA GATGATAATT ATAGAGATAA AGATGGATAT 
TGGTATTCAA TATTTAGAAA CCCTATGGTA GTTGCTTATA ATAAAGCTAA CTTAGCAGCG 
AATCTTGTAC CAAAGAGTTT AGCTGATTTA AAAAACGGGA ATTTAGCTAA TAAATTATTA 
ATGGTAAATT CCAATAATGA TTATACAAAG TATTTTATAT CTGCTACAGC TTCTTATTTA 
ACTAAAGAAG CAAATAATGA TGATAATATA GGAAATACTT TCTTACAAGG TGTAAAGTTA 
AATGTGGCTA CATTTTTTAA TAATTACGAT GAATTATTTA CAGCTTTAGA CACTAAAGAA 
ACTCCAATAG GAATTTTACC TTTAGATGTT TTAAATAAAA AAATTAAAGA TAATGCTAAT 
ATAACAAGAA TTGATTTTGA AGAGGGTGTA CCCGTTATAA CTGAATGTGC AGGTATATTA 
AAATCAGCTC CTAATCCAAA TGCTTCAGAA CTATTTATGG AGTTTGTAGC TGGGCCAAAG 
ATTCAATTAG AACTAGCTCA GAAATTTAAT ATAATGCCTA CATTACCTGT AGCAATAAAA 
TATTCTCCTG ACTGGATTAA GAATTTTAAA ACTTTAGATA TAGAAAATAA TGTTGTTCTT 
GAGAATGAAG ATAAATGGGT TCAATTCTTT AATGGTGTTG TTAAACCAGA AGTACCTGCC 
AAGACAACTA ATAATCCTGT TATTAAAGGT AAGAAGAAAT CTTAA

Protein sequence

MKGIKKILSL GLLLVFSFSM VSCGGSKENT LEDTVVVTSK YPDEVNSYIA EEFKKETGIS 
VKYEVKDEIK EDDFKNSNTD IILGGNSELY KKMASDNILK GYKTSWYSDV DDNYRDKDGY 
WYSIFRNPMV VAYNKANLAA NLVPKSLADL KNGNLANKLL MVNSNNDYTK YFISATASYL 
TKEANNDDNI GNTFLQGVKL NVATFFNNYD ELFTALDTKE TPIGILPLDV LNKKIKDNAN 
ITRIDFEEGV PVITECAGIL KSAPNPNASE LFMEFVAGPK IQLELAQKFN IMPTLPVAIK 
YSPDWIKNFK TLDIENNVVL ENEDKWVQFF NGVVKPEVPA KTTNNPVIKG KKKS