Gene CPR_1438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1438
Symbol
ID	4204270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1618370
End bp	1619398
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	28%
IMG OID	642565992
Product	rhomboid family protein
Protein accession	YP_698757
Protein GI	110803398
COG category	[R] General function prediction only
COG ID	[COG0705] Uncharacterized membrane protein (homolog of Drosophila rhomboid)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAT TTGAGCAAGA TTATTTCAAC TTACTTATAA ATAATTATGG TTTTTATGTA 
GAAGACTTAA AAGGAGAACA GGATAAAGAA CTATGGATAG CTTTAAAGAC AGTTAAAGAT 
GATGGAAAAT ATGCAGTTAT AATATCTAAG TCTTATGAAG AGGAAGAAAA TTTAAAAATT 
GCAGAAGATT ATTTAAAAAG CTTAGGTAAG TCATATTCTC TTCATAATAT AATTCTTTAT 
AAAAGCTATG ATAGGGATGA AAAAAAGGAT GAAGACTTTT CTATAGATGA GAATTGTCAT 
AGAGTAATTG TTGATGTTCA GAAAAGAGAA GTTTTAAAAA GTGATAGGAG CTCTGAGCCT 
CTAGCAAAAA TACTAGAATT TCTATTAAAA AAGAAAGAAG AACCAAAGGT TCCTTGGTAT 
AAAAAATTAA GATGTGGAAA AGTTACAGGA ATATTGATTG GTTTAAATAT TTTAGCTTTT 
CTAGTTTGTC TTATTGTAGC TACTGCTTTA GGTGCTGGAT TCTTCAGAAA TATAGTAGAG 
ATGAATCCCA AAATTCTATA TTGGATGGGT GCTAAGCATA ATAATGCAAT AATATTTCAT 
GGAGAATATT ATAGATTAGT AACCTCTATG TTTTTGCATA GTGGAATAGT ACATCTTTTA 
TTTAATATGT ATGCTCTCTA TATATTAGGA GATTTCATAG AAAGGATTTA TGGAGCGAAA 
AAATATTTAG TTATCTATTT TGTTTCAGGA ATAGTAGCAA GTATATTTAG CTTATACTTT 
TCACCAGTTA TGGGAGTTGG CGCTTCAGGA GCTATATTTG GACTTTTAGG GGCAGCTTTA 
GTTTTTGCTT ATAATGAAAA AGATAGAATT GGTAAAGCTT TAGTAACTAA TATAATAGTT 
ATTATATTGC TTAATGTATT TATCGGTCTA TCAATGTCTA ATATAGATAT ATCTGCTCAT 
TTTGGCGGAT TTATAGCAGG AGCTATTTTA GGACTTTTCT TCCATAATTA TAAAATAATA 
AGAAAATAA

Protein sequence

MSKFEQDYFN LLINNYGFYV EDLKGEQDKE LWIALKTVKD DGKYAVIISK SYEEEENLKI 
AEDYLKSLGK SYSLHNIILY KSYDRDEKKD EDFSIDENCH RVIVDVQKRE VLKSDRSSEP 
LAKILEFLLK KKEEPKVPWY KKLRCGKVTG ILIGLNILAF LVCLIVATAL GAGFFRNIVE 
MNPKILYWMG AKHNNAIIFH GEYYRLVTSM FLHSGIVHLL FNMYALYILG DFIERIYGAK 
KYLVIYFVSG IVASIFSLYF SPVMGVGASG AIFGLLGAAL VFAYNEKDRI GKALVTNIIV 
IILLNVFIGL SMSNIDISAH FGGFIAGAIL GLFFHNYKII RK