Gene CPR_1243 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1243
Symbol
ID	4205478
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1395059
End bp	1396291
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	30%
IMG OID	642565799
Product	hypothetical protein
Protein accession	YP_698565
Protein GI	110802193
COG category	[S] Function unknown
COG ID	[COG3584] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.015154
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAAA GATTTTTGTC AGCATTAATT GCTATGTCAA TTAGCATTTC AGCTACTCAT 
GTAGTTTTTG CTGATACAGT AAATGATAAG AAATCTACTA TACAGGAGAA TAAAGTAAAA 
TATTCACAAT TAGATAATGA AGTTATTTCA CTTAACTCTC AAGTGTTAAA ACTTAATAAT 
GAAATTGAAG ATTTAAATGC CAAATTAGAA GATAATAAGG CTAAAATGAA AGATACAGAA 
GAGAATTTAA AAGAGACAGA AAGCAAAGTA AGCACTTTAA AAACTGAAAT AAATGAAAAG 
CAATCTGTTT TAGGAAAAAG AATGCGTGCT ATGTATAAAA GTAAGGATTC TATGAATCCC 
GTAGTTTTCT TGCTTAAATC TGAAAACTTA TCTGATTTAA TAACAAGAAT AGATGCTTTG 
GCAAGGGTTA CAGCTTTAGA TAAAAATCTT ATACAAAGTT TAGATGAGCA AAAAGATTCT 
CTTAATAGTG ATATTAAAAA GTTAGAGAGA GATAAAGCTG AGCTTAAAGA GTTGAAAGCT 
TCAAATGAGG AATCTCTTAA AACCTTAGAT AATAAAAAAA TTGAAGAACA AAAGAAAATT 
GATGAATTAA ACAAACAAAA AGAAGCTGTT TTAGAAGTGA TTAAAGAAAA TGAAATGTCT 
TTAATATCTC ATTCAGTTTC AATTATAAAT TCAAGTTCAT CAATTAATGA ACTTGAAAGT 
GCAGTAAGCA CATTGAATCA ATTAATACCA CAACTTAACA TTGATTCTAT AAAAGAGGCA 
GCTAACAATT CTTTACAAGC TGCTAAAAAT AAAATTGAAT CATTAAAAGC TGAAGAAGCT 
AAAAAAGCAG AGGAAGCCGC TAAAAATAAT GCTGCAAACT CTTCAAATCC TACTAGCAGT 
AATAATAGTT ATAGCCAACC TAGTAGCGAT GGTAAGTATA AGAAAACACT TTCTATGGAA 
GCCACTGCAT ATAGTGGTGG AACCTTAACA GCTATGGGAC TTAAACCTGT AAGAGATCCA 
GGTGGAATAA GTACAATAGC TGTTGACCCT AGTGTAATTC CTTTAGGATC AAAAGTGTAC 
ATCCCTGGTT ATGGTTATGC TATAGCATCA GATACAGGTG GAGTTATAAA AGGAAATATT 
ATCGACCTTT ATATGAACTC TCATGATGAA TGTACATCTT GGGGAAGACG TCAAGTTACA 
TTACACATAG TTGCTTATCC TGGTGAATGG TAA

Protein sequence

MQKRFLSALI AMSISISATH VVFADTVNDK KSTIQENKVK YSQLDNEVIS LNSQVLKLNN 
EIEDLNAKLE DNKAKMKDTE ENLKETESKV STLKTEINEK QSVLGKRMRA MYKSKDSMNP 
VVFLLKSENL SDLITRIDAL ARVTALDKNL IQSLDEQKDS LNSDIKKLER DKAELKELKA 
SNEESLKTLD NKKIEEQKKI DELNKQKEAV LEVIKENEMS LISHSVSIIN SSSSINELES 
AVSTLNQLIP QLNIDSIKEA ANNSLQAAKN KIESLKAEEA KKAEEAAKNN AANSSNPTSS 
NNSYSQPSSD GKYKKTLSME ATAYSGGTLT AMGLKPVRDP GGISTIAVDP SVIPLGSKVY 
IPGYGYAIAS DTGGVIKGNI IDLYMNSHDE CTSWGRRQVT LHIVAYPGEW