Gene CPR_2072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2072
Symbol
ID	4203974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2296371
End bp	2297642
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	33%
IMG OID	642566622
Product	hypothetical protein
Protein accession	YP_699381
Protein GI	258676983
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGACTG ATTGGTCATC AATAACTGGT AAAAGAGAAG ATATGGAAGA GTTAGATCCA 
GCAGAGAGAA TAAAATCATT TGATGAAGTT GCTTTAGGAT ATACTAAAGA GGAAGCTTTA 
AGAGAAGCAG ATAGATGTAG ACAATGTCAA TGTAAGCTTT GTATGAAGGA ATGTATAATG 
CTTAATGACT ATACAGATTG TCCAAAAGCT TTATTCAGAG AATATCTAGA AAAAGGTTAT 
GAAAACATGG ATAAGATGAT AGCATATTCA TGTAATGAAT GTAATCAATG TACATTAAAA 
TGTCCAAAAG AGTTAGATTT AAAAGTTAAC TTTAGAGCTA TGAAAGAAGC TTTTTCTGAA 
GAAAATGGTG GGTTAGCACC ATTAGAAGCA TTAAAAGCAA GTGATGCTAC TCAAGAAAAA 
GAGTGTGCAG AAGAATACTG TACAACAGTT GAAGCAGCCT CAGTTGAGGA AGTGAAAGAA 
AAGAAAAAAG CTAAGAAAAA AACCAAGTAT GTATTTGTAC CAGGATGTAC AGTACCAGCT 
TATACTCCAG TGGGAGTAGA AAGTGTTTTA AGACACTTAA AAGATTCTTT AGGAGATGAA 
AATGTTGGTG CATTACTTCA ATGTTGCGGT AAAGTAACTT ACTTAATCGG AGAAGAAGAA 
AAATACGAAG AAAGAAATAA AAAGGCTATA GATATATTAG ATGAGATGGG AGCAGAAGTT 
ATAATAACTG TTTGTCCATC ATGTTATAAA GTATTTAAAG AAACAGCTAA GAATCAAAGA 
GTTATAGCAT ACTGGGATTT AATGAAATAT TTAATAGGAA TTCCAGCAGA GTCTAAAGGA 
ATAGGAGAAG GTTCAGACGT TATATTTAAC ATACATGATT CATGTGTAAC TAGAGATGTA 
ACTTCACATC ATGAAAGTGT AAGATGGATC TTAGACCAAT TAGGATATAA TTGGGAAGAA 
GTTGAAAGAA ACGGTAAAAA CACTAGATGT TGTGGTGTTG GAGGAATGGT ATGTAGCTCA 
AACCCAGAAT TATACGAGAG AGTATACACT AGAAGAGCTA ATGATTTTAA CCAAGACAAC 
ATAGTAACTT ACTGTGGTTC ATGTAGAGGA ACTATGCAAG CTTCTGGCAA AGATGCAGTT 
CATATATTAG ATCTTATCTT TGGATCAAAA TATACTAAAG ATCAAGCTCA GCAAAGAGGA 
TATAGGACAG AAGAAGAAAT GTGGGCTAAT AGATTAGAAA CTAAAGAAAG ACTAAATAAA 
TTTAAAAAGT AG

Protein sequence

MPTDWSSITG KREDMEELDP AERIKSFDEV ALGYTKEEAL READRCRQCQ CKLCMKECIM 
LNDYTDCPKA LFREYLEKGY ENMDKMIAYS CNECNQCTLK CPKELDLKVN FRAMKEAFSE 
ENGGLAPLEA LKASDATQEK ECAEEYCTTV EAASVEEVKE KKKAKKKTKY VFVPGCTVPA 
YTPVGVESVL RHLKDSLGDE NVGALLQCCG KVTYLIGEEE KYEERNKKAI DILDEMGAEV 
IITVCPSCYK VFKETAKNQR VIAYWDLMKY LIGIPAESKG IGEGSDVIFN IHDSCVTRDV 
TSHHESVRWI LDQLGYNWEE VERNGKNTRC CGVGGMVCSS NPELYERVYT RRANDFNQDN 
IVTYCGSCRG TMQASGKDAV HILDLIFGSK YTKDQAQQRG YRTEEEMWAN RLETKERLNK 
FKK