Gene CPF_1437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1437
Symbol
ID	4203677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1617566
End bp	1618798
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	31%
IMG OID	638082317
Product	3D domain-containing protein
Protein accession	YP_695882
Protein GI	110800183
COG category	[S] Function unknown
COG ID	[COG3584] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00168198
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAAA GAATTTTGTC AGCATTAATT GCTATGGCAA TTAGTATTTC AGCTACTCAT 
GTAGTTTTTG CTGATACAGT AAATGATAAG AAATCTACTA TACAGGAGAA TAAAGTAAAA 
TATTCACAAT TAGATAATGA AGTTATTTCA CTTAACTCTC AAGTGTCAAA ACTTAATAAT 
GAAATTGAAG ATTTAAATGC TAAGTTAGAA GATAATAAGG CTAAAATGAA AGATACAGAA 
GAGAATTTAA AAGAGACAGA AAGCAAAGTA AGCACTTTAA AAACTGAAAT AGATGAAAAA 
CAATCTGTTT TAGGAAAAAG AATGCGTGCT ATGTATAAAA GTAAGGATTC TATGAATCCC 
GTAGTTTTCT TGCTTAAGTC TGAAGACTTA TCAGATTTAA TAACAAGAAT AGACGCTTTA 
GCAAGGGTTA CAGCTTTAGA TAAAAATCTT ATACAAAGTT TAGATGAGCA AAAAGATTCT 
CTTAATAGTG ATATTAAAAA GTTAGAGAGA GATAAAGCTG AACTTAAAGA ATTGAAAGCT 
TCAACTGAGG AATCTCTTAA AACCTTAGAT AGTAAAAAAA TTGAAGAACA AAAGAAAATT 
GATGAATTAA ATAAACAAAA AGAGGCTGTT TTAGAAGTAA TTAAAGAAAA TGAAATGTCT 
TTAATATCTC ATTCAGTTTC AGTTATAAAT TCAAGTTCAT CAATTAATGA ACTTGAAAGT 
GCAGTAAGCA CATTGAATCA ATTAATACCA CAACTTAACA TTGATTCTGT AAAAGAGGCA 
GCTAACAATT CTGTACAAGC TGCTAAAAAT AAAATTGAAT CATTAAAAGC TGAAGAAGCT 
AAAAAAGCAG AGGAAGCTGC TAAAAATAAT GCTGCAAACT CTTCAAATAC TACTAGCAGT 
AATAATAGTT CTAGCCAACC TAGTAGCGAT GGCAAGTATA AGAAAACACT TTCTATGGAA 
GCCACTGCAT ATAGTGGTGG AACCTTAACA GCTATGGGAC TTAAACCTGT AAGAGATCCA 
GGTGGAATAA GTACAATAGC AGTTGATCCT AGTGTAATTC CTTTAGGATC AAAAGTGTAC 
ATCCCTGGTT ATGGTTATGC TATAGCATCA GATACAGGTG GAGTTATAAA GGGAAATATT 
ATTGACCTTT ACATGAACTC TCATGATGAA TGTATATCTT GGGGAAGACG TCAAGTTACA 
TTACACATAG TTGCTTATCC TGGTGAATGG TAA

Protein sequence

MQKRILSALI AMAISISATH VVFADTVNDK KSTIQENKVK YSQLDNEVIS LNSQVSKLNN 
EIEDLNAKLE DNKAKMKDTE ENLKETESKV STLKTEIDEK QSVLGKRMRA MYKSKDSMNP 
VVFLLKSEDL SDLITRIDAL ARVTALDKNL IQSLDEQKDS LNSDIKKLER DKAELKELKA 
STEESLKTLD SKKIEEQKKI DELNKQKEAV LEVIKENEMS LISHSVSVIN SSSSINELES 
AVSTLNQLIP QLNIDSVKEA ANNSVQAAKN KIESLKAEEA KKAEEAAKNN AANSSNTTSS 
NNSSSQPSSD GKYKKTLSME ATAYSGGTLT AMGLKPVRDP GGISTIAVDP SVIPLGSKVY 
IPGYGYAIAS DTGGVIKGNI IDLYMNSHDE CISWGRRQVT LHIVAYPGEW