Gene CPF_0234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0234
Symbol
ID	4203951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	283778
End bp	285256
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	26%
IMG OID	638081118
Product	hypothetical protein
Protein accession	YP_694696
Protein GI	110800030
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0178449
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA ATGTAGCGCT CAGTAGTTTT TTAAACATAT CATTGAAATT TTTATTTCTT 
TTGATATTAG TAGAAAGCAT TGTTCATAGA AATTTATACT ATAAATTTTC AATTACTTCA 
TTAGTGCTTT CTATTATAGC AATAAGCTTA GTAATATTTG TGTATTTTTA TTTAAAGAAA 
AATTATAGCA AAAAACTATT ATTTATTATT CTTTTATCCG TAGGACTAAT ATTTAGAGTC 
TTATGGTTTC TAAATTTAGA TAGTATTCCT GTAGGTGATT TTAACAGGAT GTTTATATGT 
GCAGGTGAAT TTCTAACTGG AAGTAACTAT ATGTTTAGAG GAACAAGTTA CTTTGCAAGA 
TTTCCACATA TGACAGCAAC AGTACTTTAT TTTGCCATAA TAAGAAATTT TTTTAGTAAC 
CCCTTAATAG CTATCCGAAT TATAAACATA TTACTTTCAA TGTTTAACAT AATTTTGCTT 
TATATGATTT CTAAAGAAAT TTTTAAAGAT GAAAAGAAAA GTTTTTGGGT TTTATTAATA 
AGTGCCCTGT ATCCACCTAT GATATTATAT AACAATGTTT ATTGTTCAGA AAACTTAGCT 
ATGCCACTTT TATTGCTAAG TGTACTTATG TTCTTTAAAT CAATAAACAA TAAACAAAAT 
TTATTATACT TATGTCTATC TGGAATCTTT TTAAGCTTAT CTCATTTATT TAGACCTAAT 
GGATATGTTT TTATAATAGC TTACATAATG TATTTATTTC TTTATTTCAA AGAAAACATT 
ACTGTTAAGC TTAAAAATAT TCTAGTAGTA TTAGTATCAT TTATAGTTCC TTTTGTTTTA 
TTTAGTACAC TGCTTATTAA ATTAAATATA ACTGAATATC CTCTTTGGCA TGGTACAGAA 
CCACCAAGTA TTTCTATGCT AAAAGGAACA AATATAACTT CTGGTGGAAA GTGGAATGAA 
GAGGACTTTA AAGTTTTTCA TGACTGTGAT GAAAACTATG AAAAGGCTGA TAAAAAGGCT 
AAAGAAATAA TAAAAGACAG ATTAATAAAT ACTCCTAAAT TAGATCTTGC TAAATTCTAT 
GTTTCAAAAT TTTCAAACTT CTGGAATAAT GGAAGTTTTG CTGGTGATTA CTGGTCTGAA 
GCTGGATTAG ATGAAGCTTA TAATAAGGAA GATTACCTAA AAATGCTAGG AAAAGAAAAT 
GGAAATATGA CTATAAGAAT CAGTGAAGAA GGAGTATTCT ATATTCAAAG TTTCTACATT 
ATACTTCTTG CATTATCATA TGTTGGATTA TATAAAAATA AGTCAAAAAG AAAGAACTTA 
ATTGATCTTC TTTATATACT TTTTGGTGGT ATGTCACTAC AGTTATTACT CATAGAAGCT 
CAAGACAGAT ATTCATATCC TTTATCATGG ATATTTATAA TTCTTGCCAT GACTGCTTTT 
AATCCAAAAG AAAATGAGGA GGCGTTAGAT TATGATTAA

Protein sequence

MKKNVALSSF LNISLKFLFL LILVESIVHR NLYYKFSITS LVLSIIAISL VIFVYFYLKK 
NYSKKLLFII LLSVGLIFRV LWFLNLDSIP VGDFNRMFIC AGEFLTGSNY MFRGTSYFAR 
FPHMTATVLY FAIIRNFFSN PLIAIRIINI LLSMFNIILL YMISKEIFKD EKKSFWVLLI 
SALYPPMILY NNVYCSENLA MPLLLLSVLM FFKSINNKQN LLYLCLSGIF LSLSHLFRPN 
GYVFIIAYIM YLFLYFKENI TVKLKNILVV LVSFIVPFVL FSTLLIKLNI TEYPLWHGTE 
PPSISMLKGT NITSGGKWNE EDFKVFHDCD ENYEKADKKA KEIIKDRLIN TPKLDLAKFY 
VSKFSNFWNN GSFAGDYWSE AGLDEAYNKE DYLKMLGKEN GNMTIRISEE GVFYIQSFYI 
ILLALSYVGL YKNKSKRKNL IDLLYILFGG MSLQLLLIEA QDRYSYPLSW IFIILAMTAF 
NPKENEEALD YD