Gene CPF_2363 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2363
Symbol
ID	4202567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2627910
End bp	2628941
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	29%
IMG OID	638083228
Product	putative thiamin biosynthesis lipoprotein ApbE
Protein accession	YP_696786
Protein GI	110799064
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGAAAA AGAGAGCAAT TGTTATTTTA TTAGTTTCTA TACTTTCTAT GGGATTAATA 
TCTTGTGATA ATTCAAAAAA AGTGGAAAGC AATAATAAAG AAGTTAATTC CTATGAAAAA 
ACAGAAAAGA TTTTAGGTAC TGTAGTTAGT GGAGTAGCAT ATGGAGATAA TGCTAAGGAA 
GCCTTAGAAA AAGCTTTTAA TAGAGCAAAG GACATTGAGA ATATGATGTC AGTAAATATA 
GAGAATAGTG AGCTTAGCAA GGTAAATTCT GAAGCTTTTC ATAAAAGTGT TAAGTTATCA 
GATGATTTAT ATTATGTCAT AGAAAAATCT ATATATTATG CTAATTTAAC TGATGGAGCT 
TTAGATCCAA CTATAGGACA TGTAATTGAT TCTTGGGGAA TAGGAACAGA ACATGCTAAT 
ATACCTGAAA AAACTTTAAT TGATAAGTAT AAAGATTTAA AAAATTATAA GAATATAGAA 
TTAAATCCTC ATACTAAGGA AATAAGATTT TTAAATGAAA ATATAAAATT AGATTTAGGA 
GCCATTGGAA AAGGATATGC TGGAGATGAA ATGAGAAAAG TTTTAAGGGA AGAAGGAATA 
AATTCAGCAT TACTTAATTT AGGGGGAAAT GTTGTTGCCT TAGGAAATAA GATAAATAAT 
GAAAATTGGA GCATAGGAAT AAGAAATCCT AAGGAAGAGA ATGAGATTTC AGCTTCTGTA 
AAAATTAATG ATGAAGTTGT GGTAACATCA GGAAATTATG AAAGATATTT TATAAAAGAT 
GGAGTTAGAT ATCATCATAT ATTAGATCCT AGCACTGCTT ATCCAGCTGA AAAGGGACTT 
ATAAGTTCAA CAATAATCAC TAAAAATGGA ATAGATGCAG ATGCCTTATC AACAGCTACT 
TATATTTTAG GGGCAGAAAA AGCTAAGAAA CTTATTGAAG GATTAGATGG GGTAGAGGCA 
TTATTTATAA AAGATAATAT GGACTTCATA GAAACAAGCA ACTTGGATAA CAAAGGATTT 
AGGGGGATGT AA

Protein sequence

MLKKRAIVIL LVSILSMGLI SCDNSKKVES NNKEVNSYEK TEKILGTVVS GVAYGDNAKE 
ALEKAFNRAK DIENMMSVNI ENSELSKVNS EAFHKSVKLS DDLYYVIEKS IYYANLTDGA 
LDPTIGHVID SWGIGTEHAN IPEKTLIDKY KDLKNYKNIE LNPHTKEIRF LNENIKLDLG 
AIGKGYAGDE MRKVLREEGI NSALLNLGGN VVALGNKINN ENWSIGIRNP KEENEISASV 
KINDEVVVTS GNYERYFIKD GVRYHHILDP STAYPAEKGL ISSTIITKNG IDADALSTAT 
YILGAEKAKK LIEGLDGVEA LFIKDNMDFI ETSNLDNKGF RGM