Gene CPF_1466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1466
Symbol
ID	4203283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1651004
End bp	1652455
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	32%
IMG OID	638082344
Product	putative lipoprotein
Protein accession	YP_695909
Protein GI	110801108
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.123804
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTAAAA ACAAAAAACT GATCGCTTTA TTATTAGGAG GAATAATTGG AACATCTTCT 
ATCTTAGCTG GATGTGGCTC AGGGGGGAGT GCTTCATCTA GTGATGGAGA AGGAGAAAAA 
CCAGTAAACT TAGTATGGTA TGTAATCGGT AAACCACAAA ATGATGGAGA ATTAGTTGAG 
GAAGAGGTAA ATAAGTATAT AAAGGATAAA ATAAATGCTA CTGTAGACAT AAAACATATT 
GACTTTGGTG ATTATAGTCA AAAAATGAAC GTAATAGCTA ACTCAGGAGA AGAATATGAT 
TTAGCATTTA CATGTTCATG GGCTTTCCCA TACTTAGATA ATGCAAGAAA GGGAGCTTTC 
TTAGAGTTAA ATGATCTTAT AGATAGTCAT GGAAAAGATC TTAAGAATGT TATTGATGAA 
AGACTTTGGA AGGGTGCAGA AGTTGATGGA AACATATATG CAGTGCCAAA CCAAAAGGAA 
ATAGCAGGAG CACCTATGTG GGTATTTGAT AAGGAACTTG TTGAGAAATA TGATATTCCT 
TACCAAGATA TTCATTCCGT TGATGATTTA GAACCATGGC TTGCACTTAT AAAAGAAAAG 
GAACCAGATT TTGTTCCATT CTATACTCAA GGAGATGGAA TTCCTATAGA AGGTATAGAG 
GATATAACAT CAGGCTTAGG TATTTTCTAT GATGATAAAA GCTTAACAGT TAAAAATATG 
TATGAAACAG AGGAGCTAAA ACATCTTTTC ACTAAATTAA GAGAATTCTA TGAAAAAGGA 
TATATAAATC AAGATGCAGC AGTTAGTAAT ATGAAAAATG AAGTTAAGAG ATTTGTGTGG 
AAGGCTGATG GACAACCATA TGCTGAAAAT GGATGGAGTC AATCTTTAGG TAGAGAGGTT 
GTAACTTCAT CAATAGTTTC TTCATATGTT ACAAATGCAT CAACTACAGG TGCTATGACT 
GCTATATCAG CAACATCTAA GCATCCAGAA AAGGCTATGG AACTTATAAA CTTAGTAAAT 
AAAGATTCTA CATTAAGAAA TCTATTAATG TTTGGAATAG AGGGAACTCA CTATGAAAAG 
GTTAGTGATA ATCAAATAAA GAGAGATCCA AATGGACCAT ATAGTGTTAC AAGTTGGGCT 
TATGGAAACT TATTTGATAC TTATGTTTTA GATAGTGACC CAGTAGATAA GTGGGATGCT 
TTTGAGGAAT TTAACCAAAA GGCTAAAACT TCAACTATAT TAGGATTTAA ATTTGATACA 
GAAAAAGTTG TAACTCAAAT GTCAGCTGTA AGTAATGCTT TTGAAGAGTT TATTAAACCT 
TTATATACTG GTTCAGTAGA TACTGAAGAG ACTTTAGAAA AGTTAAATAA GAAGCTATAT 
GATTCAGGTC TAGAAGATAT AAAAGTTGAG TTACAAAGAC AATTAGATGA GTGGAAAAAA 
GAAAATAAAT AG

Protein sequence

MLKNKKLIAL LLGGIIGTSS ILAGCGSGGS ASSSDGEGEK PVNLVWYVIG KPQNDGELVE 
EEVNKYIKDK INATVDIKHI DFGDYSQKMN VIANSGEEYD LAFTCSWAFP YLDNARKGAF 
LELNDLIDSH GKDLKNVIDE RLWKGAEVDG NIYAVPNQKE IAGAPMWVFD KELVEKYDIP 
YQDIHSVDDL EPWLALIKEK EPDFVPFYTQ GDGIPIEGIE DITSGLGIFY DDKSLTVKNM 
YETEELKHLF TKLREFYEKG YINQDAAVSN MKNEVKRFVW KADGQPYAEN GWSQSLGREV 
VTSSIVSSYV TNASTTGAMT AISATSKHPE KAMELINLVN KDSTLRNLLM FGIEGTHYEK 
VSDNQIKRDP NGPYSVTSWA YGNLFDTYVL DSDPVDKWDA FEEFNQKAKT STILGFKFDT 
EKVVTQMSAV SNAFEEFIKP LYTGSVDTEE TLEKLNKKLY DSGLEDIKVE LQRQLDEWKK 
ENK