Gene CPF_1048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1048
Symbol	fucI
ID	4202763
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1195542
End bp	1197335
Gene Length	1794 bp
Protein Length	597 aa
Translation table	11
GC content	35%
IMG OID	638081929
Product	L-fucose isomerase
Protein accession	YP_695494
Protein GI	110800239
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2407] L-fucose isomerase and related proteins
TIGRFAM ID	[TIGR01089] L-fucose isomerase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAAAA GTAGATTAGT AGGAAAGTAT CCTGTAATAG GAATAAGACC AACTATTGAT 
GGAAGAAGAG GAATAATAGA TGTAAGAGGT TCTCTTGAAG AACAAACAAT GAATATGGCA 
AAGTCAGCAG CAAAGCTTTT AGAGGAAAAT TTAAAATATT CAAATGGAGA AAAAGTAAAG 
GTTATAATAG CTGACACTAC AATTGGAAGA GTTCCAGAAG CTGCAGCTTG TGCAGATAAA 
TTTAGAAGAG AAGGTGTAGA TATAACACTT ACAGTTACTC CATGTTGGTG CTATGGTGCA 
GAAACAATGG ATATGGATCC AATGACTATA AAAGGGGTAT GGGGATTTAA TGGAACTGAA 
AGACCAGGAG CTGTTTATTT AGCATCAGTT TTAGCAACTC ATGCTCAAAA GGGACTTCCT 
GCCTTTGGAA TATATGGACA TGATGTTCAA AATGCAGATG ATACTGAAAT ACCAGAAGAC 
GTAAAAGAAA AGATATTAAG ATTTGGAAGA AGTGCAATTG CAGCAGCATC TATGAGGGGA 
AAATCTTATC TTCAAATTGG TTCAATATGT ATGGGAATAG GTGGATCTAT TATAGATCCA 
AACTTTATAG AAGAATATTT AGGTATGAGA GTAGAATCTG TTGATGAAGT AGAAATTATA 
AGAAGAATGA CAGAAGAAAT ATATGATAAA GATGAATTTG AAAGAGCTTT AAAATGGACT 
AAGGAAAAAT GTAAGGAAGG TTTTGATAAA AATCCTGAGA ATGTTCAAAA AACAAGAGAA 
GAAAAGGATA AGGATTGGGA ATTTGTAGTT AAAATGATGT GCATTATAAA GGATTTAATG 
AATGGAAATG AAAATTTACC AGATGGATTT GAAGAAGAAA AATTAGGACA TAATGCAATA 
GCGGCAGGTT TCCAAGGACA AAGACAATGG ACTGATTTTT ATCCAAATTG TGATTTCCCA 
GAAGCACTAC TTAATACTTC ATTTGACTGG AATGGAGCTA GGGAGCCTTA TATATTAGCT 
ACTGAAAATG ATGTTTTAAA TGGATTAGGT ATGCTTTTTG GAAAGCTACT TACAAATAAA 
GCACAAATAT TTGCAGATGT TAGAACTTAT TGGAGTCCTG ATGCCGTTAA GAAAGCTACA 
GGATATGAAT TAGAAGGGGT TGCAAAGGAA TCAGATGGAT TTATACATTT AATAAATTCA 
GGCGCAGCTT GTCTTGATGC ATGTGGACAA GCTAAAGATG AAAATGGAAA TGGAACAATG 
AAGGCTTGGT ATGATGTTAC AGAAGAAGAC CAAGAAGCAA TCCTTGCTGC AACTACATGG 
AATGCTGCCG ATAATGGATA CTTTAGAGGT GGTGGATATT CATCAAGATT CTTAACAGAA 
GCTGAAATGC CAGTAACAAT GATACGTTTA AATCTTGTGA AAGGCCTTGG TCCAGTTGTT 
CAATTAGTTG AAGGATATTC AGTAAAACTT CCAGATGAAG TATCAGATAA ATTATGGAAA 
AGAACAGATT ATACTTGGCC TTGTACTTGG TTTGCACCAA GACTTACAGG AAAAGGAGCA 
TTTAAATCTG CTTATGATGT AATGAATAAT TGGGGTGCTA ACCATGGAGC TATAAGTCAT 
GGACATATAG GGGCAGATAT AATTACTTTA TGTTCTATCT TAAGAATACC TGTAAGTATG 
CATAATGTTC CAGAGGAAAA AATATTTAGA CCAGCAGCTT GGAATGCCTT TGGAATGGAT 
AAAGAGGGAC AAGATTATAG AGCTTGTAAG GCTTATGGAC CAATGTATAA ATAA

Protein sequence

MAKSRLVGKY PVIGIRPTID GRRGIIDVRG SLEEQTMNMA KSAAKLLEEN LKYSNGEKVK 
VIIADTTIGR VPEAAACADK FRREGVDITL TVTPCWCYGA ETMDMDPMTI KGVWGFNGTE 
RPGAVYLASV LATHAQKGLP AFGIYGHDVQ NADDTEIPED VKEKILRFGR SAIAAASMRG 
KSYLQIGSIC MGIGGSIIDP NFIEEYLGMR VESVDEVEII RRMTEEIYDK DEFERALKWT 
KEKCKEGFDK NPENVQKTRE EKDKDWEFVV KMMCIIKDLM NGNENLPDGF EEEKLGHNAI 
AAGFQGQRQW TDFYPNCDFP EALLNTSFDW NGAREPYILA TENDVLNGLG MLFGKLLTNK 
AQIFADVRTY WSPDAVKKAT GYELEGVAKE SDGFIHLINS GAACLDACGQ AKDENGNGTM 
KAWYDVTEED QEAILAATTW NAADNGYFRG GGYSSRFLTE AEMPVTMIRL NLVKGLGPVV 
QLVEGYSVKL PDEVSDKLWK RTDYTWPCTW FAPRLTGKGA FKSAYDVMNN WGANHGAISH 
GHIGADIITL CSILRIPVSM HNVPEEKIFR PAAWNAFGMD KEGQDYRACK AYGPMYK