Gene CPF_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1049
Symbol	fucK
ID	4202012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1197356
End bp	1198858
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	30%
IMG OID	638081930
Product	L-fuculokinase
Protein accession	YP_695495
Protein GI	110800345
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGATA TAAATTTAAA AAGTAAAGTA TTAGCTTTTG ATTTTGGTGG ATCAAGTGGT 
AGAGCCATTC TTGGGAGTTT TGATGGAGAA AAAATTAATA TAAAAGAAAT TCATAGGTTT 
TCTAATGATC CTGTATTTAT AAATGGAACC ATGTATTGGG ATGTTTTAAG ATTGTTTTTT 
GAAATAAAGC AAAGTCTTAT AAAAGCAAAA CAATTTGGTG AAATAGATAG TATTGGAATA 
GATACCTGGG GAGTTGATTT TGCCCTTTTA GATAAGGATG GACAGTTAAT TGAAAATCCA 
GTTCATTATA GGGATGAAAG AACTCTTGGA ATGGTAGAAA AGAGTTTTGA AAAAATATCA 
AAGAATGAAT TTTATAGTAT AACCGGTAAT CAATTTATGG AAATAAATAC TGTATTTCAA 
CTATTAGCAT TAAAAGAAAA GAGATCACAT CTGCTTGAAA GAGCAGATGT GATGCTCCTA 
ATGCCAGATT TATTTAATTA TTTACTAACA GGAAAAATGG TTACCGAAAA TTCTATAGCA 
TCAACAACAC AGCTATTTGA CGCCAAAGAG AGAACTTGGT CAGATAGAGT AATAAATGCT 
TTAGGTCTTC CAAGAAAGAT ATTTACTAAA ATAGTTCCAA GTGGAACAAT AATAGGAGAT 
ATATCAGAAA AAATATGTGA TGAACTTAAA ATAGAAAAGT GTAAAGTGAT TGCAGTTGCA 
GGACATGATA CTCAAAGTGC ATTAGTATCT GTTCCAACTA CAGAAAAAGA TTTTGTATTT 
TTAAGTTGTG GAACATGGTC TTTACTTGGG ACAGAGATTG ATGAACCAAT TATTAACGAA 
AAATCAAGTA AGTATAATAT TACAAATGAA GGTGGATATG AAAATAAAGC ATCATTCCTT 
AAAAATATTA TTGGGTTATG GTTAATTCAA GAAAGTAAAA GGCAATGGGA AAGAGAAGGA 
AAAGAGTATG ATTTTTCAAC TTTAGAAGAA TTGGCAAGAG AGGCGAAGCC TTTTAAATGC 
TTTATAGATC CAGATGATCC TATATTTGTA CAAGCTGGAG ATATTCCTAG TAGAATAAGA 
GAGTATTGTT TAAAAACTAA TCAAGAAGTG CCAGAAAATT GTGGAGAAAT TGTTAGATGT 
ATAAATGAAA GCTTAGCTAT GAAGTATAGA TATTCTTTAG AAGAAATAAA GGATTGTACT 
AATAAAAATT ATGATGTTAT CTACATGGTT GGTGGAGGAA CTCAAAGTAA ATTATTATGC 
CAGATGACTG CAAACGCATG TAATATTAAA GTTTCAGCAG GACCTATTGA AGCTACAGTT 
TATGGGAATA TAGCAATACA GCTTATGGCA ACAAATAAAA TAGAGAATTT ATATAAAGCA 
CGTGAAATCA TAAGGAACTC TAATGATATG AGTTATTATG AGCCTCAAAA TTATGAATTA 
TGGGATAAGG AATATGAAAG ATTTAAAAAT GTAATTAAAT CTAAGGAGGT AATTAAATGT 
TAA

Protein sequence

MKDINLKSKV LAFDFGGSSG RAILGSFDGE KINIKEIHRF SNDPVFINGT MYWDVLRLFF 
EIKQSLIKAK QFGEIDSIGI DTWGVDFALL DKDGQLIENP VHYRDERTLG MVEKSFEKIS 
KNEFYSITGN QFMEINTVFQ LLALKEKRSH LLERADVMLL MPDLFNYLLT GKMVTENSIA 
STTQLFDAKE RTWSDRVINA LGLPRKIFTK IVPSGTIIGD ISEKICDELK IEKCKVIAVA 
GHDTQSALVS VPTTEKDFVF LSCGTWSLLG TEIDEPIINE KSSKYNITNE GGYENKASFL 
KNIIGLWLIQ ESKRQWEREG KEYDFSTLEE LAREAKPFKC FIDPDDPIFV QAGDIPSRIR 
EYCLKTNQEV PENCGEIVRC INESLAMKYR YSLEEIKDCT NKNYDVIYMV GGGTQSKLLC 
QMTANACNIK VSAGPIEATV YGNIAIQLMA TNKIENLYKA REIIRNSNDM SYYEPQNYEL 
WDKEYERFKN VIKSKEVIKC