Gene CPR_1843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1843
Symbol
ID	4206239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2035057
End bp	2037309
Gene Length	2253 bp
Protein Length	750 aa
Translation table	11
GC content	32%
IMG OID	642566393
Product	FucA
Protein accession	YP_699157
Protein GI	110803677
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3669] Alpha-L-fucosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTTA AAGCTATAAA AAGTTTTTTA ATAACTACAA TGGCAATGAC TTTTTTAGTT 
AGTATGGGAC AAGGATCTAT ATTAACTAAG GCAAATACTA TAAATAATAT GGAATATGTA 
ACAGAAGTAT TTGGAGCAAT TCCAACAGAA GAACAGGTTA GCTATCAAAA AGAGGAACTT 
ACAGCATTTA TACACTTTGG TGTGAATACC TTTACGGGAA GGGAGTGGGG AGATGGAACA 
GAAAATCCAG AAATTTTTAA CCCTACTAAT TTAGATGCTG ATCAATGGGT AAAAACTTTG 
GCGGAGGCAG GCTTTGGAAG GGTTATATTA ACTGCAAAAC ATCATGATGG ATTTTGTTTG 
TGGGATAGTG CATATACAAA GCATGATGTA GCTAGTAGTC CTTGGAAAAA TGGAAAGGGA 
GATGTGGTTA AAGAGGTTTT AGAAGCTTGT GCTAAATATA ATATAAAATT CGGAGTTTAT 
TTGTCACCAT GGGACCAAAA TTCAGAACAT TATGGAGACG GCAATGGTGG TGATTATAAT 
GAGTTTTACA TGAATCAGTT AAGGGAATTA TTAACTAACT ATGGACCTAT AGCTGAAGTT 
TGGATGGATG GAGCAAAGGG ATCGAATGTT AAGCAAGAAT ATAACTTTGA AGAATGGTTT 
GCTCTTATAA AAAAATTACA ACCAGAATGT TTAATATTTA GTCCACAGGG GCCAGATATT 
AGATGGATTG GAAATGAAAA AGGATATGCA GGAGAACCTT GCTGGTCAAC TATAGATATT 
GAAAAAATGA AAGAAAGGGA AAATCCAACA TATTTGAATA ATGGAGAAGA AGGTGGACCA 
AATTGGATAG TTGGAGAATC AGATGTATCC ATAAGACCAG GTTGGTTTTA CCATGAATCT 
CAAGATAATG AAGTTAAATC CTTAGAAAAA ATGATGGATA TTTATTTTAA ATCCATAGGG 
AGAAATTCAG TTTTATTATT AAATGTTCCC CCTAATAAGG AAGGAAAGTT ACATGAAAAT 
GATGTTAATA GATTAAAGAA ATTTGGTGAA ACAATTAAAG AGTTATTTAA TGATGATTTA 
GCTTTAAATA AAGAGGTAAT AGTAGATGGT TTTGCTAATA ATGATGAGAC ATATGGTGCA 
AATAAAATTG TAGATGGAGA TTATGATACC TATTGGGCAC CAGATAATAG TAGTAAAACA 
GGTACTATTG AAATAGATTT AGGTGGAAGT AAAGAATTTG ATGTTATTTC TTTGCAAGAG 
TATATACCAT TAGGTCAAAG AGTATCCAGT TTTAATGTAG AAGTATTGCA AGGAGAAAAT 
TGGAATAAGG TTTATGAAGG AAAAACAATA GGATATAAAA GACTTGTTAG AATAGCTCCA 
ACTAAAGGAG AAAAAATAAG AATTAATATA ACGGGTTCAT TAGAAGTACC ACTTATAAAT 
AACGTTGGAG TTTATAAACA ACCTATTAGT ATAGAACTTC CATCAGGGCC ACCAGCTGGG 
TTGAAAGTAT TAAATGATGA TAATAAGGGA AATGAATTAG AACAATTTAA TTTTAGTGAT 
GGATGGATAT ATGAGACTAT CCATGGAGAA GATGATTTAG GTGGAGATGC CCATTATACA 
AGTAAAATTA ATGCTACAGT TAATATTAAA TTCAAGGGAA CTAAGTTTTT CTTATCAGGA 
ACAAAGGATT CAGGACATGG AATAATGGAA ATTTCAATAG ATGGTGAAAA TCCAGTAGAG 
GTTGACTTAT ATTCTCCTAA TAGAAAATCT AAAGAGATAG TTTTTGAAAG TGAAGATTTA 
AGTGATGGAG AGCATGAAGT TACGGTTAAA TGTACTGGAA GAAAGAATTC AAATTCTAGA 
GGGATAGTGG CTCATATAGA TGGAGCTTAT GTATTAGACA ATGGTGGAAA AGGTATGGTT 
GAATTTGAAA AGGTAGGATA CAAAGTAAGT GAAAATATAG GAACTGCTAC TTTTAAGGTT 
ATAAGAAAAG GAGGAAGTAA TGGTAAGCTT GAAGTTAACT ATGATACTTT AGCTGGCACT 
GCTTTAAATG GAGTTGATTA TCAAACATGG TCTGGTACTT TAGCATTTAA TGAAGGAGAA 
ACAGAAAAAA CTTTTGATAT AACAATAATT GATGATAAGG AAAAAGAAGA GCCTAAGGAA 
TTCTATTTAA AATTAAGTGA TCCAATAGGT GGAATATTAG GATTTAATTC AAGAGCTACA 
GTTATTATTA ATGATGATGA GCAAATTAAA TAA

Protein sequence

MKVKAIKSFL ITTMAMTFLV SMGQGSILTK ANTINNMEYV TEVFGAIPTE EQVSYQKEEL 
TAFIHFGVNT FTGREWGDGT ENPEIFNPTN LDADQWVKTL AEAGFGRVIL TAKHHDGFCL 
WDSAYTKHDV ASSPWKNGKG DVVKEVLEAC AKYNIKFGVY LSPWDQNSEH YGDGNGGDYN 
EFYMNQLREL LTNYGPIAEV WMDGAKGSNV KQEYNFEEWF ALIKKLQPEC LIFSPQGPDI 
RWIGNEKGYA GEPCWSTIDI EKMKERENPT YLNNGEEGGP NWIVGESDVS IRPGWFYHES 
QDNEVKSLEK MMDIYFKSIG RNSVLLLNVP PNKEGKLHEN DVNRLKKFGE TIKELFNDDL 
ALNKEVIVDG FANNDETYGA NKIVDGDYDT YWAPDNSSKT GTIEIDLGGS KEFDVISLQE 
YIPLGQRVSS FNVEVLQGEN WNKVYEGKTI GYKRLVRIAP TKGEKIRINI TGSLEVPLIN 
NVGVYKQPIS IELPSGPPAG LKVLNDDNKG NELEQFNFSD GWIYETIHGE DDLGGDAHYT 
SKINATVNIK FKGTKFFLSG TKDSGHGIME ISIDGENPVE VDLYSPNRKS KEIVFESEDL 
SDGEHEVTVK CTGRKNSNSR GIVAHIDGAY VLDNGGKGMV EFEKVGYKVS ENIGTATFKV 
IRKGGSNGKL EVNYDTLAGT ALNGVDYQTW SGTLAFNEGE TEKTFDITII DDKEKEEPKE 
FYLKLSDPIG GILGFNSRAT VIINDDEQIK