Gene Ccel_2443 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2443
Symbol
ID	7311114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2947209
End bp	2948582
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	35%
IMG OID	643609373
Product	major facilitator superfamily MFS_1
Protein accession	YP_002506752
Protein GI	220929843
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000052902
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAACAT GTTTGGGCAA GTTAGATTTT CTTAAAAAAA CCGAGGTGTA CATAGCAGTG 
AATTTATTGA CGAAGTTCAA GGAAATATAT TTTAATAAAG AAAGTCTTTC AGAAGAAGAT 
ATGAGGGTGT CAAGGAATTT ATCTATTTTT GAGGGCTGTA CCGCCAGAAG TATTCTTACC 
CTAACCAGCG GAGCTTTTTT AGTCGGATTC GCCAAGTATC TTGGTGCTAG CGATGAAAAA 
GCTGGAATTA TAGCTGCAAT TCCTGTATTA GCAGGAATAG TAACGGTTTT TTCCCCTATA 
GTAATTGAGA AGCTGGAGAG CAGGAAATTA CTGACCTGTA TGCTATGCTT TATTGGAAGA 
TTAATGATGG GGCTTATGAT ACTTATACCT TTCATAAGTC CATACAAAAC AGTAAGGGTT 
CAATTGTTGA TATGGGTATT CTTCATTGCA AACTTAATCC TGGCTTTTAC AACTCCTTAT 
GCACAGACGT GGTTGCTGAA TATAACCCCG AAAAGAATAA GAGGTGATTA TTATGGAAAA 
CGGGAGTCAA TAGTTCTGGG TACCGTTACT GTTGTTACCC TTATTATGGG ACAGGTTCTC 
GATAAATTTG AACGAATGGG ACAACAATTT ACCGGGTTTA TTGTATTATA TGCTTTTGTT 
ATTGTTACCG CCATTATAAA CACTGTTTTG TTTTCAAAAA TTAAAGAACC CGTTAATCCT 
GTTTTAAAAC CAGGGGTTTC ATTTAAAAAT TTATTTTCGC TACCTGTTAA AAACAAGAAT 
TTCATGAAAA TAACTTTCAT AACTCTATTT TGGAATTTAG GTTATCAGAT AGCTTTCCCA 
TTTACTTCGG TTTATATGGT ATCAATCCTT CATTTGAGAT ATGGACTTGT TACGGTAATG 
GCTGTTCTGG CATCAATCAC AAGTGTAGTA TCCGTTAGGT TCTGGGGAAA AATTGCAGAT 
AAAAAATCGT GGCTGTATAT TATGAAGCTT ATGATTGTTC TACAGATTTT AAGCTTTCTT 
ACATGGTTTT TTATAAATCC AGATACGGTA TACATTTTAA TGCCTGTAGC TCATATACTT 
GGTGGAGCTG CAATTTCAGG AGTAAATATC TCTGTGAATA ATTTGCAGTA CAGTTATTCA 
CCTGCCGATA ATAAAACGGT ATACATGGGT TTTTCGTCGG CGGTAAATGG TATAATTGGA 
TTTCTAGGAA CTCTAGCAGG TTCACTCTTC ATTAAGGTTA TGGATACCAG AGGAGTTTCT 
CTTGGAGGGT TTTCAATCGG TAATATGCAG ATGCTCTTTT TAGCAGCGGT GATTGTTTTA 
ATAGTAAGTA TGTTTGGCAT ATCCAAATTC AAATTTAGCA ATTCTAATAT TTAA

Protein sequence

MSTCLGKLDF LKKTEVYIAV NLLTKFKEIY FNKESLSEED MRVSRNLSIF EGCTARSILT 
LTSGAFLVGF AKYLGASDEK AGIIAAIPVL AGIVTVFSPI VIEKLESRKL LTCMLCFIGR 
LMMGLMILIP FISPYKTVRV QLLIWVFFIA NLILAFTTPY AQTWLLNITP KRIRGDYYGK 
RESIVLGTVT VVTLIMGQVL DKFERMGQQF TGFIVLYAFV IVTAIINTVL FSKIKEPVNP 
VLKPGVSFKN LFSLPVKNKN FMKITFITLF WNLGYQIAFP FTSVYMVSIL HLRYGLVTVM 
AVLASITSVV SVRFWGKIAD KKSWLYIMKL MIVLQILSFL TWFFINPDTV YILMPVAHIL 
GGAAISGVNI SVNNLQYSYS PADNKTVYMG FSSAVNGIIG FLGTLAGSLF IKVMDTRGVS 
LGGFSIGNMQ MLFLAAVIVL IVSMFGISKF KFSNSNI