Gene Ccel_1255 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1255
Symbol
ID	7312205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1556319
End bp	1557797
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	41%
IMG OID	643608176
Product	alpha-L-arabinofuranosidase domain protein
Protein accession	YP_002505591
Protein GI	220928682
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3534] Alpha-L-arabinofuranosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.596115
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAAAAA TGATTTTAAA TGCAGATATA AAAAAAGGAA AGATAAATAA AAACATATAC 
GGGCATTTTT CGGAGCATCT GGGTAGATGT ATATATGAGG GGTTGTGGGT TGGCGAAGAC 
TCAGAAATAC CTAATATAAA CGGATTTCGC ACAGACGTTG TCGAAGCCCT CAAAAAGATG 
AAGATACCTG TGTTAAGATG GCCGGGCGGA TGCTTTGCAG ATGAATATCA CTGGGTAGAC 
GGAATAGGAC CTAAAGAAAA CAGACCTTGC ATGGTTAACA CCCATTGGGG CGGAGTCGTA 
GAAAATAACC ATTTTGGAAC TCATGAATTT CTGGAACTTT GCGAAATGCT TGGTGCAGAA 
CCATATATAT GCGGTAATGT TGGAAGCGGC ACAGTACATG AAATGCAGCA GTGGGTTGAA 
TACATGACCT TTGACGGAAA ATCTCCAATG GCTGATTTAA GAAGGGCAAA CGGCAAGGAG 
GAACCATGGA GGGTTAAGTA TTTCGGCGTT GGTAACGAAA ACTGGGGCTG CGGCGGAAAC 
ATGACTGCTG AGTTCTACGC AGATCAATAT AAAAGGTATG CAACATATGT AAGAAACTTC 
GGCGATAACA AGATATACAA AATAGCCGGA GGTGCTTCGG TAGATGACTA TCACTGGACC 
GAGGTGCTTA TGAGAGAAGC AGGAAAGCAA ATGGACGGTC TCAGTGTCCA TTATTATACA 
AGAATCTCAA AGGACTGGTC TGAGCAGGGG TCTGCAACTG AATTTGATGA AAATCATTGG 
TTTTCTGTAA TGCAGAATGC TTTGTTTACG GAAGAGTTGG TGGTACGTCA TTCAAACATT 
ATGGATAAGT ATGATCCTGA GAAAAAAGTA GGTATGATTG TTGATGAATG GGGTACATGG 
TTTGCTGTTG AACCCGGAAC AAATCCGGGA TTCCTGTACC AGCAAAATAC AATGAGGGAT 
GCCCTTGTTG CAGGAATCCA CCTGAATATC TTCAATAACC ACTGCGACAG GGTTCAGATG 
GCAAACATAG CACAAATGGT AAATGTCCTT CAGGCAGTAA TTCTAACTGA GGGTAAAAAG 
ATGCTTCTAA CGCCCACCTA CCATGTATTT GATATGTACA AGGTACATCA GGGTGCGGAG 
TTGCTTTCTC TTGACTTTGA AAGTCCGGAG TATGCCTATA ACGGTGAAAA GGTACCTCAG 
CTGAGTGCTT CTTCTTCTGT TGACAGCGAA GGAAAAATTC ATGTAACCAT TTGCAACCTT 
AACCCATCAG CAGATGTTAA TATTGATATT GACCTGCGAG GAGTAAAGTC TAAGAGTAGC 
ACAGGTAAAA TAATTACCTC CAATGCCATG AATGCAAAAA ACACATTTGA AGAAACAACT 
AATGTAACTA TAAAGAATTT TGAAGATATC AACCTTGAAA ATAACCATAT ATCAGGAAAA 
ATACCTTCTA AATCAGTTGT ATTGCTTGAA ATTGTATAA

Protein sequence

MVKMILNADI KKGKINKNIY GHFSEHLGRC IYEGLWVGED SEIPNINGFR TDVVEALKKM 
KIPVLRWPGG CFADEYHWVD GIGPKENRPC MVNTHWGGVV ENNHFGTHEF LELCEMLGAE 
PYICGNVGSG TVHEMQQWVE YMTFDGKSPM ADLRRANGKE EPWRVKYFGV GNENWGCGGN 
MTAEFYADQY KRYATYVRNF GDNKIYKIAG GASVDDYHWT EVLMREAGKQ MDGLSVHYYT 
RISKDWSEQG SATEFDENHW FSVMQNALFT EELVVRHSNI MDKYDPEKKV GMIVDEWGTW 
FAVEPGTNPG FLYQQNTMRD ALVAGIHLNI FNNHCDRVQM ANIAQMVNVL QAVILTEGKK 
MLLTPTYHVF DMYKVHQGAE LLSLDFESPE YAYNGEKVPQ LSASSSVDSE GKIHVTICNL 
NPSADVNIDI DLRGVKSKSS TGKIITSNAM NAKNTFEETT NVTIKNFEDI NLENNHISGK 
IPSKSVVLLE IV