Gene Ccel_1221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1221
Symbol
ID	7310018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	1494391
End bp	1495899
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	39%
IMG OID	643608142
Product	alpha-L-arabinofuranosidase domain protein
Protein accession	YP_002505557
Protein GI	220928648
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3534] Alpha-L-arabinofuranosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAACG CAAAAATGAT ACTTAACAAA GACTACGTTG TAGCACCTGT AGACAAAAGA 
ATTTACGGCT CATTTATTGA GCATTTGGGA AGAGCTGTAT ATGGGGGTAT ATATGAACCG 
GGGCACCCTT CAGCAGACAA ATTTGGCTTC CGTCAGGATG TATCAGAAAT GATAAGGGAA 
TTACAAGTCC CTATAGTAAG ATATCCCGGT GGAAATTTCG TTTCAGGCTA CAATTGGGAG 
GATGGAGTAG GTCCTGTAGA TAAAAGACCC CGACGAACGG AATTAGCTTG GGCTACAGTT 
GAAACAAACG AAATTGGAAC CAATGAGTTT GTAACATGGG CTAAAGAAGT AGGGACAGAA 
GTTATGATGG CGGTTAATCT GGGAACAAGA GGGGTTGATG CGGCCAGAAA TCTCATTGAA 
TACTGCAATC TTACTCAAGG AACATACTGG AGTGACTTGA GAAAATCTCA TGGCTACAGT 
CAGCCTCACA ACATAAAGAC CTGGTGTCTT GGAAATGAAA TGGACGGACC TTGGCAGATA 
GGAACAAAAA CTGCCGAGGA ATACGGAAGG CTTGCTTGTG AAACTGCAAA GGTTATGAAA 
ATGGTAGATC CCACAATCGA ACTGGTAGCC TGCGGAAGCT CAGGAAGCGG TATGCCTACC 
TTTGCCCAAT GGGAAGCTAC AGTCCTTGAG CATACTTATG AACATGTTGA TTATATTTCA 
CTTCATACGT ATTATGGTAA CCAAGATAAT GATACTGCTA ACTACCTGGC AAAAACTATG 
GATATGGATG CCTTTATCAA ATCCGTTGTT GCAACCTGTG ATTATGTAAA AGCAAAAAAA 
CGCAGTAAGA AAAAAATAAA CCTCTCCTTT GACGAATGGA ATGTATGGTT CCACTCCAAT 
GAAGCGGATA AAAAAATTGA CAGATGGTCT ATTGCACCAC CTCAACTTGA AGATATTTAC 
AATTTTGAGG ATGCACTTTT GGTTGGAGGT ATGCTGATAA CTCTGTTAAA GAATGCCGAC 
AGAGTAAAGA TGGCTTGTCT TGCACAGCTT GTAAATGTTA TTGCACCAAT AATGACAGAG 
AACGGTGGAA GTGCGTGGAA GCAGACAATT TACTATCCAT ACCTCCATAC TTCAGTGTTT 
GGAAGAGGTA CTGTTTTAAA TACCATTATG AAAGCACCAA AGTTTGATAC TAAAGATTTT 
ACAGACGTTT CAGCTATTGA TGCTACAGCA GTAATTAATG ACAACAACGA TGAAATTACC 
GTTTTTGCAG TAAACAGACA TATGGAAAAC AATATTAGTC TGGATGTTGA ACTAAATGGC 
TTCGGACAAT TTGAAGTTAT TGAACATATT GTTCTTGAAC ATAATGATGT AAAAGCTACT 
AATACAAAAG AAAATCCAAA TAACGTTGTA CCAAACAACA ATGGAAATGC TACCTTGGAA 
GATGGAAGTA TCAAAGCTTC CTTAAAGAAT CTTTCCTGGA ATGTTATAAG ATTGAAGAAA 
GTAAAATAG

Protein sequence

MDNAKMILNK DYVVAPVDKR IYGSFIEHLG RAVYGGIYEP GHPSADKFGF RQDVSEMIRE 
LQVPIVRYPG GNFVSGYNWE DGVGPVDKRP RRTELAWATV ETNEIGTNEF VTWAKEVGTE 
VMMAVNLGTR GVDAARNLIE YCNLTQGTYW SDLRKSHGYS QPHNIKTWCL GNEMDGPWQI 
GTKTAEEYGR LACETAKVMK MVDPTIELVA CGSSGSGMPT FAQWEATVLE HTYEHVDYIS 
LHTYYGNQDN DTANYLAKTM DMDAFIKSVV ATCDYVKAKK RSKKKINLSF DEWNVWFHSN 
EADKKIDRWS IAPPQLEDIY NFEDALLVGG MLITLLKNAD RVKMACLAQL VNVIAPIMTE 
NGGSAWKQTI YYPYLHTSVF GRGTVLNTIM KAPKFDTKDF TDVSAIDATA VINDNNDEIT 
VFAVNRHMEN NISLDVELNG FGQFEVIEHI VLEHNDVKAT NTKENPNNVV PNNNGNATLE 
DGSIKASLKN LSWNVIRLKK VK