Gene Ccel_1501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1501
Symbol
ID	7310267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1824380
End bp	1825924
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	40%
IMG OID	643608425
Product	tail sheath protein
Protein accession	YP_002505833
Protein GI	220928924
COG category	[R] General function prediction only
COG ID	[COG3497] Phage tail sheath protein FI
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAAATT ATTTATCACC AGGAGTTTAT GTAGAAGAAG TTTCCAGCGG AGTCAAGCCT 
ATAGAAGGTG TAGGTACAGC GGTGGGTGCT TTTATCGGAA TTGCTGAGAA GGGTGTCATT 
GGTAAAGCTG TTCTGGTTAC CAATTGGAGC CAGTATGTCA GCGAATTTGG AGGATTTATT 
CCAAATGCAT ACCTTGCTTA TGCCGTGTAC AATTTCTTTG CGGAAGGAGG AACATCCTGC 
TATGTTGTAA GAGCTGCATC AGAAGATGCG AAGAAGTCTC TTTACATTGT AAAGGATAGT 
CAAGGAGAAA ACTTATTCGA AATAAGTGCC CGTTCAGAAG GAAACTGGGG TAACAGAATT 
TCCTTTCAAA TAAGCAGTTC AACAAACGGA CAGATGAACG GTTTCAAACT CAATATCAAG 
TATACCGAGA AGAGTTCATT CAGCGATGAG TATGTTGGAG AGGATGTTGA AGGGGAACTT 
GTTGAGACCT TCGACAATCT GCTTATAGTT AACTTTGAAG AGAAAATAAA CGATTTATCA 
TCGTTTATAA GTGTCAGGCC GTTAGTAGAT CTTAAAAAAG TTGATAACAT GGACAAGGTT 
CCAATGTTCA CTGAAGAGGA TGAATTTATA GAATTGGCAA ATGGCGTTGA TGGAATATCA 
TACGTAGAGT ATATTGACAG CGAAGAAAAG AAATTGGGAA TCAACGCATT TACACCAATA 
GACGAAATTA ATATAATTGC TGCACCTGAC GTTTCCAACA TGGTATCAAA CAGAAATATT 
ATTCTCGAAA TTCTTAACTA TTGTAAGACC AGAAAAGATT GCTTCTACGT TATAGATCCT 
CCGCATGGCC TGACCCCACA ACAAGTAAAG GACTTCAAAG AGGGTGCGGG AGAGTTTACA 
GGCAACTCAT TTAATTCATC TTATGGTGCA TTGTATTACC CATGGGTGTT TATCAATGAC 
CCCCTGACAG GAAAGAAAAA ACTTATCCCA CCTTCAGGTT CAGTTGTAGG TACATATGCA 
TATGTTGATT CAGCAAGAGG AGTACACAAA GCTCCTGCCG GAACTACTGA CGGATATCTT 
GATACTGTAG TAGGAGTTGA AAAGATAGTA ACAAAAGGAG AACAGGAGCT TCTCAATCCA 
ATAGGTGTAA ATGTAATCCG TTCTTTACCA GAGGGAATTT GTATCTGGGG TGCCAGAACT 
CTTTCATCTG ATTCAGAATG GCGCTATATA AATATCAGAC GTCTGATGAT GTATATTGAA 
GAATCAGTTG ACAAGGCAAG CCAATGGGTA GTTTTTGAAC CCAATGAGCC AACTCTCTGG 
GGGAAGGTAA AGAGAAACAT ATCAGCTTTC CTGACAAGAG TTTGGAGAGA TGGCGCTCTT 
TACGGTTCAA CCCAGGAAGA AGCATTCTTT GTAAAGGTGG ACGAGGAAAA CAACCCTCCG 
GCATCAAGAG ATGCAGGCCA ATTGGTAATA GAAGTCGGTG TAGCTCCAGT TAAACCGGCA 
GAATTTGTAA TAATCAAGGT CAGCCAAAAG ACACTGTCTA AATAA

Protein sequence

MPNYLSPGVY VEEVSSGVKP IEGVGTAVGA FIGIAEKGVI GKAVLVTNWS QYVSEFGGFI 
PNAYLAYAVY NFFAEGGTSC YVVRAASEDA KKSLYIVKDS QGENLFEISA RSEGNWGNRI 
SFQISSSTNG QMNGFKLNIK YTEKSSFSDE YVGEDVEGEL VETFDNLLIV NFEEKINDLS 
SFISVRPLVD LKKVDNMDKV PMFTEEDEFI ELANGVDGIS YVEYIDSEEK KLGINAFTPI 
DEINIIAAPD VSNMVSNRNI ILEILNYCKT RKDCFYVIDP PHGLTPQQVK DFKEGAGEFT 
GNSFNSSYGA LYYPWVFIND PLTGKKKLIP PSGSVVGTYA YVDSARGVHK APAGTTDGYL 
DTVVGVEKIV TKGEQELLNP IGVNVIRSLP EGICIWGART LSSDSEWRYI NIRRLMMYIE 
ESVDKASQWV VFEPNEPTLW GKVKRNISAF LTRVWRDGAL YGSTQEEAFF VKVDEENNPP 
ASRDAGQLVI EVGVAPVKPA EFVIIKVSQK TLSK