Gene Ccel_3349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_3349
Symbol
ID	7311916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	3890856
End bp	3891962
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	41%
IMG OID	643610252
Product	hypothetical protein
Protein accession	YP_002507618
Protein GI	220930709
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAACCG TTGTAGTGGA TATCCCGAGC ACGACATTTG TATCTTCTGC ACAGCCGGGT 
ATGAATTTTT CTGTGTATCC AACCATCTAT GCAGGTACCG ATGGACAGTA TCAAAATTGT 
ATAAGTTTAA TGCAAATAGT ATTACCATCA TTACCCGTTA ATTTTGTTGA CAGTGCTGTT 
CTTCAGCTGG CTGTTATAGC AAAAAGCGGA ACTAATCCCA GCCCTGTTTT AGTAAATACA 
GTAATGGAAC CATATAACAG AACTAGTGTG ACCTATGATA CACGGCCGGC TTATACGCCA 
ACTTCTTCAC AGATTAATGT AACTACAGCA GATCTTTACA AAACAGTTGA AATTGACATA 
ACATCTCTGG TGAACAGCTG GCTTAACGGA ACCGTTGCAA ACAACGGCTT AGCCTTAACC 
AATTCTGATG GAAATACAGT TGTACAATTT GGTACAGATA ATATCTCATG GGAGCCGTAT 
TTTCCGAAGC TACTTCTTAC ATACTCAGGA ACACACGGAG GAAATTCAGC AACCTGCTTC 
TGCTATTCCC AGTTGGCACA CGTTATTCAG CAGATTATAA TGTTTTATCC GGCAAGCACC 
ATAACTGTTT TTACAAAAGG CTTAACTGCT TCATCTATAA CCGGTACGCC ACACCAGCTG 
TTTTCTTCTT CGGTTAGTTC AAATGGAGCT TTATTTATTG TCATGGACAG CGGGCAGCAG 
CAGGTAATCC CGGTTAACTC AATAACAGCA ATATATACAG GCGATGGTAC GGTATACAAT 
CCCTCTTTCG ATTATCTGCC GGCGCCGACT TTCCCTGTGG GCTGTGATAC TGATCTCGTA 
ACGGCATACT ACGAATACTT AAACGATAAG ACTGATATTG ACATATATAC GGGCTCAAAC 
ATACATGCTA CAGGGACAAT ATATAAGAAT GAATGTGGAA TCATAGTATT ATCGGATGGT 
AGCGGAAATA CACCTGTATT TATCCCTGTT CTGCCTATAA CTGCTTTAAT TCCTTCAACT 
AGCCCGTCCT TAGCCAAGGT GAACAGCGAT AAAAGTCAGG TATCTATTAT TGTAGAAACC 
TCTGCACAGC AAGTAAAACC AAAATAA

Protein sequence

MSTVVVDIPS TTFVSSAQPG MNFSVYPTIY AGTDGQYQNC ISLMQIVLPS LPVNFVDSAV 
LQLAVIAKSG TNPSPVLVNT VMEPYNRTSV TYDTRPAYTP TSSQINVTTA DLYKTVEIDI 
TSLVNSWLNG TVANNGLALT NSDGNTVVQF GTDNISWEPY FPKLLLTYSG THGGNSATCF 
CYSQLAHVIQ QIIMFYPAST ITVFTKGLTA SSITGTPHQL FSSSVSSNGA LFIVMDSGQQ 
QVIPVNSITA IYTGDGTVYN PSFDYLPAPT FPVGCDTDLV TAYYEYLNDK TDIDIYTGSN 
IHATGTIYKN ECGIIVLSDG SGNTPVFIPV LPITALIPST SPSLAKVNSD KSQVSIIVET 
SAQQVKPK