Gene Ccel_1087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1087
Symbol
ID	7309902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1340592
End bp	1341767
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	35%
IMG OID	643608011
Product	protein of unknown function DUF43
Protein accession	YP_002505426
Protein GI	220928517
COG category	[R] General function prediction only
COG ID	[COG1568] Predicted methyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGATG TGCAGGATAT TGTTTTTAAA GTATATGAAA ATGTACACTT GGAAGAAGGA 
ATAGTAGTCC TCAAGAATTT CCTTGTAAAT GCGTATATGT ACAGGGGTAC TTCCGTAAAG 
GAAATGTCCC GTATGTTGAA TTTACCAGTT CCTGTTGTGT CTGCGATTAA AAATGAATTT 
AAAAAGAATG GGATTGTAGA TTTAAGCAAC GGCATAGGTT TGACAAAGAA TGGAGAAATC 
TATGTGAAGG ATGTACTGGG GTATAAAAAT GCCGATACGG ATGTTCTGAA GGATATTTTG 
GAAAATACTG GTATTGACCT TTCAAGGTTT GAAAAAGAGA TTGAAGAGTT GGGAGCGATT 
TACCAAAACA GGCCTGAAGT CGATGTTGAG GTGGACCAAT CCAAGTGTAC AGCGGAAACA 
GGGATGAAAA GGGCTGTACT CATGCTTAAA TCAGGCTGCC TGATAGGCAA AAAAATTGCT 
TGTATTGGAG ACGATGATTT AACAAGTATA GCTATTGTTT TATTGTTAAA GCATATAGCA 
GTAAGTGACA ACTTAAGCGG TATGGCGGAT ATTACTGTTT TTGATATAGA TAAACGGATA 
TTGTCTTATA TAAAAAAAGT TTCCGAAGAA TATAAGATAG ACATAGAATG TATACAGCAT 
GATTTATGCA ATCCCATTGA TAATCAGTAC AAAAATAAGT TTGATTGCAT TACTACTGAT 
CCACCGTATA CATTAAACGG ACTGAACCTA TTTTTAAGCA GAGGTATTTC GGTTCTAAAA 
AAAGAATCAA ATCTAAGTGT GTTTTTGTCC TTTGCACATA AAACTCCTCA GATTAGGTTT 
TTAATGCAGC AGTTATTTGT GAACGAAGGT TTGATTTTGT CAAATATATA TCCCAAATTT 
AATGTTTACG AAGGAGCACA AATACTTGGC GGTGTGAGCG ACCTTATGAT TCTTACCACT 
ACTGCCCAGT ATACAAAAGA ATTAATTTCC GGCATATTCA GCGATGAAAT ATATACCGGG 
AAGTTTAAAC AGACAATCAG AACATATGAG TGTAAGCAAT GCAGTGAGAA ATATTTGGTT 
GGAATGAATC AGAAAATTAC AACGATTGAA CAGCTTAAAT CACAGGGATG TTTAAAATGC 
CCTGCAAATA AGTTTAATTT AATAAGAAAA GGATAG

Protein sequence

MQDVQDIVFK VYENVHLEEG IVVLKNFLVN AYMYRGTSVK EMSRMLNLPV PVVSAIKNEF 
KKNGIVDLSN GIGLTKNGEI YVKDVLGYKN ADTDVLKDIL ENTGIDLSRF EKEIEELGAI 
YQNRPEVDVE VDQSKCTAET GMKRAVLMLK SGCLIGKKIA CIGDDDLTSI AIVLLLKHIA 
VSDNLSGMAD ITVFDIDKRI LSYIKKVSEE YKIDIECIQH DLCNPIDNQY KNKFDCITTD 
PPYTLNGLNL FLSRGISVLK KESNLSVFLS FAHKTPQIRF LMQQLFVNEG LILSNIYPKF 
NVYEGAQILG GVSDLMILTT TAQYTKELIS GIFSDEIYTG KFKQTIRTYE CKQCSEKYLV 
GMNQKITTIE QLKSQGCLKC PANKFNLIRK G