Gene Ccel_1960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1960
Symbol
ID	7310675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	2319623
End bp	2321836
Gene Length	2214 bp
Protein Length	737 aa
Translation table	11
GC content	39%
IMG OID	643608894
Product	YhgE/Pip C-terminal domain protein
Protein accession	YP_002506288
Protein GI	220929379
COG category	[S] Function unknown
COG ID	[COG1511] Predicted membrane protein
TIGRFAM ID	[TIGR03057] X-X-X-Leu-X-X-Gly heptad repeats [TIGR03061] YhgE/Pip N-terminal domain [TIGR03062] YhgE/Pip C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.779213
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAACAT TGAAAAAGTA TAAGAAATTT GCCGTAATCG TGGCAGTTAT ACTAATTCCA 
TTGGTCTACA GTTTCTTCTA TCTTGATGCT TTTTGGGATC CATACAGCAA ACTTGACAAA 
CTTCCTGTAG CCGTGGTAAA CCAGGATAAC GGAGCAACTA TCGACGGCGA AAACAGAAAT 
CTGGGAAAAG AAATTACAGA CAATCTAAAA ACCGATAAAA ATCTTAAATG GGTTATTACG 
TCGGAATCTG ATGCAAAGGA CGGTTTAGAG AACAGAAGGT ATTACGCAAT GATTAGTATA 
CCTGGAGATT TCTCAAAAAA TATTTCTTCA GCAGCAGACA TTGACAAGAC TCAGGGTAAT 
CTGATATATA CCGTTAATGA AAAGGGAAAT TACCTGGCAA GTCAGGTGCT GAGCAGGGTC 
ACATTAGAGT TTAAGGATAA AATTTCCAAA TCTGTTTCTG AAGAAATTGT AGGAACCCTT 
TTAGATCAGA TAAAGGACCT TCCTACTAGT CTAAAAGAAC TTGATGATGG CTTAAAGGAA 
ATAAAAGACG GAGCAGAACT ACTCTATGAC AGCAATGGTA AAATTGTAGA CGGACAGAAG 
AATTTTAATG ACGGTGTTAA TAAGCTGAAC AACGGACTTG CAGATGCCAA TAATGGTTCA 
AAGACTCTTA TACAAGGTTC AAAACAGCTT AGCGACGGTG CAGAACTATT CTACAGAAAT 
TTATCAGGCG GCTCAGGTAA AATGACAGCT CTGGTTAACG GTTCAAATAC TTTTATGTCA 
GGTCTGTCAA ATCTGAATTC GGGTTTAAAC CAGTTGAATT CCAGCATTAC AGAAGCAGCT 
CCGCAAATAT CTCAGTTGTC TAAAGGAACC TTGGACTTAA ACAGCGGAGT ACAGTCCTAT 
ACATCAGGTG TTGACAAGTA TATTGAATCG GTAAACAAGG TTTCTCAGAC TCAATCTGCT 
TTGGCAAACT CTATTCAAAA ATACGTGGCA AGTCATCCTG AAGCATTGAC AGACCCAAAT 
TTCAAGGCTG TAATCGCTAC TCTGGAGGCC TCAAAGTCTG TTCCTGAACA GCTTAAAACC 
GCCGGAGGGC AGCTTTCTTC CGCCGGAAAA CTACTTACTG ACGGTTCAGG CAAGGTTGCA 
GGTGGAGTCT CACAGTTGAC TACCCAGTTG AGTTCAGCAG CACAAGGTAT AAATAAACTT 
GCTGCAGGAT CAAATGAATT GAACAAATCA TACCCCATGA TTAACCAAGG TATCCTTGAT 
ACTGCCTCCA GCATCAAAAC TGCATCCGAT AAATCCAAGG AACTTTCTTC AGGGGCTTCA 
TCGGTTAATG ACGGAGTTGC AAAACTTTCA AGCGGTATTT CAGAACTGGC AGCCGGCAGC 
GAGGAATTAT CCAAGAATTC TGGAGTGTTA CTTGACGGTG AAACAAAGAT TCAGGACAGT 
TTAGGCAAAC TTAAGGATGG GGTAACAGAA GCAAGCAGCG GTGTGTCCTC TTCCCTTCTA 
AAGGCTGATG GTAAATTAAA CGGTACAGAA GGCCTAAAGG AATATGCAGC AGATCCTGTT 
AAAATAACAG AAAAGAAGGT TTACGGTATT CCTGACTATG GTACTGCGTT TACACCTTAT 
TTTGTATCAC TATCACTTTG GGTTGGTGCA TTGCTGATGT TCTTTGCAAT TTATCTGGAT 
GAGGAAGTAA GGTTTCGCAA ATTCTCCTCC AAGTCTAAAG GTATTATGAG ATTTTTTGCA 
TATACTTTAA TAGGTATTGC CCAGGCTCTT GTATTAGACT TTGTCATAGT AAAAGGTTTA 
CATTTGGAAG TTGCAAATAT GGGGCTTTTT GTGCTGACTA GTATAATAAT ATCATTGTCA 
TTTACATCAA TTATGAGATT TTTACTAGTA CAGTTAAGAG ATGTAGGCAA GTTCCTTGCA 
ATTCTGCTAT TGATATTACA GCTTACTTCA TGTGGAGGAA CCTTCCCTAT GGAACTTGTT 
CCACGATTCT TCAATGTACT TAATCCGTTT ATGCCAATGA CATATTCGGT TAATGCGTTA 
AGAGAAGTAA TTGCAGGTAT CAATAATGGA TTCCTTGCAC AGAACCTTAT TGTTTTAGTT 
ACCGTAATGA TAGGATTTCT TATATTGAAC CTTGTAGTAT CAAAGCTTAG ATTTGGAAGC 
ATTTCTTCTG ATTCTGATGA TTTTGTTAAA ATATCCGAAG AAGTTTCAGC ATAA

Protein sequence

MQTLKKYKKF AVIVAVILIP LVYSFFYLDA FWDPYSKLDK LPVAVVNQDN GATIDGENRN 
LGKEITDNLK TDKNLKWVIT SESDAKDGLE NRRYYAMISI PGDFSKNISS AADIDKTQGN 
LIYTVNEKGN YLASQVLSRV TLEFKDKISK SVSEEIVGTL LDQIKDLPTS LKELDDGLKE 
IKDGAELLYD SNGKIVDGQK NFNDGVNKLN NGLADANNGS KTLIQGSKQL SDGAELFYRN 
LSGGSGKMTA LVNGSNTFMS GLSNLNSGLN QLNSSITEAA PQISQLSKGT LDLNSGVQSY 
TSGVDKYIES VNKVSQTQSA LANSIQKYVA SHPEALTDPN FKAVIATLEA SKSVPEQLKT 
AGGQLSSAGK LLTDGSGKVA GGVSQLTTQL SSAAQGINKL AAGSNELNKS YPMINQGILD 
TASSIKTASD KSKELSSGAS SVNDGVAKLS SGISELAAGS EELSKNSGVL LDGETKIQDS 
LGKLKDGVTE ASSGVSSSLL KADGKLNGTE GLKEYAADPV KITEKKVYGI PDYGTAFTPY 
FVSLSLWVGA LLMFFAIYLD EEVRFRKFSS KSKGIMRFFA YTLIGIAQAL VLDFVIVKGL 
HLEVANMGLF VLTSIIISLS FTSIMRFLLV QLRDVGKFLA ILLLILQLTS CGGTFPMELV 
PRFFNVLNPF MPMTYSVNAL REVIAGINNG FLAQNLIVLV TVMIGFLILN LVVSKLRFGS 
ISSDSDDFVK ISEEVSA