Gene Ccel_2153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2153
Symbol
ID	7312329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2522834
End bp	2524486
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	38%
IMG OID	643609084
Product	YD repeat protein
Protein accession	YP_002506475
Protein GI	220929566
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3209] Rhs family protein
TIGRFAM ID	[TIGR01643] YD repeat (two copies)

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0957707
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATAC CTCGGAAGCG ATTGTATATA CAGGAGCCTG ACGGAAAATC CAATTATACT 
GAATATTTTC AATATGGAGG TAAAAACAAA TATGGCGATA TAAAATCACA AACCGACCGT 
AATGGAAATA AAACTCAGTA TGAGATTGAT GCTAGAGGCA ATGTAACCAA AATCACAAAT 
CCTGACGGAA GTACCCAGCT AAAAGAATAC GATGAAAAAA ACAATGTAAC AAAAGAAGTG 
GATGAGTGCG GGAAAACAAC CTACAATGTT TACGATGAAA ACAAAATAAA CCTGATAAAG 
AAGGTACAAC CCCTTAACGA AACAGATGTA TACGACGGCA CAAACAATAC AGGTTTTGCA 
ATAACTTTCT ACCAATATTA TACAGGAGAA GAATCGGGTT CATCTGCAAA GGGATTATTA 
AAAAGTGAAA CAGACCCGGA GGGCAATACC ACCACGTACA CCTACAACAC TTATGGTGAT 
GTAAAAGCAG TATCTGACCC AGAGACAGGC AAAGTTACAA CTTATGAGTA TAACCGCATA 
GGCTGGAAAA CCGCACAAAT AACCCAAAAG GGCAACAGAA CAGAATTTAC CTACGACAAA 
AACGGCCAGT TAATTAAAAC TACAACAGTA AGCTCAAAAA ATGAAACACA AAGAACGATA 
TTTGACCTGT TGGGAAGAAA AATACAAGAA ATTACTCCAA ACCAATATGA CGATACAAAG 
GATAATGTAG AAGCCGATAC ATATACTGAC AATACGGTGG GAACAAAATA CGAATACTTT 
GATAGTGGTA AAATCAAGGA AGTAACCAAT GCATTAGGAG AAACGACAAG CTACACCTAC 
GACGTATACG GGAACACGCT GACAGAAGCA AAACCCAACG GTGCAATTTA CAGGTATGAA 
TATGATGTTC TGGACAGACT ACTTAAAATT TACTTCAGAG ATAATTCATC AGTAGCTGAA 
GAACTACTTA CCCAATACAG TTATGCAACT TTGGAGGACG GAAAAACACA AACAACTGAA 
ACAAAATATC TGAATTCCAA AGACAAGGCT GTAACGGTTT ACATATATGA CTATGCCGAC 
AGGCTTGTAG AACAGCAGAA TCCTGACGCT ACAAAGCAGA GGACAATATA CAACGCAAAC 
GGAACAATTA ACAGACAGAT TGCAGCTAAC GGAAGCAGTA CATACTTCAA ATATGATGGC 
TTAAACAGAT TGACAGAACA ATGGGCCCCT TTTGAAGTAT CAAACGGAAA TACCCTGTAC 
ACTTACAACA AAACCGAATA TGACAAGGCT GGAAGAAAAT CTGCGGTGAA ATCAGGCAAA 
GACAAGGTAA CCCTGTGGTC AATACCTGAA AGCCTTGCAA TAACAAACTA CCAGTATTAC 
AAAAACGGTA ACGTCAGCCA GACAAGGGAT TCTGAAGGAA GAAAGACAGA ATACCTGTAC 
GATGATGACG GAAATGTTAT AAAAGAAAGT GTATATACCA ATGCAACCAA CAAGCTAGTA 
ACGGATTATA CATACAATTA CCTTGGAAAG CTGGACAAAA AGGAGCAACA TGTAAAAACC 
GGAGACCTGT ACGGAAAAGA CTTCAACGAC AAACGGACAC TTTACTTACA ACCTCCTACA 
CTTATGACAA GAATGGTAAT ACAAAAACTG TGA

Protein sequence

MKIPRKRLYI QEPDGKSNYT EYFQYGGKNK YGDIKSQTDR NGNKTQYEID ARGNVTKITN 
PDGSTQLKEY DEKNNVTKEV DECGKTTYNV YDENKINLIK KVQPLNETDV YDGTNNTGFA 
ITFYQYYTGE ESGSSAKGLL KSETDPEGNT TTYTYNTYGD VKAVSDPETG KVTTYEYNRI 
GWKTAQITQK GNRTEFTYDK NGQLIKTTTV SSKNETQRTI FDLLGRKIQE ITPNQYDDTK 
DNVEADTYTD NTVGTKYEYF DSGKIKEVTN ALGETTSYTY DVYGNTLTEA KPNGAIYRYE 
YDVLDRLLKI YFRDNSSVAE ELLTQYSYAT LEDGKTQTTE TKYLNSKDKA VTVYIYDYAD 
RLVEQQNPDA TKQRTIYNAN GTINRQIAAN GSSTYFKYDG LNRLTEQWAP FEVSNGNTLY 
TYNKTEYDKA GRKSAVKSGK DKVTLWSIPE SLAITNYQYY KNGNVSQTRD SEGRKTEYLY 
DDDGNVIKES VYTNATNKLV TDYTYNYLGK LDKKEQHVKT GDLYGKDFND KRTLYLQPPT 
LMTRMVIQKL