Gene Ccel_0608 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0608
Symbol
ID	7312125
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	702983
End bp	704632
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	35%
IMG OID	643607548
Product	extracellular solute-binding protein family 5
Protein accession	YP_002504969
Protein GI	220928060
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.995783
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGACAA AAGCCTTGAG ACTTATTTCT TTATTCATAA TTACAGGACT GATGCTATCT 
GCATGTTCTG TTAATCTTAA TAAAAAATCT GCCAATCAAG ATGAGGATAT TTATGAAGGT 
AAATATGATA TATTGGACAA AGGCCCTGAA AAAGGAGGGT CTATACGTCT GTTCAGTACA 
CCTGTAGATA CTTTAAATCC AATTTTGACT AATAACCAGT ATGTTCAGGA TTTTTTGGGA 
TTTGTATTTG AAGGACTCTA TAGATTAGAC GAAAAGCAGC AGCCTGTGCC TGTTTTAGCA 
GAAAGAGCAG TTACTTCAGC TGACGGATTA AAACTTACAG TAACTTTAAA AAAAGGAATT 
AAATGGCACA ATGGATTACC GCTTCAAGCC GGAGATGTAG TGTTTACTAT AAATAGTATA 
ATGGATACTA AGAACAGCAG CGTGTATGCA GCTAACTTAC AGAATATCGC TTCTGTAACT 
GCGGGAAATA ATAATTCAGT TGTAATTACG TTGAAAAAAC CTGATTCAAT GCTGTTATAC 
AGCCTGACCT TTCCCGTTAT ATCTATGCAG TATTTTAATA AAGAAAAATT GAGTGATAAA 
AATTCAAAGA AAAATCTCTC ACCTGTAGGT ACGGGACCTT ATACTTTTGT ATCATATAAT 
GCAAAAAACG GAGTAAAATT TAAAGCCAAC GATGATTGGT GGAACAAAGG CAATTCAGAA 
GTAACGACTC CCTATATCCA ATCATTGGAG ATTAAAATAT TCGAGAATGC CGGGAAAGCC 
ACTAAGGTCT TTCAGTCCAG GGATGTTGAT GTGGTTACGG TTGATCACAG TGAGTTTAAA 
AAGTATATCA ATCGTACTGA TATTTCACTC AAACGTTATC CCGGTAAAAA CTATGAATTT 
CTATCACTCA ATGTTACAAA AGGGCCAATG GCAAATAAAA ATTTGAGAAG TGCTTTGGGT 
GGATTTATAG ATAAGAAAAA GCTTATTGAT ACTGCAGTAC AGGGGATTGC GATACCTGCT 
GAATTACCGC TTTTCCCTAA CTCTTGGATA AATCAGTTGG TAAATATGGA ACAGTATTCA 
GACTTAAAAA AGGCGAAACA GCTTATGACA CAAAGCGGAT ATGTTCTTTC GAAAAATAAG 
TATGTAAGCA AAGCAAACAG TAGAGCATTG TCATTAAAGC TTATTGTTAA TCAGGATAAC 
ACATTAAGAG TAAATACTGC CGATGCTATC GCATCTCAAT TGGTTAAAAA TGGAATAAAT 
GTGGAGGTTG AAAAGCTGAC TTGGGAGAAT GTGCAAAAAC GAATAAAATC CGGTGCATAT 
GATATGGCTT TACTGGGATA TCAAATTTCA ACAAAACCGG ATTTGTCCTT TGCTTACTCT 
ACAGATAGTA TAGAGTCAGG GCTCAATACG GCAAAGTACA GCAACCCTGC TGTTGACGGG 
TATCTTCAAC AAATTTTAAC TCAATCTGAC ATTGAAAAAC AGAAAAGTTT ATATACCAAA 
CTTTTAAATA CTGTTCTTGA CGAAAGGCCG TACATAGGCT TATATTTTAT CTCCCAAGGT 
ATAATGTGCA GTAAAAATAT TAAAGGAGCG ATAAACCCTA ATGTATGGAA CAGTTATAAC 
GATATTTCAC AGTGGTATGT ACCGCAATAA

Protein sequence

MMTKALRLIS LFIITGLMLS ACSVNLNKKS ANQDEDIYEG KYDILDKGPE KGGSIRLFST 
PVDTLNPILT NNQYVQDFLG FVFEGLYRLD EKQQPVPVLA ERAVTSADGL KLTVTLKKGI 
KWHNGLPLQA GDVVFTINSI MDTKNSSVYA ANLQNIASVT AGNNNSVVIT LKKPDSMLLY 
SLTFPVISMQ YFNKEKLSDK NSKKNLSPVG TGPYTFVSYN AKNGVKFKAN DDWWNKGNSE 
VTTPYIQSLE IKIFENAGKA TKVFQSRDVD VVTVDHSEFK KYINRTDISL KRYPGKNYEF 
LSLNVTKGPM ANKNLRSALG GFIDKKKLID TAVQGIAIPA ELPLFPNSWI NQLVNMEQYS 
DLKKAKQLMT QSGYVLSKNK YVSKANSRAL SLKLIVNQDN TLRVNTADAI ASQLVKNGIN 
VEVEKLTWEN VQKRIKSGAY DMALLGYQIS TKPDLSFAYS TDSIESGLNT AKYSNPAVDG 
YLQQILTQSD IEKQKSLYTK LLNTVLDERP YIGLYFISQG IMCSKNIKGA INPNVWNSYN 
DISQWYVPQ