Gene Ccel_0520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0520
Symbol
ID	7309390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	598883
End bp	600103
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	36%
IMG OID	643607450
Product	peptidase S11 D-alanyl-D-alanine carboxypeptidase 1
Protein accession	YP_002504882
Protein GI	220927973
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1686] D-alanyl-D-alanine carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAAA AAATACTTAT AGTTTTTGTG GCTTTAATAT TGATATTTAA TTGTCTCCCG 
GTTTTTGCAT GGACGCCGAC AGAAGGTCTT ACTTCCAGCT CTGTAGTTTT AATGGATACT 
GTAAGAGGAC AGATTCTTTT CGAAAAAAAT GCTTATGCAC ATTTATCACC TTCAGTTATG 
TGTAAGCTTA TGACTGCCCT TGTTACCATT GAGAAAACTG ATTTAAATGC AAAGGTTACA 
ATCAGTAAAA ATGCCGCCAG CTTTAAGGGG CTGAATCTTG TGGTAGGGAA CCAGTATACG 
GTTGAGGATT TGCTTTACGC CGTAATGCTT TCACAGGGAA ACGATGCGGC TGTGGCACTT 
GCCGAATATG TAGGTGACGG TGATATCCAA AAATTTGTCA GATATATGAA TACAAAAGCT 
AAGGAGCTGT CCCTTAAAGA TACATATTTT GTAAATCCTA CTGGCCTTTA CGAAAAGGAT 
CAATATACAT CCGCCAAGGA CATTGCAGTG CTGGTAAAGG CAGCGATTTC TAATAATACT 
TTTAATTTGA TGTTCGGTGC AAGAGGTTTT GGTTGGCTCA ACGGAAATAA TTCTTCAATT 
TTAACTAACC AAAATACTCT TTTTTGGAGC TATAAAGGCG TTGACGGGGG AAAAATAGGT 
ACCAATACAA ACCCTCAGAG TATTTCTGCT GTTACTACAG CTACCCTCAA TGAAAAAAGA 
CTTATTGCTG TGGTATTTAA TACAAATGAG GAAAATGCCT TTTCCGAGAC GGCAAAACTC 
TTTGATTATG GGTTCTCAAA ATTTTATACA GGAGTTCTTG TTCCTAAGAA TATTCCTCAA 
AGAAGTATAG AAGTGGACAA TGTAAAGGTT GATCTTGTAA GTAAAATTGA TGTCTATTAT 
ACCTATCCAG TGGGAGACAG CTTTATTAAT AATATCAGCT TTACACCTAA TGAAAAGCTT 
AAACTTCCGC TTAATACCGA GACTATTGCA GGTGTTTTGA AATACACCCT GAACGATAAT 
ACCGTAATTG AAGTTAATCT GTACTCCGAT AAGACAGTGT CAGCACCTGA GGATTACATA 
TCAAAAATTA AAAACATTGT TACTGAAAAT CGGGATCTTG TAATAATCGT AGGTATTCTT 
GCAATTATTG AATTAGTTTT GATCGCTAAA AATCTTTTAA AATTCATATT TAAAGCTAAA 
AAAACAAGAA CCCAGAAATA G

Protein sequence

MSKKILIVFV ALILIFNCLP VFAWTPTEGL TSSSVVLMDT VRGQILFEKN AYAHLSPSVM 
CKLMTALVTI EKTDLNAKVT ISKNAASFKG LNLVVGNQYT VEDLLYAVML SQGNDAAVAL 
AEYVGDGDIQ KFVRYMNTKA KELSLKDTYF VNPTGLYEKD QYTSAKDIAV LVKAAISNNT 
FNLMFGARGF GWLNGNNSSI LTNQNTLFWS YKGVDGGKIG TNTNPQSISA VTTATLNEKR 
LIAVVFNTNE ENAFSETAKL FDYGFSKFYT GVLVPKNIPQ RSIEVDNVKV DLVSKIDVYY 
TYPVGDSFIN NISFTPNEKL KLPLNTETIA GVLKYTLNDN TVIEVNLYSD KTVSAPEDYI 
SKIKNIVTEN RDLVIIVGIL AIIELVLIAK NLLKFIFKAK KTRTQK