Gene Ccel_2167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2167
Symbol
ID	7310859
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2536304
End bp	2537614
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	40%
IMG OID	643609098
Product	amidohydrolase
Protein accession	YP_002506489
Protein GI	220929580
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0888971
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTTGATA TACTTATAAA GAATACCGAG TTAATAACTA ATGATGAAAG TAAGCCGTTG 
ATTAAAGACG GATATATCGG AATCAAGGAT GGGTGTATTG ATTTCATTTC GGATAGTCTT 
CCTGAAAATG TAAAAGCCAG AGAGGTGATT GACGGAAAAA ACAAGATAGC CATGCCCGGC 
CTGGTAAATG CCCATAGCCA CAGTGCCATG ACACTTATGA GAAATTATGC TGATGATATA 
GCACTCGAAA AATGGTTGTT TGATAATATT TTTCCGGTTG AAGCAAAACT CACTGATAAA 
GATGTTTACT GGGGTACTAT GCTTGGTATC TCCGAAATGC TTAAATCAGG AATTACTGCA 
TTTGCTGATA TGTATATGTT TATGGATGAG GTTGCACGTG CAGTAACTGA AACTGGTATA 
AAGGCAAACC TTTGTAAAAG TCCGGTACAG TTTTTTGAGG ACGGGCAGCT TAAAAGACTT 
GACAAAAGTC AGGGAACCAT TGATTATTAC AACAGCTATC ATAATTCGGC TAACGGAAGA 
ATAAAGGTCT TCGTAGAAAT ACACTCAGTT TATATGTTTA ATGAAAATAC CCTTAGAAAT 
GCGGCTCAAC TGGCTAAGCA GCTGAATACA GGTATACATA TACATTTACT TGAAACTCTC 
TCTGAGGTTG AATCCAGTAA AAAGGACTAT GATATGACTT CTATAGAGAT ATGCAGAGAA 
ACTGGGGTAC TTGATGTTCC TGTTATGGCG GCACATTGTG TCCATCTCAC TGACGGTGAC 
CTTAGAATCA TGAAAGAGAA GAGGGCAAGT GTGGTTCATA ATCCGACCAG TAATCTCAAG 
CTGGGAAGTG GCATTGCCAG AGTACCCGAA ATGATGGACA TGGGTATTAA TGTATGTCTT 
GGTACTGACG GTGCTGCCAG CAACAATAAT CTTAATATGT TTGAGGAAAT GAATCTTGCT 
GCAATACTCC ACAAGGGCGT CGCTATGAAC CCGCAGCTGA TGAAAGCCCA GGATGTTCTT 
AAAATGGGAA CAGTTAACGG GGCAAGGGCT ATAGGTTTTG ATGATACAGG TATACTATCA 
AAGGGAATGA AAGCAGACAT TATACTGGTT GATACAGATA AACCTCACTT TTATCCCAAA 
AATAACCCAA TGTCAATGAT TGTATATTCG GCACAAGCAG CCGATGTGGA CACTGTTATA 
GTTGATGGTA ATGTTCTGGT AAAGAAGCGT GAATTTATAC ATATTGATGA AGAGAGAATT 
AAGTTTGAGG TAGATACTTT ATCCAAGAGG CTCCTGGGCA GACAACCATA G

Protein sequence

MLDILIKNTE LITNDESKPL IKDGYIGIKD GCIDFISDSL PENVKAREVI DGKNKIAMPG 
LVNAHSHSAM TLMRNYADDI ALEKWLFDNI FPVEAKLTDK DVYWGTMLGI SEMLKSGITA 
FADMYMFMDE VARAVTETGI KANLCKSPVQ FFEDGQLKRL DKSQGTIDYY NSYHNSANGR 
IKVFVEIHSV YMFNENTLRN AAQLAKQLNT GIHIHLLETL SEVESSKKDY DMTSIEICRE 
TGVLDVPVMA AHCVHLTDGD LRIMKEKRAS VVHNPTSNLK LGSGIARVPE MMDMGINVCL 
GTDGAASNNN LNMFEEMNLA AILHKGVAMN PQLMKAQDVL KMGTVNGARA IGFDDTGILS 
KGMKADIILV DTDKPHFYPK NNPMSMIVYS AQAADVDTVI VDGNVLVKKR EFIHIDEERI 
KFEVDTLSKR LLGRQP