Gene Ccel_2007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2007
Symbol
ID	7310716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	2369950
End bp	2371191
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	38%
IMG OID	643608941
Product	UMUC domain protein DNA-repair protein
Protein accession	YP_002506334
Protein GI	220929425
COG category	[L] Replication, recombination and repair
COG ID	[COG0389] Nucleotidyltransferase/DNA polymerase involved in DNA repair
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.470929
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAGGG TAATTTTACA TTGTGACCTG AATAATTTTT ACGCTTCTGT TGAATGTCTG 
TATAATCCAC AGTTTAGGGA TTATCCTTTG GCAGTATGCG GAAGTCAGGA TTTGCGTCAT 
GGAATTGTTT TGGCTAAAAA TTATATTGCA AAAAAGTTTG GTATAAAAAC AGGCGAGGCT 
ATCTGGCAGG CAAAACAAAA GTGTCCAAAC CTCGTTGTTG TTAATCCAAA TTATGCTTTA 
TACCTGAGGT TTTCAAAGGA TGCTAGGGAA ATTTATTCCA GGTATTCCAA CCTTGTTGAA 
AGTTTTGGCA TAGACGAGTG CTGGATTGAC GTTTCTGAAA GCACCAAGCT GTTCGGAGAC 
GGGGAAAAAA TTGCAAATGA AATACGTGCA CTTATTAAAA CAGAACTTGG TGTTACTGCT 
TCAGTTGGAG TGAGCTTTAA TAAGATATTT GCAAAGCTTG GGTCTGATCT ACAAAAGTCT 
AATGCTACTA CTGTTATTAA CCAAAATAAT TTTAAGGAAA TGGTTTGGAA TTTAAACGTT 
GGGGAGTTAC TTTATGTGGG CAGATCAACC CGGAAGAAAC TAAACCAGAT TGGAATAATG 
ACTATCGGAG ATCTTGCAGG ACTTCCTCCC TCTTTCATTA GAAGATATCT CGGAAAATGG 
GGAGAAATTC TCTGGAATTT TGCTAATGGC ATGGACTATT CCGAAGTAAC TGCAACAGAT 
TATCACGAAA CTATAAAGGG AATCGGTAAC AGTATGACGA CCGCAAGGGA TCTTGTAAAC 
ACAGAGGATG TCAAGCTTAC CTTTACTGTA CTGGCTGAAA GTGTGGCAGA GAGACTTAGA 
AAACATAATT TAAAGGGTTC TACAATACAG ATTTATATTC GTGATAATGA GCTTGCCTCA 
ATTGAACGTC AAGCAAAGCT CCCGGTTTCC AGCTATATAT CCGGTGAAAT CACACGTAAA 
GCTATGAACA TTTTTAATAC AAATTGGAGT TGGTATAAGC CTATACGCTC TCTTGGTATA 
CGTGCAACTG ATTTGGTTAC TGCCGACAGC CATACCCAAC TTTCCTTTTT TGACAATTAT 
AATAAACGTC CACAATTGGA AAATTTGGAA TTCAGTATTG ACGCCATTCG AAAAAGGTTT 
GGCCATTACT CTGTTCAAAG GGCAATTTTG CTTAAAGACA GTGCTCTTAA TGCTAATCCC 
ATTGAAGACA ACATTATTCA TCCTGTTTCA TTTTTTAGGT AA

Protein sequence

MDRVILHCDL NNFYASVECL YNPQFRDYPL AVCGSQDLRH GIVLAKNYIA KKFGIKTGEA 
IWQAKQKCPN LVVVNPNYAL YLRFSKDARE IYSRYSNLVE SFGIDECWID VSESTKLFGD 
GEKIANEIRA LIKTELGVTA SVGVSFNKIF AKLGSDLQKS NATTVINQNN FKEMVWNLNV 
GELLYVGRST RKKLNQIGIM TIGDLAGLPP SFIRRYLGKW GEILWNFANG MDYSEVTATD 
YHETIKGIGN SMTTARDLVN TEDVKLTFTV LAESVAERLR KHNLKGSTIQ IYIRDNELAS 
IERQAKLPVS SYISGEITRK AMNIFNTNWS WYKPIRSLGI RATDLVTADS HTQLSFFDNY 
NKRPQLENLE FSIDAIRKRF GHYSVQRAIL LKDSALNANP IEDNIIHPVS FFR