Gene Ccel_2057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2057
Symbol
ID	7310760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2415617
End bp	2416741
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	39%
IMG OID	643608991
Product	DNA protecting protein DprA
Protein accession	YP_002506383
Protein GI	220929474
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.448378
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGAAA TTGAATATTG GATTTGGTTA ACGTCTTTAG AGGGGTTAAG TTCAAAAAAA 
GCTTTAAACT TACTGGAAAC GTATAGAAAT CCTGAGGTTA TATACGGTCT TTCTGAAAGT 
GAGCTTCAAA ACACAAGGGG TTTAACTGAA AAAAATGTAA AGGAGCTATT AAACTCAAAT 
AAAAGGGAGA GGGTTGGCTC CATATATCAG ATGTTAGTCC GGTATAACAT AAAAATGGTA 
AATATTTTTG AAGAAAACTA CCCTCAAAAG CTGAAAAATA TTTATGATCC GCCCATTGCT 
TTGTATTATA GGGGAAACCT TGACTCAGAC AGCTTTTCAA TAGCGGTTGT GGGATCAAGA 
AGGACCACCG GGTATGGTGC GAATACCGCC AGAAAATTGT CATATGACCT GGCAATGAGG 
GGTGTAACAA TAGTAAGTGG TCTGGCCAGG GGGATAGACA GTATTGCCCA TAAAGGCTGT 
CTGGACGCAG GAGGAAAAAC CATAGCCGTT CTTGGTTCGG GGCTTGACAA TATATATCCC 
CCGGAAAATG CAGGACTGTT TAAGGATATA ATTGATTCCG GGGGCTTGGC ATTATCTGAA 
TACCCTCCGG GAATGCCGCC GCTTCAGCAT AATTTCCCGG CACGAAATAG AATAATAAGC 
GGAATTTCGG GCGGTGTCGT TGTGATTGAG GCAGCTAAGA GGAGCGGTTC CTTAATTACG 
GCAGGCTGTG CTTTAGAGCA GGGGAGAGAG GTTTTTGCTG TTCCGGGAAA TATCGACTGT 
GCGTACAGCA TGGGAACAAA CCAATTAATT AAAGAAGGAG CTAAACTGGT ATTAAATGCC 
ACAGATGTTC TGGAAGAATT TGAATACAAC GGAATACAGA ATTTTACACC CGTTCAGGGG 
GATATAGATG AGAAAATCAG TAAAAAATAT CTTAATCTAT TTAAAGGGCT TTCAGCAGGT 
GAAATAAAAA TATTAAAGGT AATTTTTAAC GGTGCAAATA ATATTGATGA AATTCTTGAG 
AGAAGTAATT TTTCTGCGAA AGATGCAAGC AGTATACTGT TTATGCTTGA AATGAAGGGT 
GTAATCAAAC AGAATCCGGG TAAATTGTTT GAAGTAATAA TTTAG

Protein sequence

MREIEYWIWL TSLEGLSSKK ALNLLETYRN PEVIYGLSES ELQNTRGLTE KNVKELLNSN 
KRERVGSIYQ MLVRYNIKMV NIFEENYPQK LKNIYDPPIA LYYRGNLDSD SFSIAVVGSR 
RTTGYGANTA RKLSYDLAMR GVTIVSGLAR GIDSIAHKGC LDAGGKTIAV LGSGLDNIYP 
PENAGLFKDI IDSGGLALSE YPPGMPPLQH NFPARNRIIS GISGGVVVIE AAKRSGSLIT 
AGCALEQGRE VFAVPGNIDC AYSMGTNQLI KEGAKLVLNA TDVLEEFEYN GIQNFTPVQG 
DIDEKISKKY LNLFKGLSAG EIKILKVIFN GANNIDEILE RSNFSAKDAS SILFMLEMKG 
VIKQNPGKLF EVII