Gene Cthe_0814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0814
Symbol
ID	4810432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	983728
End bp	985440
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	40%
IMG OID	640106231
Product	DNA repair protein RecN
Protein accession	YP_001037242
Protein GI	125973332
COG category	[L] Replication, recombination and repair
COG ID	[COG0497] ATPase involved in DNA repair
TIGRFAM ID	[TIGR00634] DNA repair protein RecN

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCCAAC GGTTGGAAAT TCAGAATGTA GCAATAATTG ACAAGGTTGA AATTGAGTTG 
GGAGATGGGC TCAATGTACT GACCGGCGAA ACCGGAGCGG GAAAGTCCAT CATAATTGAC 
TCAATAAATG CCATTTTAGG GCAAAGACTG TATAAAGACC TTATAAGAAC GGGCAGGGAC 
AAAGCCATTG TTGAAGCCGT CTTTCAGGTG GATAAAAAAA GGGTGGAAGA TTTGCTGGAG 
GATTTTGGAA TAGACTGGGA AGAAGACGGT ACTTTGGTTG TGTCCAGAGA GTTTACCACT 
TCAGGGAAGA ATACTTGCAG GATTAACGGC AGAATTGCAA CGGTGTCAAT GCTAAAACAA 
TTGGGAGAAA GGCTTATTGA TGTACATGGA CAGCATGACA ACCAATCCCT CTTAAGAACC 
GAAAGCCACA TCGATCTTCT GGATTCTTTT GCGTCTTCCA GGCTTCAAAG CTTGAAAGAT 
GAGTATTTAA AACATCTTGA AACATACCGG AAGATTAAAA GCAGGTTGAA GGAACTGACC 
GGTGACAAAA ATGAAAGGGA GCGTAAAATA GATATTCTCA AGTATCAGAT TGATGAAATA 
AAAAAGGCGA AGCTAAAGAC AGGTGAAGAA GAGGAACTTT CAAAACAGAG AGAACTTTTG 
GTGAATTCTG AAAAAATTAC AAACACTCTT TCCAATGCCT ATGAACTTTT AGGAAGCGGA 
GGCAAATTCG GAGAATCCGC ACTGGACATG ATAAACAAGG CTGCTTCGGA TTTTGGCGGT 
ATAGAGGAGT TTGATGCAAA ATATGATGAA CTTAAAAAAA GGATTGAGGC GGTTGCGATT 
GAACTTGATG ATATTGTCTC GGAAATCCGC AATTTGCGCG ATAATATGGA ATATGATCCA 
GACCTTCTTA TGCAGATTGA AAGCAGACTT GATGTATTAT ACAGGCTTAA AAAGAAATAT 
GGAGATTCGG TGGAAGAAAT CTTAGAGTAC AAGGATAAAA TAGAAAAGGA ACTGGATGAA 
ATTTTAAATA ATGAAGAAAT TGTAAATAAG TTAAATGAAG AGCTTTTGGA AGAAGACGGG 
AAGCTGTACC GACTGGCAAA GGAAATGAAC AATGAAAGGG TTAAGGCGTC AAAGCTTCTC 
GAAGAAAAAA TCGGCGAGGA GCTTAAAGAC CTGGAAAAGA AAAACACCAG TTTCAAGGTG 
AGAATAGATT TTGACGATTC AACGGAGAAT GGGGAAAGAA AATACAATAA CAACGGTCTT 
GACAGAGTGG AGTTTATGAT ATCCACCAAC GCTGGAGAGC CTTTGAAACC TTTGGCAAAG 
ATAGCTTCCG GCGGAGAAAT GTCGAGAGTG ATGCTTGCAA TAAAGACAAT TCTTGCAAAA 
GTGGACAAGA TACCCACAAT GATATTCGAC GAGATTGATA TTGGAATAAG CGGTGTTGCG 
GCTCAAAAAG TGGGAGAGAA GCTCTGTTAT ATTTCGAAAA ACCACCAGGT CATATCTGTA 
ACCCACTTGG CACAAATAGC CTGTATGGCG GACAATAACT ATTATATTGA CAAGGTAACC 
GAAAACGGCA ATACCAGGAC GGTGGTTAAA AAGCTTGATG AAAGGGGAAA GAGGGACGAA 
ATAGCAAGGA TCCTCGGTGG AGCGAGTATT ACGGACATAA CATTAAAGCA TGCTGAAGAA 
ATGCTTGACA AAGCAAAAGA ATTTAAGAAA TAA

Protein sequence

MLQRLEIQNV AIIDKVEIEL GDGLNVLTGE TGAGKSIIID SINAILGQRL YKDLIRTGRD 
KAIVEAVFQV DKKRVEDLLE DFGIDWEEDG TLVVSREFTT SGKNTCRING RIATVSMLKQ 
LGERLIDVHG QHDNQSLLRT ESHIDLLDSF ASSRLQSLKD EYLKHLETYR KIKSRLKELT 
GDKNERERKI DILKYQIDEI KKAKLKTGEE EELSKQRELL VNSEKITNTL SNAYELLGSG 
GKFGESALDM INKAASDFGG IEEFDAKYDE LKKRIEAVAI ELDDIVSEIR NLRDNMEYDP 
DLLMQIESRL DVLYRLKKKY GDSVEEILEY KDKIEKELDE ILNNEEIVNK LNEELLEEDG 
KLYRLAKEMN NERVKASKLL EEKIGEELKD LEKKNTSFKV RIDFDDSTEN GERKYNNNGL 
DRVEFMISTN AGEPLKPLAK IASGGEMSRV MLAIKTILAK VDKIPTMIFD EIDIGISGVA 
AQKVGEKLCY ISKNHQVISV THLAQIACMA DNNYYIDKVT ENGNTRTVVK KLDERGKRDE 
IARILGGASI TDITLKHAEE MLDKAKEFKK