Gene Cthe_1513 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1513
Symbol
ID	4810551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1837328
End bp	1838269
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	35%
IMG OID	640106933
Product	DNA adenine methylase
Protein accession	YP_001037934
Protein GI	125974024
COG category	[L] Replication, recombination and repair
COG ID	[COG0338] Site-specific DNA methylase
TIGRFAM ID	[TIGR00571] DNA adenine methylase (dam)

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000000971855
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGAATTTG CAATTAGCAT TAATAATATT AATTCTACTG TATGCGCAAA ACCTTTTGTA 
AAGTGGGCCG GAGGAAAAGG GCAATTGCTT GACACTTTTA GACAATATTA TCCTTCTACG 
CTTATTAAAG GCTATATAAG ACGTTATATT GAGCCTTTTG TCGGCGGTGG GGCGGTTTTA 
TTTGAAATTT TGCAGAAATA TAAAGTTGAG GAAGCTTTTA TATTTGATAT AAATGAGGAC 
TTAATTAACA CTTATGTAGT GATTAAAAAT GATGTGCACA ACCTCGTGGA ATATCTTTCA 
GATTTAGAGT GCAAGTATTT AAATTTGGAT GAAAAATCTC GCAAAGACAT GTATTATGAT 
ATAAGAGATG CATACAATTC ACGAGCTTTA AAGAACAATC AGCCGGATGT TGAAAGAGCT 
GCACAGTTTA TTTTTCTAAA TCGTACATGT TTTAACGGGC TTTATCGTGT TAATCGTGCG 
GGACATTTTA ATGTGCCGTC CGGAGATTAT AAAAATCCAA CCATTTGTGA TGAGAAGAAT 
TTGTATGCAG TAAGTTCTTT GCTTCAAAGG GTGCATATAT TTGTCGGTGA TTATAGAGAA 
TGTGCCGGAT ATGTAGACAA GGATAGTTTT GTTTATTTTG ACCCTCCGTA CAGGCCGCTT 
AATGTTACAT CCAGTTTTAC ATCTTATAGT AAATTTGATT TTACGGATGA AGATCAAATA 
CAGCTGGCAA AATTCTTTTC AGAAATGAAT GATACAGGTG CTTTGCTTAT GCTGAGCAAT 
TCCGACCCTA AAAATGAAAA CCCTGATGAT AATTTTTTTG ATGAATTGTA TAAGGAGTTT 
TTCATTCACA GGATAAAGGC TAAGCGGGCG ATTAATTCAA ACGGCAGTCG GAGAGGATTA 
ATTAGTGAAC TTCTTGTTAC GAACTATGAA GTAAAAGACT AG

Protein sequence

MEFAISINNI NSTVCAKPFV KWAGGKGQLL DTFRQYYPST LIKGYIRRYI EPFVGGGAVL 
FEILQKYKVE EAFIFDINED LINTYVVIKN DVHNLVEYLS DLECKYLNLD EKSRKDMYYD 
IRDAYNSRAL KNNQPDVERA AQFIFLNRTC FNGLYRVNRA GHFNVPSGDY KNPTICDEKN 
LYAVSSLLQR VHIFVGDYRE CAGYVDKDSF VYFDPPYRPL NVTSSFTSYS KFDFTDEDQI 
QLAKFFSEMN DTGALLMLSN SDPKNENPDD NFFDELYKEF FIHRIKAKRA INSNGSRRGL 
ISELLVTNYE VKD