Gene Athe_1658 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1658
Symbol
ID	7409488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1751627
End bp	1752877
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	28%
IMG OID	643716027
Product	adenine-specific DNA methylase
Protein accession	YP_002573525
Protein GI	222529643
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000448906
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAATT TGAAATTTGA TTTATTTTTA AGTAATGTAG ATATCGATTT TAAAGATTAC 
AAGATAAAAG AGTCCGTTCA TGGTATTCAT TCTTATCCAG CAATGATGCC AGCTCCATTA 
GCAGAATTTT TGATTCAAAG CTTTACAAAG AAAAATGATA TAGTTCTTGA TCCTTTTTGT 
GGGTCTGGAA CTGTACTTTA TGAAGCTTTA AAAAATGGGC GAAATGCTAT TGGCGTTGAT 
ATAAATCCTT TGGCGATATT AATTAGCAAT GTTAAGATTA ACATAGGGAA AATTGAATTA 
TCTAAATTAG AAAAATTCTT TATAGAAATC TTTAAAGCTT ACCAGCAACT TGAAGGTAAA 
GAGTTTGAGC TACCTAAATT TAAAAATATT GATTTTTGGT TTAAAAAAGA AGTTCAAATA 
AACTTACAAA GATTAAAAAC AGCTATTGAA GTAGTAGATC AAGATATATA TAAACTTTTC 
TTTAAACTTG TATTCGCTAA AACAGTAAGA AATGTAAGTA ATACTCGTAA TTCAGAATTT 
AAATTATACA GACTCGAAGA AGAAAAATTG AAACAACATA ATCCTGATGT TTGGAAAACT 
TTTGAACGAG ACTTTAAAGT AACAGAGGAA AAACTTTTGT ACAGAGAAAT TACTAATAAT 
TCTAATTATG TAAAAATATT TCACAAAAAT ATTTTAGATT TGGATGAAGT AGAAAATGAA 
ACAGTCGACT TAATATTGAC CTCTCCGCCT TATGGAGATG CTAGGACAAC AGTTGCTTAT 
GGTCAATTTT CAAGACTCTC TTTGCAGTGG CTTAATTTAT GGGAGTATGA TGTTGATAAA 
GAAAGTTTAG GTGGAAAGAA AAAAATTGGA GAATTTGATC CGATTTTATT CCAATTACCT 
GTTTTAAATT CTGTTTTCAA TAAAATTTTA CAATTGGATA GTAAAAGAGC CGAAGAAGTT 
CTAAGATTTT TTCATGATTA TTTTTATTCA ATCAAGAAGT TAACTAAGTT AGTTAGAAAA 
AAAGGATATG CAGTTTATGT AGTTGCGAAT AGAAAAGTTC GAGGTATAGA AATTCCTACA 
GATGAAATTA CTAAAGAAAT GTTTGAATTT TTTGGATTTG TTTGGGTTGA TACATTAGAA 
CGTAATATTA TTAACAAACG AATGCCCTTA AAAAATAGTC CATCTAATAT TCAAGGGCAA 
AAAGACAATA CTATGCTAAA AGAAAAAGTA GTTATACTTA GAAAAATATA G

Protein sequence

MENLKFDLFL SNVDIDFKDY KIKESVHGIH SYPAMMPAPL AEFLIQSFTK KNDIVLDPFC 
GSGTVLYEAL KNGRNAIGVD INPLAILISN VKINIGKIEL SKLEKFFIEI FKAYQQLEGK 
EFELPKFKNI DFWFKKEVQI NLQRLKTAIE VVDQDIYKLF FKLVFAKTVR NVSNTRNSEF 
KLYRLEEEKL KQHNPDVWKT FERDFKVTEE KLLYREITNN SNYVKIFHKN ILDLDEVENE 
TVDLILTSPP YGDARTTVAY GQFSRLSLQW LNLWEYDVDK ESLGGKKKIG EFDPILFQLP 
VLNSVFNKIL QLDSKRAEEV LRFFHDYFYS IKKLTKLVRK KGYAVYVVAN RKVRGIEIPT 
DEITKEMFEF FGFVWVDTLE RNIINKRMPL KNSPSNIQGQ KDNTMLKEKV VILRKI