Gene Athe_1042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1042
Symbol
ID	7409599
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1136087
End bp	1137307
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	32%
IMG OID	643715408
Product	Fmu (Sun) domain protein
Protein accession	YP_002572916
Protein GI	222529034
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00563] ribosomal RNA small subunit methyltransferase RsmB

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGAAAT TCCATCAAAA GTTAAAAAAT GAAAAGGACA GGGCTTTGTT TGTTGAGCTT 
GTTCATGGTG TTTTGAGATA CAAAAGCCTT ATTGACTACT ATATTAATTT TGTTGCTAAA 
AAAGGAGTAA AGGATAAAAG GATATTAAAC ATTTTAAGGG TTGCCACATA TGAACTTCTT 
TTTCTTGAAA AGATTCCAGA GTATGCAACA GTAAATGAGG CATGTGAGGT TGCAAGCAAA 
ATAAATCCAC ATTTAAAGGC TTTTGTGAAT GCAATTTTGA GAAATATAAT CAGAAACAAA 
AATCAAATAG AAGAGTCATT GGAAAGAATT AAGGACGTGG ACTATAAAAG TTATTTATCA 
ATAAAGCTTT CTTATCCCAG ATTTTTAATA GATTATTTAG AAGAGAGTTA TGGACTTGAA 
AAAACTATAA AAATTTTAGA ATTTTTAAAT ACAAAACCTC CTCAGAGTAT AAAGATAAAT 
ACTAAAAAAA CCAATGTAAA TACATTAACA CAAGAGCTTG AGAAAAACGG ATTTAAGTAT 
GAGATTAATT CTCGTAACAA TGAAATAGTC CTTATTTTGA AGGGCAACAT AAAGGAAACA 
GAACTTTATA AGGAAGGCTA TTTCTATTTT CAGGATTTGG CATCTTCTCT TGTTGTAAAG 
TTTAACCAAG AAGATTTTAA AAGAGCAAAG AAAGTGATAG ACCTGTGTGC CGCACCAGGT 
GGAAAGACTT TTAACTGCGC AGAGGTTATA GATGGGTTTG TTGTTGCATG TGATATAAAC 
GAACATAAGC TTGATATATT GCGAGAAAAC ATTTTGCGGC TTGGTTTTGA TAATATCATT 
GTTGCAAAAA GTAACGCTGA GGTTTTTAAC CCTGATTTTG CCGAAAAATT TGACATTGTG 
ATTGCCGACC TTCCATGTAC TGGTTTTGGC GCAATTAGGA AAAAGCCTGA TATCAAATGG 
AATAAAAGTT ATCAGGACAT TGAGAATCTT CATGAACTGC AGGTAAGAAT ACTTGACAAT 
TCAGCAGGTT ACCTAAAAAG AGGAGGAATA CTTTTTTATT CTACATGTAC GCTTGGGAAA 
AAAGAAAATG AAGAAACAGT TATAGAGTTT TTAGAGAAGC ACAAAGATTT TTCGTTGGTA 
TCCCTAACTA CTATTTTTCC CGATGAGTTT GAATGTGATG GATTTTTTAT AGCTAAACTT 
AGAAAAGAGG GCGAAAGATA G

Protein sequence

MEKFHQKLKN EKDRALFVEL VHGVLRYKSL IDYYINFVAK KGVKDKRILN ILRVATYELL 
FLEKIPEYAT VNEACEVASK INPHLKAFVN AILRNIIRNK NQIEESLERI KDVDYKSYLS 
IKLSYPRFLI DYLEESYGLE KTIKILEFLN TKPPQSIKIN TKKTNVNTLT QELEKNGFKY 
EINSRNNEIV LILKGNIKET ELYKEGYFYF QDLASSLVVK FNQEDFKRAK KVIDLCAAPG 
GKTFNCAEVI DGFVVACDIN EHKLDILREN ILRLGFDNII VAKSNAEVFN PDFAEKFDIV 
IADLPCTGFG AIRKKPDIKW NKSYQDIENL HELQVRILDN SAGYLKRGGI LFYSTCTLGK 
KENEETVIEF LEKHKDFSLV SLTTIFPDEF ECDGFFIAKL RKEGER