Gene Athe_1043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1043
Symbol
ID	7409600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1137313
End bp	1138338
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	36%
IMG OID	643715409
Product	ribosomal RNA large subunit methyltransferase N
Protein accession	YP_002572917
Protein GI	222529035
COG category	[R] General function prediction only
COG ID	[COG0820] Predicted Fe-S-cluster redox enzyme
TIGRFAM ID	[TIGR00048] radical SAM enzyme, Cfr family

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGGC TTATAAAAGA TTTGACGTTT GATGAGCTAA AAAAGTGGCT CGAAAATATT 
GGTGAAAAAC CTTTTAGAAC AAGCCAGATT TTTGAGTGGC TTTACAAGAA AAATGCTACT 
GATGTAATGC AGTTTACCAA TCTACCACTC GAACTTCGAG AAAAGATTGA GGATGAGTTT 
TTGATAAACT CTTTACAGAT TTTGAAACAT CAAAGTGATG GAGAGAGTAT AAAATTCCTG 
TTTGAACTTT GCGATAAAAA TGGAGTTGAA AGTGTGTTTT TACCTTATCG GTATGGGAAT 
GCAATATGCG TCTCAACACA AGTTGGATGC AAAATGAACT GCAGGTTTTG TGCCTCTGCC 
ATAGGCGGAT TTGTAAGAAA CCTTTCGGCA GGGGAGATGG TTGACCAGAT AATCAACGTA 
GAAAACTTTA CAGGCAAAAG AATAACAAAT GTGGTTCTGA TGGGAAGTGG CGAGCCATTT 
GACAACATTG AAAATGTGTT TAAATTTATT GAGATAATAA ACTCAAAAGA GGGGAAAAAC 
ATAGGGGCAA GGCATATCAC CATTTCCACA GTTGGCATAG TTGAAGGAAT TTATAGGCTC 
TGTGATTTTC CAAAACAAGT AAACCTTGCA ATATCTCTGC ATGCCCCAAA TAATAGCCTG 
AGAGACAAGC TTGTTCCGAT AAACAAAAAG TATCCTGTTG AAGATATTAT GAAAGCAGTT 
GATTACTACA TTAAAAGGAC TAATAGAAGA GTTACTTTTG AGTACGCCCT GATAGATGGG 
GTAAATGATT CTATTGAATG TGCTCAAGAG CTTGGCAAGA TGCTAAAAGG TAAGCTTGTA 
CATGTAAATT TGATACCTGT TAACCCAGTT GAAGAAAAAG GGTTTAGAAG ACCTTCAAAA 
GAAAAAATAA AAGTATTTTT TGAAACCTTA AAATCATATC AAATTAATGT TACAATTAGA 
AGAGAGCTTG GCAGCAGTAT ATCTGCAGCG TGTGGACAGC TGAGAAAACG ATATTTTAAC 
ATATAA

Protein sequence

MKRLIKDLTF DELKKWLENI GEKPFRTSQI FEWLYKKNAT DVMQFTNLPL ELREKIEDEF 
LINSLQILKH QSDGESIKFL FELCDKNGVE SVFLPYRYGN AICVSTQVGC KMNCRFCASA 
IGGFVRNLSA GEMVDQIINV ENFTGKRITN VVLMGSGEPF DNIENVFKFI EIINSKEGKN 
IGARHITIST VGIVEGIYRL CDFPKQVNLA ISLHAPNNSL RDKLVPINKK YPVEDIMKAV 
DYYIKRTNRR VTFEYALIDG VNDSIECAQE LGKMLKGKLV HVNLIPVNPV EEKGFRRPSK 
EKIKVFFETL KSYQINVTIR RELGSSISAA CGQLRKRYFN I