Gene Moth_0869 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0869
Symbol
ID	3831507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	899478
End bp	900398
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	64%
IMG OID	637828799
Product	ribosomal large subunit pseudouridine synthase D
Protein accession	YP_429729
Protein GI	83589720
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAGTCG TGGTTCCACC GGAAGCCAGG GGCCGGCGTA TCGATGCCTG GCTGGCCGGC 
GAACTGCCGG AGGTATCCCG TTCCCGCATC CAGCAGCTCC TGGAGGCCGG GGAGATTACC 
CTGGCCCTCC CGGGCCGTCT CAAAGCCAAC TACCGTCTCC GGGGTGGTGA AAGGGTCCGG 
GTGCGGTTAC CGGAGCCAAC CCTGCTGGCG GCCAGACCGG AAGCCATTCC CCTGGACATC 
CTCTATGAGG ACGAGGATAT AATCGTCGTC AACAAACCCC AGGGAATGGT AGTGCACCCG 
GCGCCGGGGA GCGAGGGTGG CACCCTGGTA AACGCTCTAT TGTATCACTG CGGGGACCTG 
TCGGGGATTA ACGGCGTCTT ACGGCCCGGC ATTGTCCACC GCCTGGACAA GGATACCTCG 
GGCATCCTGG TGGCGGCCAA GAACGACGCC GCCCACCGCG GCCTGGCGGC CCAGATCAAG 
GATCACAGTA TGAAAAGGAT TTACCTGGCC CTGGTCCACG GCGAGGTGGC CGAACCCCGG 
GGCCGGGTGG AAGCCCCCAT CGGCCGCCAC CCGGTGGACC GCCAGCGCAT GGCCGTTACC 
CTGAAGAACT CCCGGCCGGC CGTTACCCAT TACCGGGTGG TGGAGCATTT TCCCGGCTAT 
ACCCTCCTGG AAGCGCGCCT GGAAACGGGC CGTACCCACC AGATCCGGGT CCATATGGCC 
TTTATCGGCC ACCCGGTAGT AGGAGATCCC AAATATGGTC CCCGCCGTTG CCCCTTTGCG 
GTTCCCGGAC AACTCCTCCA CGCCGGGTGC CTGGGGTTTG TTCACCCTGT ACGGGGCGAT 
TACCTGGAGT TCACGACACC ACCCCCGTCG ATTTTTTTAC AGGTCCTGGA GCAGTTACGC 
CGGGCAAAAG GAGAGAAGTA G

Protein sequence

MEVVVPPEAR GRRIDAWLAG ELPEVSRSRI QQLLEAGEIT LALPGRLKAN YRLRGGERVR 
VRLPEPTLLA ARPEAIPLDI LYEDEDIIVV NKPQGMVVHP APGSEGGTLV NALLYHCGDL 
SGINGVLRPG IVHRLDKDTS GILVAAKNDA AHRGLAAQIK DHSMKRIYLA LVHGEVAEPR 
GRVEAPIGRH PVDRQRMAVT LKNSRPAVTH YRVVEHFPGY TLLEARLETG RTHQIRVHMA 
FIGHPVVGDP KYGPRRCPFA VPGQLLHAGC LGFVHPVRGD YLEFTTPPPS IFLQVLEQLR 
RAKGEK