Gene Mext_1005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1005
Symbol
ID	5833661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	1083687
End bp	1084718
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	71%
IMG OID	641366787
Product	RluA family pseudouridine synthase
Protein accession	YP_001638481
Protein GI	163850438
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAGAA TCCTCACGGT GTCCTCCACG GTGCTTTCCA TGATCCCCGG CGCGGACGAG 
GCGCGCAGCC TTGTGCTCGA CGAGGGAACC GTTCCCGAGC GGCTCGACCG CGTCCTTGCC 
CGCGTCTTCG ACGATCTCTC CCGTGCCCGG CTCCAGGGCT TGGTGCGCGA GGGCCTCGTG 
CGCTGCGACG GGATCGTGGT GCGCGATCCC GCGCGCAAGG TCGGGGCTGG CTGCCGGATC 
GATCTCAGCG TTCCGGCGCC GCTTCCCGCC GAGCCGCTCG GCGAGGCTTT GCCGCTCGCC 
GTCGTCCATG AGGACGAGGA TCTCATCGTC ATCGACAAGC CGGCGGGGCT CGTCGTGCAC 
CCGGCGGCGG GGCACGAGGA CGGCACCCTC GTCAATCGGC TGATCGCGCA TTGCGGGGCG 
AGCCTGTCCG GAATCGGCGG CGTGCGCCGG CCCGGCATCG TCCACCGCCT CGACAAGGAC 
ACGAGCGGCC TGCTCGTCGT CGCCAAGAAC GACCTCGCCC ATCAGGGCCT CTCGGCCCAG 
TTCGCCGACC ATGGCCGCAG CGGCGCCCTG GAGCGGGCCT ATCTCGCCCT GGTCTGGAAT 
GTGCCGGAGC CGCGGGCCGG CACGATCCGC GCGAACCTCG CGCGCTCGCG CCACAATCGC 
GAAAAGATCG CCGTGGTCCG CGACGGCGAG GGGCGGGAGG CGATCACCCA CTACCGGGTC 
GAGGACGTGC ACGGGGAAGG CGGCGTTACG GCCCTGCTGC GCTGCCATTT GGAAACCGGG 
CGCACCCACC AGATCCGGGT GCATCTGAGC CATCGCGGCC ATCCGCTGCT GGGGGACGCG 
GTCTATGGCG GCGCCTTCAA GACCAAGGCG GCCCGGCTCA GCGAACCCGC TCGCGCCGCC 
CTGGACGCTC TCGGACGACA GGCCTTGCAC GCGGTCGAAC TCGGATTTCT CCACCCGCGC 
TCCGGCGAGC GCCTGCGCTT CGAGAGCCCG CTGCCGGAGG ATTTTTCGCG GCTGCTCGCC 
GCCCTCGGCT GA

Protein sequence

MTRILTVSST VLSMIPGADE ARSLVLDEGT VPERLDRVLA RVFDDLSRAR LQGLVREGLV 
RCDGIVVRDP ARKVGAGCRI DLSVPAPLPA EPLGEALPLA VVHEDEDLIV IDKPAGLVVH 
PAAGHEDGTL VNRLIAHCGA SLSGIGGVRR PGIVHRLDKD TSGLLVVAKN DLAHQGLSAQ 
FADHGRSGAL ERAYLALVWN VPEPRAGTIR ANLARSRHNR EKIAVVRDGE GREAITHYRV 
EDVHGEGGVT ALLRCHLETG RTHQIRVHLS HRGHPLLGDA VYGGAFKTKA ARLSEPARAA 
LDALGRQALH AVELGFLHPR SGERLRFESP LPEDFSRLLA ALG