Gene Mlg_1429 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1429
Symbol
ID	4270427
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1632838
End bp	1633821
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	72%
IMG OID	638126185
Product	ribosomal large subunit pseudouridine synthase C
Protein accession	YP_742268
Protein GI	114320585
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.550632
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCGAC ATGAGCAACG GGCGGATAAG AGCATGAGCG GCGTACGACA GGTGCGCATC 
GGGCCGGAGG ACGCCGGCCA GCGGGTGGAC AATTTCCTGA TGCGGCAGCT CAAGGGCGTG 
CCCCGGTCAC TGATATACCG GCTGCTGCGC AGCGGGCAGG TCCGGGTCGA CGGCAAGCGC 
ACCAAACCGC CGCGCCGGCT GGCCACGGGG GAGACGGTGC GTATTCCGCC GGTCCAGACG 
CGCGCCCCCC AAGAGGCCAC GCCGCCCGCC CGCCTGCAGG GCGAATTGGC CCAGCGCATC 
CTCTACGAGG ACGACCGGCT GCTGGTGATC GACAAGCCCT CCGGACTGGC CGTGCACGGC 
GGCAGCGGAC TGGCCTGGGG GCTGATCGAG GTCTTGCGCC AGGCCCGGCC CAGCGCCCCC 
TTCCTCGAGC TGGTCCACCG GCTGGACCGC GCGACCAGTG GCTGCCTGAT GGTCGCCAAG 
CGGCGCAGCG CGTTGCGCGA ACTGCACGAG CAGCTCCGCA CGGGCGCTGT ACACAAACGT 
TATCTGGCCC TGCTCACCGG CGCACTCGGG CGCGGCCCCA TTCCGGTGGA GGCGCCGTTG 
GAGCGCCGCA GTGGACCGGC AGGGGGCGTG CGGGTCGCCA GCCACGGCAA GCTGGCGCGG 
ACGGTGTTCC GGGCCGTGGC GCGCCCCGGG GGCATGACGC TGGCGGAGGC CGATATCGCC 
ACCGGGCGCA CCCACCAGAT CCGGGTCCAC GCGGCCCACC TCGGCATGCC CATCGCCGGC 
GACGACCGCT ACGGGGAGCG GGCGGTCAAC CGCCGGTTGA GGGGGTTGGG GCTCAAGCGC 
CTGTTCCTCC ACGCCCACCG CCTGGAACTG TCCGCCCCCG GCACCGGTCA ACCCTTATCG 
ATCGAGGCGC CGCTGCCGGA CGAGCTGGCG GCGGTCGTGG CGCAGCTCCA GGCGCCGCAA 
CAATCCAATG ACTCAACGGG GTAA

Protein sequence

MRRHEQRADK SMSGVRQVRI GPEDAGQRVD NFLMRQLKGV PRSLIYRLLR SGQVRVDGKR 
TKPPRRLATG ETVRIPPVQT RAPQEATPPA RLQGELAQRI LYEDDRLLVI DKPSGLAVHG 
GSGLAWGLIE VLRQARPSAP FLELVHRLDR ATSGCLMVAK RRSALRELHE QLRTGAVHKR 
YLALLTGALG RGPIPVEAPL ERRSGPAGGV RVASHGKLAR TVFRAVARPG GMTLAEADIA 
TGRTHQIRVH AAHLGMPIAG DDRYGERAVN RRLRGLGLKR LFLHAHRLEL SAPGTGQPLS 
IEAPLPDELA AVVAQLQAPQ QSNDSTG