Gene Mlg_1835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1835
Symbol	truD
ID	4268190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2094075
End bp	2095106
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	74%
IMG OID	638126591
Product	tRNA pseudouridine synthase D
Protein accession	YP_742669
Protein GI	114320986
COG category	[S] Function unknown
COG ID	[COG0585] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00094] tRNA pseudouridine synthase, TruD family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.151087
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGCACTG AGCAAGCCGC GTCCCTGCCC CGCGCCTGGG GCCCCCCGCT GGGCACGGCG 
CGCCTCAAGG CCACCCCGGA GGACTTCCTG GTCGAGGAGC AGACCGGGCT CTGCCCTTGC 
GGCGACGGGG AGCACCTGTG GCTGTGGGTG GAAAAGCGGG GTCTGAACAC CGCGCAGGTG 
GCCCGGGCGC TGGCCGAGGC CGCCGGCATC CACCCGCGGG CGGTCTCCTT TGCCGGCCTG 
AAGGACAAAC ACGCCCTGAC CCGCCAGTGG TTCAGCCTGC AGTCGCCCGG TCGGTCGCTG 
CCCCTGGGCG TGGGGGAGGG GCCGATCCCG GGCGTGCGCA TCCTGATCGC CCGGCGCCAC 
CATCGAAAGC TGCGCACCGG GGCCCTCAAG GGCAACCGGT TCGTGCTGAC CCTGCGGGAC 
TGCGACGCCG ATCCGGCGGC GGTGGCACAG CGCCTCTACC GCATCAGCAC CCAGGGCGTG 
CCCAACTACT TCGGCCACCA GCGCTTCGGG CGTGGCGGCG GCAATCTGGC CCAGGCCTCG 
GCCTGGTTCG CCGGCGGGCG TCCGCCCCGC GACCGCAAGC TGCGCGGCCT GCTGCTCTCC 
AGCGTGCGGT CCGAGCTGTT CAATCGGGTG CTGGCGCGGC GGGTCGGGGA GGGCAGTTGG 
AACCGACTGT TGCCGGGCGA GGTGGCCATG CTCGATGGGC GCGGAGCGGT GTTCGAGACC 
GATCCGGCCG ACCCCGCTCT GCCCGGGCGG TGTGCCCGTC TGGAGATCCA CCCCACGGGG 
CCACTGGCGG GCGAGCGCGG GGTGCAGCCC GGCGGCGAGG TCGCGGCCCT GGAGCGGTCG 
GTATTGGCGG CCGAACCCCT CTGGCACCAG GGCCTGGCGC GGGCAAGGAT GGAGGCGGCG 
CGCCGTGCGC TGCGCCTGCG GGTGGTCGAT CTCGCCTGGC ATTGGCCGGC GCCGGGCCGG 
CTCCAACTTA GTTTCCGGCT GCCTGCCGGG GCCTATGCCA CCGTGGTGGT ACGGGAGGTG 
TTGGAGTGTT GA

Protein sequence

MSTEQAASLP RAWGPPLGTA RLKATPEDFL VEEQTGLCPC GDGEHLWLWV EKRGLNTAQV 
ARALAEAAGI HPRAVSFAGL KDKHALTRQW FSLQSPGRSL PLGVGEGPIP GVRILIARRH 
HRKLRTGALK GNRFVLTLRD CDADPAAVAQ RLYRISTQGV PNYFGHQRFG RGGGNLAQAS 
AWFAGGRPPR DRKLRGLLLS SVRSELFNRV LARRVGEGSW NRLLPGEVAM LDGRGAVFET 
DPADPALPGR CARLEIHPTG PLAGERGVQP GGEVAALERS VLAAEPLWHQ GLARARMEAA 
RRALRLRVVD LAWHWPAPGR LQLSFRLPAG AYATVVVREV LEC