Gene Gdia_0473 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0473
Symbol
ID	6973868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	518134
End bp	519102
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	69%
IMG OID	643390006
Product	pseudouridine synthase, RluA family
Protein accession	YP_002274884
Protein GI	209542655
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.000500273
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCGACG ACACCCAACC CATCCGCCTG ACGCCCGAGA CGGAGCATGC CGGCCAGCGT 
ACCGACCGTT TCCTGGCCGA TATGGTGGGG ACGCTGTCGC GCTCGCGCGT CAAGGCGCTG 
ATGGAGGGCG GCCATGTCCT GCGCGACGGC CATGTCCTGC GCGAACCGGC CGACCCGGTC 
CGGGCGGGTC TGTGTTATGA GATAAGGATG CCCCCGGCAA TCCCGGCGAC ACCCCGGGCG 
CAGGCCATTC CCTTCGCCAT CCTGTACGAG GATTCGGACC TGATCGTGCT GGACAAGCCC 
GCCGGGCTGG TCGTGCATCC CGCGCCGGGC AACGAGGACG GGACGCTGGT CAACGCCCTG 
CTGGCGCATT GCGGCGACAG CCTGACCGGC ATCGGCGGCG AACGCCGGCC GGGCATCGTG 
CACCGGCTGG ACAAGGATAC GTCGGGCGTC ATGGTGGTGG CCAAGACCGA GCAGGCGCAT 
ACCGCCCTGT CGGACGCGTT CGCCGCGCGC GATATCGACC GCACCTATCT GGCGCTGGCC 
TGGGGCATCC TGTCACCGGC CAGCGGCACG TTCGAGGGCG CGATCGGCCG CGACAGGCGC 
GACCGCAAGC GCATGGCCGT GGTCACGCAC GGCGGCAAGC ACGCCATGAC GCACTACAGG 
ACGCTGCACA GCTTCCATGG CGGGATCAGT TCCGTCGAAT GCCGGCTGGC GACGGGCCGC 
ACGCACCAGA TCCGCGTGCA TTTTTCCACC AGCGGCCATC CGCTGGTCGG CGACCCGGTC 
TATCTGCGCC GCATTCCCGC CGCCGCCCGC GCCCTGCCCG AGGATGCACG CCGCGCGGCG 
CTGGATTTTC CGCGCCAGGC ATTGCATGCG GCGCGACTGG GCTTTACCCA CCCCCGCACC 
GGCGAATCCC TGCTGTTCGA AACCGCGCCC CCGGACGATT TCAAGACGTT GCTGGCAAAG 
ATTGCTTAG

Protein sequence

MTDDTQPIRL TPETEHAGQR TDRFLADMVG TLSRSRVKAL MEGGHVLRDG HVLREPADPV 
RAGLCYEIRM PPAIPATPRA QAIPFAILYE DSDLIVLDKP AGLVVHPAPG NEDGTLVNAL 
LAHCGDSLTG IGGERRPGIV HRLDKDTSGV MVVAKTEQAH TALSDAFAAR DIDRTYLALA 
WGILSPASGT FEGAIGRDRR DRKRMAVVTH GGKHAMTHYR TLHSFHGGIS SVECRLATGR 
THQIRVHFST SGHPLVGDPV YLRRIPAAAR ALPEDARRAA LDFPRQALHA ARLGFTHPRT 
GESLLFETAP PDDFKTLLAK IA