Gene Acid345_3345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3345
Symbol
ID	4071263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3967692
End bp	3968693
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	59%
IMG OID	637985367
Product	ribosomal large subunit pseudouridine synthase D
Protein accession	YP_592420
Protein GI	94970372
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGGCG CACAACACAT CCAGGTCAGC GCAGACGACG CGAACATTCG CCTGGATCAA 
TATCTCGTCT CGCATCTCCC CGACGTCTCA CGCGCTCGCG TACAGGCGCT GATCGACGAC 
GAAAAGATCC TGGTAGACGG AAAGTCCTCC AAGCCGTCCT ATAAGCTGCG CGGAAGCGAA 
GTGATCGATG TCGTCGGCGA ATATCAGCCG CCGCCGTTGC GCGCGATTCC CGAAGATATT 
CCGCTCGATG TGGTGTACGA AGACGATGAT CTCGCGGTCA TCAACAAGCC GGCAGGAATG 
ATGGTGCATG TTGGCGCTGG TGCAACGGAG GAAGAGCGTA ATCGCGGGAC GCTGGTGAAT 
GCGCTGCTGT ATCGGTTCCG AGCGCTGTCA GAAGTCGGCG GCGACATGCG GCCCGGTATC 
GTTCACCGCT TGGACAAAGA GACCAGCGGA CTGATCGTGG TTGCGAAGAA CGACGTTGCG 
CACCGCAAGC TCGCGGAACA GTTTTCCTCG CGACGGGTTC ATAAGAAGTA CGTGGCTCTG 
GTGCATGGAT GGCCGAAGAA ACTGAAGGGA ACCATCAACC TGCCGATCGC GCGCGACATG 
TCGCGCCGCA CGCGGATGAC GACCCGCGGG TCAGGTGGAC GCGATGCGCT GAGCCACTAC 
GAAGTGAAGG AGAAGATCGA GTCTCCGTAC GGCAAGTTCG CGCTGGTCGA GGTGAAGATC 
GAGACCGGCC GCACCCACCA GATCCGCGTG CATATGGCCA GTTTGGGCCA TCCGGTGGTG 
GGCGACACGC TCTACGGTGC GCCGGGTGAG TTGCGGGTTA CGAAGGCGTT GAAAGGGATG 
CCATCGAAGA TGGCGTCCCT GGAGCGAAAT TTCCTCCACG CGGCAGAAAT CGAATTGCAG 
CAGCCCGCAA CGGGAAAAGC ACTGCGTTTT GTAACCAAAG TTCCAGCGGC ACTAGAGGAT 
TTCGCTGAGA CATTGCGGCA TCCGGAAGTA CGCGGGACGT AG

Protein sequence

MDGAQHIQVS ADDANIRLDQ YLVSHLPDVS RARVQALIDD EKILVDGKSS KPSYKLRGSE 
VIDVVGEYQP PPLRAIPEDI PLDVVYEDDD LAVINKPAGM MVHVGAGATE EERNRGTLVN 
ALLYRFRALS EVGGDMRPGI VHRLDKETSG LIVVAKNDVA HRKLAEQFSS RRVHKKYVAL 
VHGWPKKLKG TINLPIARDM SRRTRMTTRG SGGRDALSHY EVKEKIESPY GKFALVEVKI 
ETGRTHQIRV HMASLGHPVV GDTLYGAPGE LRVTKALKGM PSKMASLERN FLHAAEIELQ 
QPATGKALRF VTKVPAALED FAETLRHPEV RGT