Gene Apar_0839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0839
Symbol
ID	8413705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	930551
End bp	931561
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	46%
IMG OID	645022422
Product	pseudouridine synthase, RluA family
Protein accession	YP_003179859
Protein GI	257784642
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00962928
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATGAGC GTATTGTTGA AATATTAGTT GGGCCAGAAG GAGACAGCGT CAGATTAGAT 
GCGTTTCTTT CCGCTCAAGA TATGCTTCCT TCAAGAAGCG CCTGCGTCAA GCTGGTAGAA 
GAGGGAAGAG TAACCATCAA CGCCACACTC GCTACTTCTA AGTCAGAAAA ACTTATGTTG 
GGCGATAGAC TTTTGGTGTC TCTCCCAAAT GCAGAGTCTC AAACAGGTCT TTTGCGTCCA 
AATCCAGACA TTCCACTTGA TATTCGTTTT GAGGATCAGT ACCTCATAGT ACTTTCAAAG 
CAGATTGGCC TTGTCTGCCA TCCATCTCCG GGCCATGTTG ATGATACTTT GGCAAATGCT 
CTGGTTGCCC ATTGTGGCTA CGAGCATCTA GGAATGCTTC AGGGAGAAGA TCGTCCTGGT 
ATTGTGCATC GTCTTGACAT GGATACGTCC GGTCTTATGT TGGCTGTAAA GTCAGATGAG 
GCTCAGAAGG CCCTTCAAGA TCTCATCAGG CTGCGCGTAC TTGATCGACG CTACATTGTG 
TTGGTGCATG GCTATGTTGC CCATGATTCT GGCACTATTG AAACGGGCAT TGCTCGTTCA 
ACGCGAGACC GTCTAAAAAT GACTGTATCT GATGCGCCAG GTGCACGAGA AGCCATTACC 
ACCTTTAGGA CGCTTGAGCG CTTTGAGGCA GGTAGAAAAG GCGATGGTTA CTCGCTTCTT 
GAGTGTCATC TCTATACAGG TCGCACGCAC CAGATTAGAG TTCACATGCG CCACATCGGA 
CATCCTGTTG TTGGCGATCA ACTCTACGGT AAAAAAGACA CAAGTCTTAA TCTTGGTCTT 
AATAGACAAT TTCTACACTC TTGGCGTGTT CAGTTTGAGC ACCCTTTTAC AGGCGAGAAT 
ATCATAGTGG CAGATACGCT GCCAAAAGAC CTACAAGAAG CACTTATTTC TCAGCAGGAT 
ATGTCTATGG GAAGAACAAT AGCAGGAAAA GAAATCTGCC CACAGTTGTA A

Protein sequence

MNERIVEILV GPEGDSVRLD AFLSAQDMLP SRSACVKLVE EGRVTINATL ATSKSEKLML 
GDRLLVSLPN AESQTGLLRP NPDIPLDIRF EDQYLIVLSK QIGLVCHPSP GHVDDTLANA 
LVAHCGYEHL GMLQGEDRPG IVHRLDMDTS GLMLAVKSDE AQKALQDLIR LRVLDRRYIV 
LVHGYVAHDS GTIETGIARS TRDRLKMTVS DAPGAREAIT TFRTLERFEA GRKGDGYSLL 
ECHLYTGRTH QIRVHMRHIG HPVVGDQLYG KKDTSLNLGL NRQFLHSWRV QFEHPFTGEN 
IIVADTLPKD LQEALISQQD MSMGRTIAGK EICPQL