Gene Franean1_5086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5086
Symbol
ID	5673421
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6086610
End bp	6087551
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	75%
IMG OID	641243937
Product	RluA family pseudouridine synthase
Protein accession	YP_001509351
Protein GI	158316843
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00722052
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000548014
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAGCACGG CCGACACCGA CCGGCGCTCG CTGCCGGTCC CCGACGGCCT CGACGGCATC 
CGCCTGGACG CCGCCATCGC CCGCATGTTC GGCCTGAGCC GCACGGCCGC CGCCACGCTC 
GTTGACGACG GCCAGGTGAG CGTCGACGGC CAGGTCCGCG GCCGCTCCGA CCGGGTCAGC 
GGCGGCGCCT GGCTGGACGT AGCCCTCCCC GCCCCGCCCC GTCCGCTCAC GGTGGAGCCC 
ACCCCGGTCG GTGGCCTGCG CATCCTGCAC GACGACGACG ACATCGTGGT CGTCGACAAG 
CCGGTCGGCG TGGCGGCCCA CCCGGCCCCG GGGTTCACCG GCCCGACGGT CATCGGCGCG 
CTCGCCGCCG CCGGCTACCG GGTCTCCACC TCGGGCTCGG CCGAGCGCCA GGGCGTGGTG 
CACCGCCTGG ACGTCGGCAC GACCGGGGCG ATGGCTGTCG CGAAGAGTGA ACGCGCCTAC 
ACCCTTCTCA AGCGGGCCTT CCGGGAACGC GAGGTGGAGA AGGAGTACCG GGCGGTCGTC 
CAGGGGCACC CGGACCCGCT GCGCGGGACG GTCGACGCCC CCATCGACCG CCATCCCCGC 
CGGCCCGGCC TGTTCGCCGT CGTCGCGGAC GGCAAGCCCA GCGTGACCCA CTACGACACC 
GAGGAGGCGT TCCGCGCCGC CTCGCTGCTG TCGGTGCGGC TGGAGACGGG CCGCACCCAC 
CAGATCCGGG TGCACATGGC GGCGCTGCGG CATCCCTGCG TGGGCGACCT CGCCTACGGG 
GCGGATCCGA CGCTGGCCCA GCGCCTCGGG CTGACCAGGC AGTGGCTGCA CGCTGCCCGG 
CTCGCCTTCG CCCACCCGGC GGACGGCACC TGGGTCGAGT TCACCAGCCC CGATCCCGAT 
GACCTGGCCG AGGCGGTGAA GCGGCTGCGC GACCAGACGT GA

Protein sequence

MSTADTDRRS LPVPDGLDGI RLDAAIARMF GLSRTAAATL VDDGQVSVDG QVRGRSDRVS 
GGAWLDVALP APPRPLTVEP TPVGGLRILH DDDDIVVVDK PVGVAAHPAP GFTGPTVIGA 
LAAAGYRVST SGSAERQGVV HRLDVGTTGA MAVAKSERAY TLLKRAFRER EVEKEYRAVV 
QGHPDPLRGT VDAPIDRHPR RPGLFAVVAD GKPSVTHYDT EEAFRAASLL SVRLETGRTH 
QIRVHMAALR HPCVGDLAYG ADPTLAQRLG LTRQWLHAAR LAFAHPADGT WVEFTSPDPD 
DLAEAVKRLR DQT