Gene Francci3_1426 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1426
Symbol
ID	3903157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1719111
End bp	1720052
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	72%
IMG OID	637878763
Product	ribosomal large subunit pseudouridine synthase D
Protein accession	YP_480532
Protein GI	86740132
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.128873
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0393122
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCATCA CGGGCGGTGA CCTGCGGTCC CTGCCGGTCC CGGACGGGCT CGACGGCGTC 
CGTCTCGACG CGGCGATCGC GAGGATGTTC GGGCTGTCGC GGACCGTGGC CGCCGCGCTC 
GTCGACGACG GCCAGGCGAG CCTCGACGGG AAGGTCCGGG GCCGGTCCGA CCGGGTCAGC 
GGCGGTGCCT GGCTGGAGGT CCGGCTGCCC GCTCCGCCGC GTCCGGTGGC GGTGGAACCC 
ACGCCGGTCG AGGCTCTCGG CATTCTCTAC GACGACGACG ACATCATCGT GGTGGACAAG 
CCGGTCGGGG TCGCCGTCCA TCCGGCGCCC GGCTTCACCG GACCGACCGT GATCGGGGCG 
TTGGCCGCCG CGGGATACCG CATTTCCACC TCGGGCGCGG CCGAGCGTCA GGGGGTGGTG 
CACCGTCTCG ACGTCGGTAC CACCGGGGTG ATGGTGGTCG CCAAGAGCGA GCGCGCATAT 
ACCCTGCTGA AACGGGCGTT TCGTGACCGT ACGGTGGACA AGCGCTACCG GGCCGTGGTG 
CAGGGCCATC CCGATCCGCT GCGGGGCACC GTGGACGCCC CGATCGACCG GCATCCGCGC 
CGGCCGGGGC TGTTCGCCGT CGTCGCGGAC GGCAAGCCGA GTATCACCCA CTACGACCTC 
CAGGAGGCGT TCCGGGCCGC CTCCCTGCTG TCCGTGCGAT TGGAGACCGG GCGCACCCAC 
CAGATCCGGG TGCACATGTC CGCCCTGCGG CACCCGTGTG TCGGGGATCT CGCCTACGGG 
GCCGATCCCA CGCTCGCCGA GCGGCTCGGC CTGACCCGCC AGTGGCTGCA CGCGGCGCGG 
CTGTCCTTCG ATCATCCCGG TCACGGCGGA CGGGTCGAGT TCACCAGTCC GGACCCGGCT 
GACCTGGCCG AGGCGGTGGA ACGGCTGCGG GACCAGCCAT GA

Protein sequence

MTITGGDLRS LPVPDGLDGV RLDAAIARMF GLSRTVAAAL VDDGQASLDG KVRGRSDRVS 
GGAWLEVRLP APPRPVAVEP TPVEALGILY DDDDIIVVDK PVGVAVHPAP GFTGPTVIGA 
LAAAGYRIST SGAAERQGVV HRLDVGTTGV MVVAKSERAY TLLKRAFRDR TVDKRYRAVV 
QGHPDPLRGT VDAPIDRHPR RPGLFAVVAD GKPSITHYDL QEAFRAASLL SVRLETGRTH 
QIRVHMSALR HPCVGDLAYG ADPTLAERLG LTRQWLHAAR LSFDHPGHGG RVEFTSPDPA 
DLAEAVERLR DQP