Gene Synpcc7942_1112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_1112
Symbol
ID	3775062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	-
Start bp	1129444
End bp	1130385
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	60%
IMG OID	637799538
Product	ribosomal large subunit pseudouridine synthase D
Protein accession	YP_400129
Protein GI	81299921
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.0997976
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.952064
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGATC GCCTGCAACT AGAAATCACA GAAGTGCCTT CTGAGCGGCT CGATCGTTGG 
CTTGCCCAGC AGTGGCCGCA TCTGTCGCGG GCACGCCTCC AGAAACTGAT TGCAGCGGGT 
CAGCTGCGGG TCAATGGAGA AGTCTGTGAT CAGAAGCGCT GGCAGCCGCG TTTGGGCGAT 
CGCCTCGAAC TGGAAATGCC TCCGACGGAA GCAATCGCGC TAGCCCCTGA AGAGATTCCC 
CTCGACATCC TTTATGAAGA TGCTGACCTA TTGATCGTCA ACAAAGCCGT GGGGATGGTG 
GTGCATCCGG CGGCGGGACA TGACACTGGT ACGCTCGTCC ATGCTCTGCT AGCCCACTGC 
GGTGACTCCC TGACGGGCAT TGGTGGGGAA CAGCGGCCGG GTATTGTCCA TCGTCTAGAC 
AAGGACACCA CAGGGGCGAT GGTGGTGGCG AAAACAGAAG CCGCCCTGCT GTCTTTACAA 
GATCAAATCC GCCAGAAAAC CGCCCAGCGG GAATATCTGG GTGTGGTCTT TGGTTCGCCT 
CGTCAAGATA GTGGCCAGGT TGAAGAGCCG ATTGGCCGCC ATCTGCGCGA TCGCAAACGA 
ATGGCGGTTG TACCGATTGA ACGGGGCGGG CGTTGGGCAC TCACCCACTG GCAGGTCAGG 
GAACGGCTCG GTAACTATGC GCTGCTGCAC TATCGGCTGG CAACGGGCCG CACCCACCAA 
ATCCGCGTTC ACAGTCATCA CATGGGGCAT CCACTAGTGG GCGATCCGCT CTACGGCAAT 
GGGCGATCGC TCGGGGTCAA TCTGCAGGGA CAAGCCCTCC ATGCCTGGCG ACTGAGTTTG 
CAACATCCCC GCACGGGCGA GGTGATCGCG GTGGAAGCCC CACTACCGGC AGAATTTCAA 
CGTCTGTTGC GTGTCCTTCG CGATCGGAGT GCCCAATCGT GA

Protein sequence

MSDRLQLEIT EVPSERLDRW LAQQWPHLSR ARLQKLIAAG QLRVNGEVCD QKRWQPRLGD 
RLELEMPPTE AIALAPEEIP LDILYEDADL LIVNKAVGMV VHPAAGHDTG TLVHALLAHC 
GDSLTGIGGE QRPGIVHRLD KDTTGAMVVA KTEAALLSLQ DQIRQKTAQR EYLGVVFGSP 
RQDSGQVEEP IGRHLRDRKR MAVVPIERGG RWALTHWQVR ERLGNYALLH YRLATGRTHQ 
IRVHSHHMGH PLVGDPLYGN GRSLGVNLQG QALHAWRLSL QHPRTGEVIA VEAPLPAEFQ 
RLLRVLRDRS AQS