Gene Synpcc7942_1789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_1789
Symbol
ID	3774364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	+
Start bp	1860032
End bp	1861012
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	59%
IMG OID	637800230
Product	heat shock protein DnaJ-like
Protein accession	YP_400806
Protein GI	81300598
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0101299
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCGA CGGACTTCAA AGACTACTAC GCAACCCTCG GAGTGGGGCG TGCTGCCAGT 
GCCGATGAGA TCAAAAAAGC TTTCCGTAAG CTGGCTCGCC AGTACCACCC CGATATGAAT 
CCGGGCGACA AGGTTGCTGA GGCACGCTTT AAGGAAATCA ACGAAGCTTA CGAGGTGCTC 
TCCGACACCG ATAAGCGCCG CAAGTACGAC CAGTTTGGCC AATATTGGAG CCGAGTTGGT 
GGCCCCACAG GTGGCCCAGG GCCTGGGGTC GGCTTCGAGG ACTTTGAGTT TGGCCGCTAT 
GGCAGCTTTG ATGACTTCAT CAACGAACTG CTCGGCCGTT TTGGCGGCGG CGCGACGGCT 
AGCGCCAGTG CCGGTTATCG CAGTCCTGGT TTTCAGGATT TTGCCGGCGG TTTTGGTAGC 
CAGGCCACTG CTGGGGCTCG TGCCGTCAAT TTGGATGCTG AAGCCAGTAT TAGTCTCAGC 
CTCAGCGATG CTTTTCGGGG GACGCAAAAG CAGCTCCGCA TCAACAGCGA AATGGTTGAG 
GTCAAGGTGC CGGCTGGCAT CAAAGCAGGG AGTAAACTGC GCCTGCGGGG CAAGGGCAAC 
ATCATGCCCA ATACGGGCAA GCGCGGCGAT CTCTACCTGA AGATTGAGGT TAAGCCCCAC 
GAGTTTTTCC AGCTAGAGGG CGACCAGTTG AGCTGTGAGG TGCCGATCGC ACCGGATGAA 
GCAGCCCTCG GTGCCACGAT CGCGGTTCCC ACACCGGATG GCTTGGTCAA CGTCACGATT 
CCGGCCGGAG TTCGCACCGG ACAATCCCTG CGGCTGCGGG GTAAGGGCTG GCCAACTCGC 
ACGGGCCGCG GGGATCTGCT GGTGAAAGTG GCGATCGCGG TACCGAAAAG CCTGACCGAG 
GCAGAACGTC AGGCCTACGA ACAGTTGCAG CGGTCGCGCA GTACCGATCT GCGATCGGCA 
CTCATGCAAT ACAGCCTCTA G

Protein sequence

MAATDFKDYY ATLGVGRAAS ADEIKKAFRK LARQYHPDMN PGDKVAEARF KEINEAYEVL 
SDTDKRRKYD QFGQYWSRVG GPTGGPGPGV GFEDFEFGRY GSFDDFINEL LGRFGGGATA 
SASAGYRSPG FQDFAGGFGS QATAGARAVN LDAEASISLS LSDAFRGTQK QLRINSEMVE 
VKVPAGIKAG SKLRLRGKGN IMPNTGKRGD LYLKIEVKPH EFFQLEGDQL SCEVPIAPDE 
AALGATIAVP TPDGLVNVTI PAGVRTGQSL RLRGKGWPTR TGRGDLLVKV AIAVPKSLTE 
AERQAYEQLQ RSRSTDLRSA LMQYSL