Gene Synpcc7942_1542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_1542
Symbol
ID	3774966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	-
Start bp	1599353
End bp	1600381
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	53%
IMG OID	637799975
Product	iron-stress chlorophyll-binding protein
Protein accession	YP_400559
Protein GI	81300351
COG category
COG ID
TIGRFAM ID	[TIGR03041] chlorophyll a/b binding light-harvesting protein

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.398653
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0103257
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGACTT ACAACAACCC AGAAGTCACT TACGACTGGT GGGCTGGCAA TGCCCGCTTT 
GCCAATCTCT CGGGTCTCTT CATTGCGGCT CACGTGGCCC AAGCAGCACT GATCATGTTT 
TGGGCCGGTG CTTTCACGTT GTACGAAATC TCTTGGCTCA CTGCAGACCA GTCCATGGGT 
GAGCAAGGCC TCATTCTGCT GCCGCATCTA GCCACCCTTG GATTAGGTGT GGGCGATGGC 
GGACAGGTGA CAGACACTTA TCCACTCTTT GTCGTGGGTG CCGTTCATCT GATCGCCTCC 
GCAGTCTTGG GCGCGGGTGC CCTATTCCAC ACATTCCGAG CACCCAGTGA TTTGGCAGCT 
GCATCGGGAG CTGCTAAGCG GTTCCACTTC GACTGGAATG ATCCCAAACA ACTAGGCCTC 
ATTCTGGGAC ACCACTTGCT GTTCCTCGGG GTTGGAGCAT TGCTGCTGGT GGCAAAGGCA 
ACAACTTGGG GTGGCCTATA CGACGCAGCC AGTCAGACAG TCCGTTTGGT AACAGAACCG 
ACGCTTAATC CAGCGGTGAT TTATGGTTAT CAGACTCATT TCGCCAGCAT TGATAACCTT 
GAAGACTTAG TCGGTGGCCA TGTTTATGTT GGCGTCATGC TAATTGCCGG AGGCATTTGG 
CACATTTTGG TTCCGCCATT TCAATGGACT AAAAAAGTCT TGATCTACTC TGGCGAAGCA 
ATTCTGTCGT ACTCCTTGGG TGGCATCGCT CTCGCCGGTT TTGTCGCTGC TTACTTCTGC 
GCCGTCAACA CCCTAGCGTA CCCCGTGGAA TTCTACGGTG CGCCGCTGGA AATCAAATTA 
GGTGTCACTC CCTACTTTGC AGATACGGTT CAACTGCCCT TTGGTGCCCA TACGCCTCGT 
GCTTGGCTAT CCAATGCCCA CTTCTTCTTG GCTTTCTTCT GCCTACAAGG CCATCTCTGG 
CATGCTTTAC GGGCAATGGG CTTCGACTTT CGTCGAGTTG AAAAAGCACT CAGCTCTGTA 
GAAGCCTAA

Protein sequence

MQTYNNPEVT YDWWAGNARF ANLSGLFIAA HVAQAALIMF WAGAFTLYEI SWLTADQSMG 
EQGLILLPHL ATLGLGVGDG GQVTDTYPLF VVGAVHLIAS AVLGAGALFH TFRAPSDLAA 
ASGAAKRFHF DWNDPKQLGL ILGHHLLFLG VGALLLVAKA TTWGGLYDAA SQTVRLVTEP 
TLNPAVIYGY QTHFASIDNL EDLVGGHVYV GVMLIAGGIW HILVPPFQWT KKVLIYSGEA 
ILSYSLGGIA LAGFVAAYFC AVNTLAYPVE FYGAPLEIKL GVTPYFADTV QLPFGAHTPR 
AWLSNAHFFL AFFCLQGHLW HALRAMGFDF RRVEKALSSV EA