Gene Synpcc7942_1738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_1738
Symbol
ID	3775438
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	+
Start bp	1808413
End bp	1809672
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	57%
IMG OID	637800177
Product	cysteine desulfurase
Protein accession	YP_400755
Protein GI	81300547
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.948748
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCGA TCGCCCTGAC CAATCTTGCG ACTGAGGTTC GTGCCGACTT TCCGATCCTG 
CAGCAGCAGG TCAACGGTCA GCCCTTGGTC TATCTCGACA ATGCGGCCAC TTCGCAAAAA 
CCGAGAGCGG TGATCCAGTC CCTCGTCGAT TACTACGAGG GCTACAACAG CAACGTCCAT 
CGCGGCGTCC ACACCCTGAG CGGCAAGGCA ACGGATGCCT ACGAAGGGGC ACGGCAAAAG 
GTGGCGCGGT TCATCAACGC CAAGACGGAA CAGGAGATTG TCTACACCCG CAATGCCAGC 
GAGGCGATCA ACCTCGTCGC CTACAGCTTC GGCATGAACT TTCTCCAAGC CGGTGATGAG 
ATCATCCTCT CGGCGATGGA GCACCACAGC AACCTAATCC CTTGGCAGTT TGTGGCAGCG 
AAAACAGGAG CGGCGCTGAA ATTCGTCGGG GTGACTGAGA CCGGTCAGTT CGACCTCGAG 
CAGTTCCGTA GCCTCCTCAG CGATCGCACC AAACTGGTGT CGGTCGTCCA TGTTTCTAAT 
ACGCTAGGTT GCTGCAATCC GGTCACGGAA ATTTGTCAGC TCGCCCATGC CAAGGGTGCG 
CGGGTGTTGA TTGATGCCTG CCAAAGTCTT CCCCACCAGG CGATCGATGT TCAGGCGATC 
GATTGCGATT GGCTGGTTGG CTCTGGCCAC AAAATGTGTG CACCGACGGG CATTGGTTTC 
CTCTACGGCA AGCTCGACCT GTTGCGTCAA ATGCCGCCCT TCCTCGGCGG TGGTGAAATG 
ATCGCCGATG TCTTCCTTGA TCACGCAACT TACGCCGATC TTCCTCACAA ATTCGAAGCA 
GGAACACCGG CAATTGGAGA AGCGATCGCA TTGGGCGCGG CGATTGATTA TCTAACCGCG 
ATCGGCATGG ATCGCATTCA CGCCTACGAA CAGCAGCTAA CCCAACACCT CTTCCAACGG 
CTGGCAGAAA TTCCTGAGCT GACCGTCTAC GGACCTACGC CGGAGCAAGA TCGCGATCGC 
GCTGCCCTCG CCGCCTTTAC CGCCGGTGCA GTCCATCCCC ACGATCTCTC GACCATCCTC 
GACCAGTCAG GCATTGCGAT TCGAGCCGGG CATCACTGCA CTCAGCCACT GCACCGTGAA 
TTACAAGTCC AATCAACGGC GCGGGCTAGT TGTTATTTCT ACAATACGAC TGACGAGATC 
GATCGTCTGA TCGAGTCTCT CAAGGAAGCC GTTGAGTTCT TTGGAGCGAT TTTCAGCTAG

Protein sequence

MTAIALTNLA TEVRADFPIL QQQVNGQPLV YLDNAATSQK PRAVIQSLVD YYEGYNSNVH 
RGVHTLSGKA TDAYEGARQK VARFINAKTE QEIVYTRNAS EAINLVAYSF GMNFLQAGDE 
IILSAMEHHS NLIPWQFVAA KTGAALKFVG VTETGQFDLE QFRSLLSDRT KLVSVVHVSN 
TLGCCNPVTE ICQLAHAKGA RVLIDACQSL PHQAIDVQAI DCDWLVGSGH KMCAPTGIGF 
LYGKLDLLRQ MPPFLGGGEM IADVFLDHAT YADLPHKFEA GTPAIGEAIA LGAAIDYLTA 
IGMDRIHAYE QQLTQHLFQR LAEIPELTVY GPTPEQDRDR AALAAFTAGA VHPHDLSTIL 
DQSGIAIRAG HHCTQPLHRE LQVQSTARAS CYFYNTTDEI DRLIESLKEA VEFFGAIFS