Gene Synpcc7942_1929 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_1929
Symbol
ID	3775292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	+
Start bp	2003133
End bp	2004293
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	62%
IMG OID	637800371
Product	cysteine desulfurase
Protein accession	YP_400946
Protein GI	81300738
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.685974
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAACCT ACTTGGACTA CAGCGCCACG ACCTCGATGC GGCCTGAGGT TTTGGAGCGT 
TTCACGGCCG TTGCCCAAGA GCAGTGGGGC AATGCAGCTA GCTTGCACCA GTGGGGTAAT 
CGCGCAGCCC TCGTGCTAGA GCGATCGCGC CAGCAGGTCG CGGCCCTGAT CCAAGCGGAA 
CCGGAGGCAA TCGCCTTTAG CTCCGGCGGT ACGGAATCGG ATAACTGGGC AATTCTCAGT 
CCCTATCTTG CAGACCCGCG GCCGGGGCAT CTGATCATCT CCGCCGTCGA ACATTCCGCG 
ATCGCTCGGC CAGCCGCTTG GCTAGAGCAA CGGGGCTGGC AGGTAACGCG CTTGCCGGTT 
GATCGTAGCG GCCGCATTCA ACCCGCGGAT CTGGCCAGTG CGGTTCGCCC AGACACCCGC 
CTGATCTCAG TGATCTGGGG TCAAAGCGAA GTCGGAACGA TCCAACCGAT CGCAGAGCTT 
GCCGCGATCG CTCGTGAACA TGGCATCCTC TTCCACACCG ACGCGGTCCA AGTAGCGGGA 
CGTTTACCGA TCGATGTGCA GCGGCTGCCG ATCGATTTGC TCTCGCTCTC CAGCCATAAA 
CTCTACGGTC CCCAAGGAGT TGGGGCACTC TACATTCGGC CAGGTGTTGA GTTAGCGCCC 
CTCCTGCAGG GTGGGAATCA AGAAAGTGGC CTGCGCTCGG GAACGCCACC GATTGCTGCG 
ATCGCGGCCT TTGGTGAAGC CGCCCAGCTT GCCGCCGCCG AACTCCCCCA CGAGACGGCG 
CGCCTCCAAT CCCTGCGCGA TCGCCTCATT GCGGTACTGG CCACCGAACC CCGTCTCAGG 
CTGACAGGTG ACCCCATCCA GCGGCTGCCC CATCATGCCA GTTTTATCGC CCGAGGTGGC 
ACAACTGGGA CCAGTCAACA GCTGGTACGA GCCATGAATC GGCTGGGTTT TGGCATCAGT 
GGCGGTTCTG CTTGCAACAG TGGCCGCAGC CAGCCCAGTC CCGTCCTGCT AGCCATGGGG 
TATAGTCCCC AAGAAGCCTT GGCAGGTATT CGTTTCAGCC TGGGTCGATC GACCCAGTTG 
GCTGAGGTAG AAGCGGCGGC GATCGCCCTG CGATCGGCGC TCCACAGCTT GCCCCAAGCC 
TCGTTGTTGT CTCCGGCCTA A

Protein sequence

MSTYLDYSAT TSMRPEVLER FTAVAQEQWG NAASLHQWGN RAALVLERSR QQVAALIQAE 
PEAIAFSSGG TESDNWAILS PYLADPRPGH LIISAVEHSA IARPAAWLEQ RGWQVTRLPV 
DRSGRIQPAD LASAVRPDTR LISVIWGQSE VGTIQPIAEL AAIAREHGIL FHTDAVQVAG 
RLPIDVQRLP IDLLSLSSHK LYGPQGVGAL YIRPGVELAP LLQGGNQESG LRSGTPPIAA 
IAAFGEAAQL AAAELPHETA RLQSLRDRLI AVLATEPRLR LTGDPIQRLP HHASFIARGG 
TTGTSQQLVR AMNRLGFGIS GGSACNSGRS QPSPVLLAMG YSPQEALAGI RFSLGRSTQL 
AEVEAAAIAL RSALHSLPQA SLLSPA