Gene Cyan8802_1811 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_1811
Symbol
ID	8391125
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	1842930
End bp	1844135
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	46%
IMG OID	644979798
Product	cysteine desulfurase NifS
Protein accession	YP_003137545
Protein GI	257059657
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR03402] cysteine desulfurase NifS

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGACT GCATTTATCT TGATAATAAT GCAACCACTC AAGTTGATGA GGAAGTATTA 
GGCGCAATGT TGCCTTACCT CACTCTCTAT TACGGAAACC CTTCGAGTAT GCACACTTTT 
GGCGGACAAG TTGGCAGTGC CATTAAAACC GCAAGAGAAC AGGTGGCTGC TTTATTAGGG 
GCCGAACCCT CGGAAATTGT CTTTACCAGT TGTGGAACGG AAGGGGATAA TGCAGCTATT 
CGCGCTGCGT TGGCTGCCCA ACCTAATAAA CGGCACATTA TCACCACAGA AGTCGAACAT 
CCGGCGATTT TGAATCTCTG CAAAAATTTA GAACGCCAGG GTTACACCGT TACCTATCTG 
TCGGTGAATA ACCAAGGACA GCTTGATCTC AGTGAACTAG AAGCGTCCTT AACCGGAAAT 
ACTGCCGTTG TCTCCATCAT GTATGCCAAC AACGAAACGG GGGTGATCTT CCCGGTGGAA 
CAGGTGGGAC AGATGGCGAA AGAATACGGG GCTCTGTTCC ATGTGGATGC AGTGCAAGCG 
GTGGGTAAAG TGCCTTTGAA TATGGCTGAA AGTACCATCG ATATGTTAAC CCTCTCCGGT 
CATAAAATTC ATGCTCCCAA GGGGATTGGT GCATTGTATG TCCGTCGTAA TACTCGTTTT 
CGTCCTTTGT TAATTGGCGG ACATCAAGAA CGGGGTCGTC GTGCCGGAAC CGAAAATGTG 
CCAGGGATCG TTGCGTTAGG CAAAGCCGCC GAATTGGCAG CCTATCACCT ACAATACGGG 
ACCTCTGAAC GGGAATTACG GGATTATTTA GAACAGACAA TTCTCACCAT TATTCCCGAT 
ACAGTATTAA ATGGTCATCC CGTACAGCGA TTACCGAATA CCTCAAATAT TGGTTTTAAA 
TTTATTGAAG GGGAAGCTAT TCTTTTATCC CTGAATCAAT ACGGAATCTG TGCTTCTTCG 
GGGTCAGCTT GTACCTCTGG ATCCCTAGAA CCTTCCCATA TTTTACGCGC AATGGGTCTT 
CCTTATAGTG TTTTACACGG CTCAATTCGC TTTAGTTTAT CGCGCTTTAC GACCCAAGAG 
CAAATCCAAA AAGTCCTCGA AGTTTTACCC GGAATTATTG ACCGACTCAG AGCGTTATCG 
CCGTTTAACA GCGATGAAGC AGGTTGGTTA GTTGAACAAG AAAAAGCCGC CTTAGCTAAG 
TCATAA

Protein sequence

MKDCIYLDNN ATTQVDEEVL GAMLPYLTLY YGNPSSMHTF GGQVGSAIKT AREQVAALLG 
AEPSEIVFTS CGTEGDNAAI RAALAAQPNK RHIITTEVEH PAILNLCKNL ERQGYTVTYL 
SVNNQGQLDL SELEASLTGN TAVVSIMYAN NETGVIFPVE QVGQMAKEYG ALFHVDAVQA 
VGKVPLNMAE STIDMLTLSG HKIHAPKGIG ALYVRRNTRF RPLLIGGHQE RGRRAGTENV 
PGIVALGKAA ELAAYHLQYG TSERELRDYL EQTILTIIPD TVLNGHPVQR LPNTSNIGFK 
FIEGEAILLS LNQYGICASS GSACTSGSLE PSHILRAMGL PYSVLHGSIR FSLSRFTTQE 
QIQKVLEVLP GIIDRLRALS PFNSDEAGWL VEQEKAALAK S