Gene Cagg_0958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0958
Symbol
ID	7268031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1186102
End bp	1187340
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	58%
IMG OID	643565806
Product	cysteine desulfurase, SufS subfamily
Protein accession	YP_002462312
Protein GI	219847879
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACTT TGTCTCAATT TGATGTGATC GCTTTGCGGC GCGAGTTTCC GATTTTGCAT 
CAGCAGGTGA ATGGCAAGCC GCTGGCGTTT CTCGATAGTG CGGCTTCATC TCAAAAGCCA 
CAGCGCGTTA TCGAGACGCT GGAAGATTAC TACCGGCGCT ATAATGCCAA CGTGCATCGT 
GGGATTTACC GGCTGAGCGA GGAGGCGACG TTTGCCTACG AGCGAGCACG TGGTAAGCTG 
GCCCGTCTGA TCAATGCACC AAGTCAGCGC GAAGTGATCT TTGTGCGGAA TACCACCGAG 
GCGATCAATC TGGTTGCGTA TTCGTGGGGG AGTGCCAATG TTCGGGCCGG TGACCGCATC 
TTGCTCACGA TGATGGAACA CCATTCCAAT ATCGTGCCGT GGCAGTTGTT GGCGCAACGC 
ACCGGTGCTG AGTTGGTCTA TTTGCCGTTT GACGGTCAGG GGCGGTTGGT ACTCGATGAC 
CTCGACCGTT TGCTCGATGA ACGGGTGAAG TTGGTTGCGT TTACGCACCA ATCGAACGTC 
TTCGGGACGA TTAACCCGGT TGAACCGATT GTGGCGCGGG CCCGCACGGT TGGCGCACGG 
GTACTGCTCG ATGCTGCGCA GAGTGTACCA CATATGCCGG TAGACGTGCA GGCGTTAGGG 
GTCGATTTTC TTGCCTTTAG TGGACATAAG ATGTGTGGTC CGACCGGAAG CGGCGTGCTA 
TGGGGGCGGC GTGAGCTGCT CAACGCGATG CCGCCGTTTC TCGGTGGTGG CTCGATGATC 
GACCTGGTTG AACTGGATCA CAGCACGTTT GCCGCCGCGC CGACTCGGTT TGAGGCGGGC 
ACGCCGGCGA TTGGTGAGGC AATTGCGCTC GGTGAAGCAG CCGATTACCT GCAAGAGGTC 
GGTTTGACGG CGATCCACCA CTACGAGCAA GAATTGACGG CATATGCCCT CGAACGTTTG 
GCCGAGGTAC CGGGCCTGAC CGTCTATGGG CCACCGGCAG GGGCGGATCG GGGTGGTGCA 
GTGAGTTTCT CGCTCGAAGG AGTGCATCCG CACGACGTAG CCGCTATCCT CGATCAAGAA 
GGGGTGGCGG TGCGGGCCGG CCATCATTGT ACGCAGCCAC TCCATCGGGT GCTTGGCGTA 
CCGGCAACGA CCCGGGCTAG CTTCTATCTC TACAATTTGC CCGAAGAGAT CGATCGGTTG 
GTGGCGGCAT TGCATAAGGC ACGTCACATC TTTGCCTAG

Protein sequence

MATLSQFDVI ALRREFPILH QQVNGKPLAF LDSAASSQKP QRVIETLEDY YRRYNANVHR 
GIYRLSEEAT FAYERARGKL ARLINAPSQR EVIFVRNTTE AINLVAYSWG SANVRAGDRI 
LLTMMEHHSN IVPWQLLAQR TGAELVYLPF DGQGRLVLDD LDRLLDERVK LVAFTHQSNV 
FGTINPVEPI VARARTVGAR VLLDAAQSVP HMPVDVQALG VDFLAFSGHK MCGPTGSGVL 
WGRRELLNAM PPFLGGGSMI DLVELDHSTF AAAPTRFEAG TPAIGEAIAL GEAADYLQEV 
GLTAIHHYEQ ELTAYALERL AEVPGLTVYG PPAGADRGGA VSFSLEGVHP HDVAAILDQE 
GVAVRAGHHC TQPLHRVLGV PATTRASFYL YNLPEEIDRL VAALHKARHI FA