Gene Acel_1138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1138
Symbol
ID	4484626
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	1266142
End bp	1267377
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	69%
IMG OID	639729913
Product	SufS subfamily cysteine desulfurase
Protein accession	YP_872896
Protein GI	117928345
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.730169
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.0524008
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTTCG ACGTCGACGT CGTGCGGAAG GATTTTCCGA TCCTTGAGCG CACGGTGCGG 
GATGGACGGC CGCTGGTCTA CCTCGACAGT GCCAACACGT CGCAGAAGCC GCGCGCCGTC 
CTCGACACGC TCACCGCCTT CTATGAACGG CACAACGCGA ACATCCACCG CGCGACCCAC 
GCCCTGGGCG AAGAGGCGAC CGAGGCGTAC GAGACCGCGC GGATGAAGGT CGCGGACTTC 
ATCGGTGCCG GTGCAGCGGA AGAGGTCGTC TTCGTCAAGA ACTCCTCGGA GGCGCTCAAC 
CTGGTAGCCA ATGTGCTGAG CTGGGGGCCG CGGGCGGTCG GTCCCGGTGA CGAGATCGTC 
ATCACCGAGA TGGAGCACCA CTCGAACATC GTGCCCTGGC AGATCCTCTG TGAGCGGACC 
GGCGCCCGGC TCCGCTGGTT CGGCGTCACC GATGACGGCC GCCTCGACCT GGACGGCATG 
GACGACCTGC TCACCGAGCG CACCCGGGTC CTCGCCGTCG TCCACGTTTC GAACGTCCTG 
GGCACGGTGA ACCCGATCCC GCTCCTTGCC GAACGCGCCC ACCAGGTAGG GGCGCTCGTG 
GTCGTCGATG CGTCGCAGTC CGTCCCGCAC ATGCCGGTGG ATGTGGCCGC GTTGGGCGCG 
GACTTCCTGG CTTTCACCGG GCACAAGATG TGCGGACCGA CCGGCATCGG CGTGCTCTGG 
GGACGCCGCG ACCTGCTCGA GGAGCTGCCG CCGTTCCTCG GCGGCGGCGA AATGATCGAG 
ACGGTCACCA TGGAGAAGTC CACGTACGCC GCCGTGCCGC ACAAGTACGA GGCCGGCACA 
CCGCCGATCG CGCAAGCGGT GGGACTCGGC GCCGCGGTCG ATTACCTGCG CAGCATCGGC 
ATGGACCAGA TCGCGGCGCA CGAGCGGGAG CTCACCGCGT ACGCCCTCGG GCGGCTCACG 
GAACTTCCCG GCGTGCGCAT CCTCGGCCCG ACGGAAGCGG TCGACCGGGG GAGCGCGATC 
TCGTTCGTGG TGGACGGCGT CCACCCCCAC GACGTCGCCC AAGTGCTGGA TGCGCACGGC 
GTGGCAGTCC GCGCCGGCCA CCACTGCGGC CGGCCGATCC ACCTGCGCTT CGGGGTTGCC 
GCGTCGACCC GCGCATCCTC GTACCTGTAC ACCACCGAGG GGGAGATCGA CGCCCTCGTC 
ACGGGATTGC ACGCGGTGCG GAGGTTCTTC GCCTGA

Protein sequence

MAFDVDVVRK DFPILERTVR DGRPLVYLDS ANTSQKPRAV LDTLTAFYER HNANIHRATH 
ALGEEATEAY ETARMKVADF IGAGAAEEVV FVKNSSEALN LVANVLSWGP RAVGPGDEIV 
ITEMEHHSNI VPWQILCERT GARLRWFGVT DDGRLDLDGM DDLLTERTRV LAVVHVSNVL 
GTVNPIPLLA ERAHQVGALV VVDASQSVPH MPVDVAALGA DFLAFTGHKM CGPTGIGVLW 
GRRDLLEELP PFLGGGEMIE TVTMEKSTYA AVPHKYEAGT PPIAQAVGLG AAVDYLRSIG 
MDQIAAHERE LTAYALGRLT ELPGVRILGP TEAVDRGSAI SFVVDGVHPH DVAQVLDAHG 
VAVRAGHHCG RPIHLRFGVA ASTRASSYLY TTEGEIDALV TGLHAVRRFF A