Gene Afer_0567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Afer_0567
Symbol
ID	8322626
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidimicrobium ferrooxidans DSM 10331
Kingdom	Bacteria
Replicon accession	NC_013124
Strand	+
Start bp	568568
End bp	569818
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	68%
IMG OID	644951705
Product	cysteine desulfurase, SufS subfamily
Protein accession	YP_003109194
Protein GI	256371370
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.93631
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGCGA CACGTGGCCT TGGGCTCGAC GTCGAGGAGC TGCGTAAGGA CTTCCCGATC 
TTCGCCGAGC GCGGTGCGGG CTTCCACTAC CTCGACTCGG CGGCCTCGGC CCAGAGGCCG 
AGTGCGGTGC TCGAGGCGAT GGACGCCTAC TACCGTTCCC ACCACGCCAA CGTCCACCGC 
GGCGTCTACG GCCTCGCCGA GGACGCCACC GATCGCTACG AGCGCGCACG CCGAGCCATC 
GGCCGCTTCG TCAACGCCCC CGACCCGGAG CGCGAGGTGG TGTTCACGAA GAACGCCACC 
GAAGCGCTCA ATCTCGTCGC GCAGGGTCTC GGCCGGGTGC TCCTCGGACC CGGTCGCGCC 
GTCGTCCTGA CGGAGATGGA GCACCATGCC AACTTGGTCC CGTGGATGAT CCTGCAGGAG 
CAGCTCGGGT TCGAGCTGCG CTACCTGCCC TTCGATGGTG ACGGCCAGCT GGTGCTCGAC 
GACGCGGAGC GGATCCTCGA CGGCGCCGCC ATCCTCAGCG TCACCGCGAT GTCGAACGTG 
CTCGGGACGC TGAACCCGAT CCCCCATCTC GCCGAGCTCG CGCACGGAGC AGGTGCCGTC 
GTGGTCGTGG ACGCAGCGCA GTATGCGCCG CACCATCCGA TCGACGTGCA GGCCTGGGGC 
GTCGATCTCG TTGCGATGAC CGGACACAAG ATGCTCGGCC CTACGGGCAT CGGCGCGCTG 
TGGGGGCGGC TCGAGCTGCT CGAGCAGATG ACGCCGTTCC TCGGTGGCGG CGACATGATC 
CTCGACGTGA CGCTGGAGGG GTTCGTGCCG AACGAGGTGC CGTACAAGTT CGAGGCCGGT 
ACGCCCCCGA TCGCCGAGGC CATCGGGTGG GAGGTCGCCA TCGACTACCT CCGCGACCGT 
GTCGGGTTCG AGGCACTCGC CGCCCACGAG CGCTCGCTGA CCGCCTATGC CCTCGGTAGC 
TTGGCTGATG GCCTCGGGGA GCGCATTCGG ATCTTCGGCC CCCGCGACCC GGAGCGTCGA 
GGCGGCGTGA TCTCGTTCGA GCTCCAGGGC GTGCATCCCC ACGACGTCGC CCAAGTGCTC 
GATCGTCACG GAGTGTGCGT GCGTGCGGGA CACCACTGCG CCAAGCCTCT CATGCGAGAG 
ATCGGCCAGG CCGCGACCGC CCGTGCGTCG CTGTATCTCT ACAACGACCG TGCTGACATC 
GACGCTCTCG TCATGGCACT CCAAGACGCC TGGCAGCGCT TCAACGACTA G

Protein sequence

MTATRGLGLD VEELRKDFPI FAERGAGFHY LDSAASAQRP SAVLEAMDAY YRSHHANVHR 
GVYGLAEDAT DRYERARRAI GRFVNAPDPE REVVFTKNAT EALNLVAQGL GRVLLGPGRA 
VVLTEMEHHA NLVPWMILQE QLGFELRYLP FDGDGQLVLD DAERILDGAA ILSVTAMSNV 
LGTLNPIPHL AELAHGAGAV VVVDAAQYAP HHPIDVQAWG VDLVAMTGHK MLGPTGIGAL 
WGRLELLEQM TPFLGGGDMI LDVTLEGFVP NEVPYKFEAG TPPIAEAIGW EVAIDYLRDR 
VGFEALAAHE RSLTAYALGS LADGLGERIR IFGPRDPERR GGVISFELQG VHPHDVAQVL 
DRHGVCVRAG HHCAKPLMRE IGQAATARAS LYLYNDRADI DALVMALQDA WQRFND