Gene Amir_5150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_5150
Symbol
ID	8329352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	6138517
End bp	6139794
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	74%
IMG OID	644945589
Product	cysteine desulfurase, SufS subfamily
Protein accession	YP_003102817
Protein GI	256379157
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCACCA CCGCTGCTCC GCTGGACGTC GAAGTCGTGC GCGCGGACTT CCCGATCCTG 
GGCCGCACCG TGCGCGAGGG CAAGCGGCTG GTCTACCTCG ACTCCGGCGC CACCTCGCAG 
CGCCCGAGCC AGGTCCTGGA CGCCGAGCGG GCGTTCCTGG AGACCGCCAA CGCCGCGGTC 
CACCGCGGCG CGCACCAGCT GGCCGAGGAG GCCACCGACG CCTACGAGGA CGCCCGCCGC 
AGGATCGCGG GCTTCGTCGG CGTCGGCGTC GACGAGGTCG TGTTCACCAA GAACGCGACC 
GAGGGCGTCA ACCTGGTCGC GTACGCCATG GGCAACGCGG CCACGGCGGG CCCGGAGGCC 
GAGCGCTTCC TGCTGGGCCC CGGCGACGAG ATCGTCGTGA CCGAGATGGA GCACCACGCC 
AACCTGGTGC CGTGGCAGCA GCTCGCGCTG CGCACCGGGG CCACGCTGCG CTGGCTCGGC 
GTCACCGACG AGGGCAGGCT CGACCTGTCG AACCTGGACG AGGTGGTGAA CGAGCGCACC 
AAGGTGCTCG CGTTCACCCA CCAGTCCAAC GTGCTCGGCA CGGTCAACCC GGTCGCCGCC 
CTCGTCGCCG CGGCGGCGCG GGTCGGCGCG CTGACCGTGC TCGACGCCTG CCAGTCCGTG 
CCGCACGCGC CCGTCGACTT CCGCGCCCTC GGCGTGGACT TCGCCGTCTT CAGCGGCCAC 
AAGATGCTCG GTCCCTCGGG CGTCGGCGTC CTCTACGGCC GCCGCGCGCT CCTGGAGGCG 
CTGCCCCCGT TCCTCACCGG CGGCTCCATG ATCGAGATGG TCGAGATGGC CCGCTCCACG 
TTCGCCCCGC CGCCGCAGCG GTTCGAGGCG GGCGTGCCGA TGACCTCGCA GGCCGTCGCG 
CTCGGCGCCG CCGTCGACTA CCTGAACGCG GTCGGCATGG ACCGGGTCGC CGCGCACGAG 
CACGAACTGG TCGCCGCCGC CCTCAGCGGC CTGGCGGCCA TTCCCGGCGT GCGCGTGGTC 
GGCCCCACCG ACCTCGCCGA CCGGGGCGGC GCGGTCTCGT TCGTGGTCGA CGGGGTGCAC 
GCGCACGACG TCGGCCAGGT CCTGGACAGC CTCGGCGTCG CGGTCCGCGT CGGCCACCAC 
TGCGCGTGGC CGCTGCACCG CAGGATGAAC GCCGCGGCCA CCGTGCGGGC CAGCTTCTAC 
CTCTACAACA CGCAGGGCGA GGTGGACGCG CTGCTGTCCG CCGTCCGCGA GGCGCAGAAG 
TTCTTCGGGG TGGCGTGA

Protein sequence

MTTTAAPLDV EVVRADFPIL GRTVREGKRL VYLDSGATSQ RPSQVLDAER AFLETANAAV 
HRGAHQLAEE ATDAYEDARR RIAGFVGVGV DEVVFTKNAT EGVNLVAYAM GNAATAGPEA 
ERFLLGPGDE IVVTEMEHHA NLVPWQQLAL RTGATLRWLG VTDEGRLDLS NLDEVVNERT 
KVLAFTHQSN VLGTVNPVAA LVAAAARVGA LTVLDACQSV PHAPVDFRAL GVDFAVFSGH 
KMLGPSGVGV LYGRRALLEA LPPFLTGGSM IEMVEMARST FAPPPQRFEA GVPMTSQAVA 
LGAAVDYLNA VGMDRVAAHE HELVAAALSG LAAIPGVRVV GPTDLADRGG AVSFVVDGVH 
AHDVGQVLDS LGVAVRVGHH CAWPLHRRMN AAATVRASFY LYNTQGEVDA LLSAVREAQK 
FFGVA