Gene Sfum_1204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_1204
Symbol
ID	4460476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	-
Start bp	1490411
End bp	1491556
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	63%
IMG OID	639701971
Product	cysteine desulfurase family protein
Protein accession	YP_845332
Protein GI	116748645
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01977] cysteine desulfurase family protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.515711
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCTCT ATCTCGATAA CGCCGCAACG TCGTTTCCCA AGCCGCCGTC GGTGTATGAA 
GCCGTACGGC ACGCCCTGAC GGAAGTCGGA GCGAGTCCCG GCAGGGCCTC TCACCGGCAT 
GCCAGGCTGG CCTCTTCGAT GGTGGGGGCC GCACGCGAGA AGGTGGCCTC TTTCCTGGGC 
ATCGGAGATG CCGACCGGGT GATTTTCACG AAGAACGCCA CCGAGAGCAT CAATATCGTC 
TTGAAGGGGT GGTTGAAAAG GGGGGATCGC GTGCTGATCT CGGCCATGGA ACACAATTCC 
GTGGTCCGTC CGCTGAAACG ACTGAGTGAA ATCGGCGTGA GCACCGAAAT CGTTCCCTGC 
AGCGGCAGCG GAGCCATCGA CGTGGATGAG CTGCGGCGGA GGCTGGAGTC GCGTCCCCGG 
CTGATGGCGA TGACCCACGC TTCCAACGTG AACGGCGCGC TCCTTCCGGC GGAAGCAGTG 
GCGCAAATGT GCAGCGAATT CGGCGTCCCG CTTTTGCTCG ATGCGGCCCA AACGGCGGGC 
GTTCAGGCCA TAAGGGCCGA TAAATGGCGC CTGGCGATGC TGGCGTGTTC CGCCCATAAG 
GGGCTGCTTG GTCCTCCCGG GGTCGGCGTG CTTTTCATCC GTTCGGGGCT GGACGTGGAG 
CCCTTGTTGG AGGGCGGAAC GGGGAGCCGG TCGGAGGACG CGATACAGCC CGAAATCTGC 
CCGGACCGCT ACGAGAGCGG CACTCCAAAC CTGCCCGGGA TCGCGGGACT TGCCGCGGGC 
ATCGATTACA TCCTGAGCAG CGGTCTTGAA ACCATTCGCG ATCACGAACT GGGGCTGGCG 
GTTCGCCTTG AAGAGCAATT GCGGGCTATT CCCGGAATTA CTGTCATCAG TCCCGAAGTG 
CGGGGAACGG CGACGGTCTC GTTCACGATG GCGGGGATCA ATCCGGCCGA TGCGGGACAC 
CTGCTCGACG AAGGATACGA TATTGCGGTG CGGACGGGAT TGCACTGCGC TCCCCTCGCT 
CACCGGACAT TCGGGACGTT TCCGGAGGGC ACCGTTCGCG TTTCGCCGGG GTATGCGACG 
ACCGCGGCGG ATATGGAGCG GCTTGCCGAG GCGATACGGG ACCTGGCGTT GCTTCGCCGC 
CGATGA

Protein sequence

MTLYLDNAAT SFPKPPSVYE AVRHALTEVG ASPGRASHRH ARLASSMVGA AREKVASFLG 
IGDADRVIFT KNATESINIV LKGWLKRGDR VLISAMEHNS VVRPLKRLSE IGVSTEIVPC 
SGSGAIDVDE LRRRLESRPR LMAMTHASNV NGALLPAEAV AQMCSEFGVP LLLDAAQTAG 
VQAIRADKWR LAMLACSAHK GLLGPPGVGV LFIRSGLDVE PLLEGGTGSR SEDAIQPEIC 
PDRYESGTPN LPGIAGLAAG IDYILSSGLE TIRDHELGLA VRLEEQLRAI PGITVISPEV 
RGTATVSFTM AGINPADAGH LLDEGYDIAV RTGLHCAPLA HRTFGTFPEG TVRVSPGYAT 
TAADMERLAE AIRDLALLRR R