Gene Hoch_3281 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3281
Symbol
ID	8545669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	4525018
End bp	4526307
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	72%
IMG OID	646387948
Product	cysteine desulfurase, SufS subfamily
Protein accession	YP_003267676
Protein GI	262196467
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.30955
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0478783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCCCT CCGCCACGCG CCCTACGCCC GCCAGCTCTG CCGCGACGCC GCCCTCTGGC 
GCGTCGCGCG CCTCCTTCGA TGTCCAGCGC ATCCGCGCCG ACTTCCCGGC TCTCGCGCAG 
GAGGTCCGCG GCAAGCCGCT GGTGTACCTC GACAGCGCGG CCACCGCGCT CAAGCCGCAG 
CCCGTGATCG ACGCGGTGGT GCGCATCTAC GCCCGCGACT GCGCCAACGT GCACCGCGGC 
GTGCACACCC TCAGCCAGCG CGCCACCGAG GCCTACGAGG GCACGCGCGA CACGATCCAG 
CGCTTCCTCG GCGCCGAAGC CCGCGAGGAG ATCGTCTATA CCCGCGGCAC CACCGACGCC 
ATCAACCTGG TGGCGCAGTC GTGGGCGCGC CCGCGCCTCG GTCCCGGTGA CGAGATCCTC 
ATCACCGGCC TCGAGCACCA CGCCAACATC GTGCCCTGGC AGATGGTGTG CGAGCAGACC 
GGCGCCAAGC TGGTCGTCGT CCCGGTGTCC GACGACGGCA GCATCCAGGT CGAGGACGTC 
GCCGCCAAGC TCGGCGAGCG CGTGCGCCTG GTCGCCATGT CGCACGTCTC CAACGCCCTG 
GGCACCATCC TGCCGGTGCG CGAGGTCGCC GCCCTGGCCC GCGATCGCGG CGCCCGGGTG 
CTGGTCGACG GCGCCCAGGC CGTGCCCCAC CTGCCGGTCG ACGTGCGCGC GCTGGGCTGC 
GATTTCTACT GCTTTAGCGC CCACAAGCTG TACGGCCCCT CGGGCGCCGG CGCGCTGTGG 
GCGCCGCGCG CGCTGCTCGA GGAGATGCCG CCGTATCAGG GCGGCGGCGA CATGATCCGC 
ACCGTGAGCT TCGAGCGCAC CACCTACGCC GATGTGCCGC AGAAGTTCGA GGCCGGCACC 
CCGAGCATCG CCAGCATCGT CGGCCTGGGC GCGGCCATCG ACTACATCAG CGCCATCGGC 
TGGGACGCCA TCTTGGCCCA CGAGAGCGAT CTGCGCGGCT ACGCCAGCGA GCGCCTGGGC 
GAGATTCCCG GCCTGCGCAT CCTCGGCACC ACGGCGGAGA AGATCGCCGT GCTCTCGTTC 
ACCATGGACA GCGCCCACCC GCACGATATC GGCACCATCG TCGATACCCA CGGCGTGGCC 
ATCCGCACCG GCCACCACTG CGCGCAGCCG GTCATGGAGC GCTTCTGCGT ACCGGCGACC 
GCGCGCGCCT CCCTCGGTCT CTACAACACC CGCGCCGATA TCGACGCCTT GATGGGCGCG 
CTCCGCGACG TCCAGGAGAT GTTCGGATGA

Protein sequence

MTPSATRPTP ASSAATPPSG ASRASFDVQR IRADFPALAQ EVRGKPLVYL DSAATALKPQ 
PVIDAVVRIY ARDCANVHRG VHTLSQRATE AYEGTRDTIQ RFLGAEAREE IVYTRGTTDA 
INLVAQSWAR PRLGPGDEIL ITGLEHHANI VPWQMVCEQT GAKLVVVPVS DDGSIQVEDV 
AAKLGERVRL VAMSHVSNAL GTILPVREVA ALARDRGARV LVDGAQAVPH LPVDVRALGC 
DFYCFSAHKL YGPSGAGALW APRALLEEMP PYQGGGDMIR TVSFERTTYA DVPQKFEAGT 
PSIASIVGLG AAIDYISAIG WDAILAHESD LRGYASERLG EIPGLRILGT TAEKIAVLSF 
TMDSAHPHDI GTIVDTHGVA IRTGHHCAQP VMERFCVPAT ARASLGLYNT RADIDALMGA 
LRDVQEMFG