Gene Gobs_4089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_4089
Symbol
ID	8755780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	-
Start bp	4292727
End bp	4293932
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	76%
IMG OID
Product	Cysteine desulfurase
Protein accession	YP_003411025
Protein GI	284992471
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGCT CCGAGGCGGT CTACCTGGAC CACGCGGCAA CCACGCCGAT GCTGCCCGCA 
GTGCTGGCCG CGATGACCGG GCAGCTGGGC CGCGTGGGCA ACGCCTCCTC GCTGCACGCC 
AGCGGCCGCG CCGCGCGCCG GGTCGCCGAG CAGTCGCGCG AGCGGCTGGC GGAGGCGCTG 
GGCGCGCGCC CGTCGGAGGT GCTGTTCACC GGCGGCGGCA CCGAGAGCGA CAACCTCGCC 
GTCAAGGGCC TGTTCTGGGC CCGGCGCGAC GCCGACTCCC GCCGCCGGCG CATCGTGGTC 
AGCCCCGCCG AGCACCACGC GGTGCTCGAC AGCGTCGAGT GGCTGACCAA GCACGACGGC 
GCCGACGTCA CCTGGCTGCC CGTCGAGCCG ACGGGCCGCG TCACCCCCGA GGCGCTGCAC 
GCGGCCCTGG GCAGCGGTGA GGACGTCGCC CTGGTCAGCG TCATGTGGGC CAACAACGAG 
ATCGGCACGG TCAGCGACCT GGCCGCGCTC GCCGAGGTCG CGCACGACGT GGGCGTCCCG 
CTGCACACCG ACGCGGTCCA GGCGGTCGGG CAGGTGCCGG TCGACTTCGC CGCCAGCGGC 
GTCGACGCGC TGACCATGAC CGGCCACAAG CTCGGCGGGC CGATGGGTGC CGGCGTCCTG 
CTGCTGCGCC GCGAGGCTGA GTGCACCCCG TTGCTGCACG GCGGCGGCCA GGAGCGCGAC 
GTGCGCTCGG GCACCCTCGA CGTCGCGGCG ATCGTCGGCC TGCAGGTCGC CACCACGCTG 
GCCGTCGCCG AGCGGGAGGA CCGCGCCGCG CGGCTGGCCG CCCTGCGCGA CCGGCTGGTG 
TCCGGCGTGG TGGCGCAGGT GCCCGACGCC CAGCTCAACG GCCCCCCGCT GGACGACGTC 
GTCGCCGGTG GGCCGGGACG GCTGCCGGGC AACGCGCACC TGTCCTTCCC CGGTGCGGAG 
GGCGACGCGC TGCTCATGCT GCTCGACGCC CGCGGCGTGG AGTGCTCCAC CGGATCGGCC 
TGCAGCGCCG GCGTCGCCCG GCCCAGCCAC GTGCTGCTGG CCACCGGCGC CGACCCCGAC 
CGGGCACGCA GCTCACTGCG CTTCAGCCTC GGGCACACCT CGACCGACGC CGATGTCGAC 
GCCGTCCTCG ACGTGATCGG CCCGGTGGTG GAGCGTGCCC GCCGGGCCGG GATGGGCAGG 
CGATGA

Protein sequence

MSSSEAVYLD HAATTPMLPA VLAAMTGQLG RVGNASSLHA SGRAARRVAE QSRERLAEAL 
GARPSEVLFT GGGTESDNLA VKGLFWARRD ADSRRRRIVV SPAEHHAVLD SVEWLTKHDG 
ADVTWLPVEP TGRVTPEALH AALGSGEDVA LVSVMWANNE IGTVSDLAAL AEVAHDVGVP 
LHTDAVQAVG QVPVDFAASG VDALTMTGHK LGGPMGAGVL LLRREAECTP LLHGGGQERD 
VRSGTLDVAA IVGLQVATTL AVAEREDRAA RLAALRDRLV SGVVAQVPDA QLNGPPLDDV 
VAGGPGRLPG NAHLSFPGAE GDALLMLLDA RGVECSTGSA CSAGVARPSH VLLATGADPD 
RARSSLRFSL GHTSTDADVD AVLDVIGPVV ERARRAGMGR R