Gene Avin_40400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_40400
Symbol	iscS
ID	7762926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	4090290
End bp	4091504
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	64%
IMG OID	643806899
Product	cysteine desulfurase
Protein accession	YP_002801151
Protein GI	226946078
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR02006] cysteine desulfurase IscS

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTGC CGATTTATCT GGATTATTCC GCCACCACTC CGGTCGACCC GCGGGTGGCG 
CAGAAGATGT GCGAGTGCCT GACCATGGAG GGCAATTTCG GCAATCCGGC CTCGCGTTCC 
CACGTCTTCG GCTGGAAGGC CGAGGAGGCC GTGGAGAACG CCCGCCGTCA GGTGGCGGAA 
CTGGTCAACG CCGATCCGCG GGAGATCGTC TGGACTTCCG GCGCCACCGA GTCCGATAAC 
CTGGCGATCA AGGGCGTCGC GCACTTCTAC GCGAGCAAGG GCAAGCACAT CATCACCTCG 
AAGATCGAAC ACAAGGCGGT GCTGGATACC ACCCGCCAGC TCGAGCGCGA AGGTTTCGAG 
GTGACCTACC TCGAGCCCGG CGAGGATGGC CTGATCACTC CGGCGATGGT CGCGGCGGCG 
CTGCGCGAGG ACACCATCCT GGTCTCGGTG ATGCACGTCA ACAACGAGAT CGGCACCGTC 
AACGACATCG CAGCCATCGG CGAACTGACC CGTTCGCGCG GCGTGCTCTA TCACGTGGAT 
GCCGCCCAGT CGACCGGCAA GGTGGCCATC GACCTAGAGC GCATGAAGGT CGACCTGATG 
TCCTTCTCCG CCCACAAGAC TTACGGCCCC AAGGGGATCG GCGCGCTCTA CGTGCGGCGC 
AAGCCGCGCG TACGCCTGGA GGCGCAGATG CACGGCGGCG GCCACGAGCG CGGCATGCGT 
TCCGGTACCC TGGCGACCCA CCAGATCGTC GGCATGGGCG AGGCCTTTCG CATCGCCAGG 
GAAGAGATGG CCGCGGAAAG CCGGCGTATC GCCGGGCTCA GCCATCGCTT CCACGAGCAG 
GTCAGCACCC TCGAAGAGGT CTACCTGAAC GGCAGCGCCA CGGCACGGGT GCCGCACAAC 
CTCAATCTCA GCTTCAACTA CGTGGAAGGC GAGTCGCTGA TCATGTCGCT CAGGGATCTG 
GCGGTTTCCT CTGGGTCGGC CTGCACCTCG GCGTCCCTGG AGCCGTCCTA CGTGCTGCGC 
GCTCTGGGTC GCAACGACGA ACTGGCGCAC AGCTCGATCC GCTTCACTTT CGGTCGTTTC 
ACCACCGAGG AAGAGGTCGA TTACGCTGCG CGGAAGGTAT GCGAGGCGGT CGGCAAGCTG 
CGCGAGCTGT CGCCGCTCTG GGACATGTAC AAGGATGGGG TCGATCTGTC CAAGATCGAG 
TGGCAGGCCC ACTGA

Protein sequence

MKLPIYLDYS ATTPVDPRVA QKMCECLTME GNFGNPASRS HVFGWKAEEA VENARRQVAE 
LVNADPREIV WTSGATESDN LAIKGVAHFY ASKGKHIITS KIEHKAVLDT TRQLEREGFE 
VTYLEPGEDG LITPAMVAAA LREDTILVSV MHVNNEIGTV NDIAAIGELT RSRGVLYHVD 
AAQSTGKVAI DLERMKVDLM SFSAHKTYGP KGIGALYVRR KPRVRLEAQM HGGGHERGMR 
SGTLATHQIV GMGEAFRIAR EEMAAESRRI AGLSHRFHEQ VSTLEEVYLN GSATARVPHN 
LNLSFNYVEG ESLIMSLRDL AVSSGSACTS ASLEPSYVLR ALGRNDELAH SSIRFTFGRF 
TTEEEVDYAA RKVCEAVGKL RELSPLWDMY KDGVDLSKIE WQAH