Gene Avin_30500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_30500
Symbol	ssuD
ID	7761950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	3159600
End bp	3160748
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	70%
IMG OID	643805926
Product	alkanesulfonate monooxygenase
Protein accession	YP_002800190
Protein GI	226945117
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03565] alkanesulfonate monooxygenase, FMNH(2)-dependent

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCTGA ATGTTTTCTG GTTCCTGCCC ACCCACGGCG ACGGCCACTA CCTGGGCACC 
GCCGAGGGCG CCCGCGCCGT CGACCACGCC TACTTGCAGC AGATCGCCCA GGCCGCCGAC 
CGACTCGGCT TCGGCGGCGT GCTGATTCCG ACCGGGCGTT CCTGCGAGGA TTCCTGGCTG 
GTCGCCGCCT CGCTGATCCC GGTCACCCGG CGTTTGAAAT TCCTCGTCGC CCTGCGTCCA 
GGGATCATTT CGCCGACCGT GGCGGCACGC CAGGCGGCGA CGCTCGACCG GCTGTCCGGC 
GGTCGCGCGT TGTTCAACCT GGTGACCGGT GGCGACCCGG AAGAACTGGC CGGCGAAGGC 
CTGCACCTGT CCCATGCCGA GCGCTACGAG GCGGCCACCG AGTTCACCCG CATCTGGCGG 
GGCGTGCTGT CCGGCGAAAC CGTCGACCTG CAGGGCAAGC ACATCCAGGT CGAGGGTGCC 
AGGCTGCTCT TCCCGCCGCT GCAGCAGCCC CATCCACCAC TGTATTTCGG CGGCTCCTCG 
GAGGCCGCCC ACGAACTGGC CGCCGAACAG GTCGACCTCT ACCTGACCTG GGGCGAGCCG 
CCGGCCGCGG TGGCCGAGAA GATCGCCGAC GTGCGCGCCC GCGCCGCCCG CCATGGCCGC 
ACGGTGCGTT TCGGCATCCG CCTGCACGTG ATCGTTCGCG AAACCACCGA GGAGGCCTGG 
GAGGCCGCCG ACCGGCTGAT CGGCCACCTG GACGACGAAA CCATCGCCAA GGCCCAGGCC 
TCGCTGGCGC GTTTCGACTC GGTCGGCCAG CAGCGCATGG CCGCCCTGCA TGGTGGCAGC 
AAGGAGAATC TGGAGGTGTC GCCGAACCTC TGGGCCGGCG TCGGCCTGGT GCGCGGCGGG 
GCCGGCACCG CACTGGTCGG CGACGGTCCG ACCGTGGCGG CGCGGATGAA GGAGTATGCC 
GCGCTCGGCA TCGACACCTT CGTACTCTCC GGTTATCCGC ACCTGGAAGA ATCCTACCGG 
GTCGCCGAAC TGCTCTTCCC GCACCTGGAT CTGGCCCGGC CGGCCGGAGT GGAAGGTCGC 
GGCCAGGTCA GTCCGTTCGG CGAGGTGCTG GCCAACGACA TCCTGCCCAA GGCCGCGGCG 
CAGAGTTGA

Protein sequence

MSLNVFWFLP THGDGHYLGT AEGARAVDHA YLQQIAQAAD RLGFGGVLIP TGRSCEDSWL 
VAASLIPVTR RLKFLVALRP GIISPTVAAR QAATLDRLSG GRALFNLVTG GDPEELAGEG 
LHLSHAERYE AATEFTRIWR GVLSGETVDL QGKHIQVEGA RLLFPPLQQP HPPLYFGGSS 
EAAHELAAEQ VDLYLTWGEP PAAVAEKIAD VRARAARHGR TVRFGIRLHV IVRETTEEAW 
EAADRLIGHL DDETIAKAQA SLARFDSVGQ QRMAALHGGS KENLEVSPNL WAGVGLVRGG 
AGTALVGDGP TVAARMKEYA ALGIDTFVLS GYPHLEESYR VAELLFPHLD LARPAGVEGR 
GQVSPFGEVL ANDILPKAAA QS