Gene ECD_00939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_00939
Symbol	ssuD
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	999932
End bp	1001077
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	57%
IMG OID
Product	alkanesulfonate monooxygenase
Protein accession	ACT42834
Protein GI	253977164
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.185267
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCTGA ATATGTTCTG GTTTTTACCG ACCCACGGTG ACGGGCATTA TCTGGGAACG 
GAAGAAGGTT CACGCCCGGT TGATCACGGT TATCTGCAAC AAATTGCGCA AGCGGCGGAT 
CGTCTTGGCT ATACCGGTGT GCTAATTCCA ACGGGGCGCT CCTGCGAAGA TGCGTGGCTG 
GTTGCCGCAT CGATGATCCC GGTGACGCAG CGGCTGAAGT TTCTTGTCGC CCTGCGTCCC 
AGCGTAACCT CACCTACCGT TGCCGCCCGC CAGGCCGCCA CGCTTGACCG TCTCTCAAAT 
GGACGTGCGT TGTTTAACCT GGTCACAGGC AGCGATCCAC AAGAGCTGGC AGGCGACGGA 
GTGTTCCTTG ATCATAGCGA GCGCTACGAA GCCTCGGCGG AATTTACCCA GGTCTGGCGG 
CGTTTATTGC AGAGAGAAAC CGTCGATTTC AACGGTAAAC ATATTCATGT GCGCGGAGCA 
AAACTGCTCT TCCCGGCGAT TCAACAGCCG TATCCGCCAC TTTACTTTGG CGGATCGTCA 
GATGTCGCCC AGGAGCTGGC GGCAGAACAG GTTGATCTCT ACCTCACCTG GGGCGAACCG 
CCGGAACTGG TTAAAGAGAA AATCGAACAA GTGCGGGCGA AAGCTGCCGC GCATGGACGC 
AAAATTCGTT TCGGTATTCG TCTGCATGTG ATTGTTCGTG AAACTAACGA CGAAGCGTGG 
CAGGCCGCCG AGCGGTTAAT CTCGCATCTT GATGATGAAA CTATCGCCAA AGCACAGGCC 
GCATTCGCCC GGACGGATTC CGTAGGGCAA CAGCGAATGG CGGCGTTACA TAACGGCAAG 
CGCGACAATC TGGAGATCAG CCCCAATTTA TGGGCGGGCG TTGGCTTAGT GCGCGGCGGT 
GCCGGGACGG CGCTGGTGGG CGATGGTCCT ACGGTCGCTG CGCGAATCAA CGAATATGCC 
GCGCTTGGCA TCGACAGTTT TGTGCTTTCG GGCTATCCGC ATCTGGAAGA AGCGTATCGG 
GTTGGCGAGT TGCTGTTCCC GCTTCTGGAT GTCGCCATCC CGGAAATTCC CCAGCCGCAG 
CCGCTGAATC CGCAAGGCGA AGCGGTGGCG AATGATTTTA TCCCCCGTAA AGTCGCGCAA 
AGCTAA

Protein sequence

MSLNMFWFLP THGDGHYLGT EEGSRPVDHG YLQQIAQAAD RLGYTGVLIP TGRSCEDAWL 
VAASMIPVTQ RLKFLVALRP SVTSPTVAAR QAATLDRLSN GRALFNLVTG SDPQELAGDG 
VFLDHSERYE ASAEFTQVWR RLLQRETVDF NGKHIHVRGA KLLFPAIQQP YPPLYFGGSS 
DVAQELAAEQ VDLYLTWGEP PELVKEKIEQ VRAKAAAHGR KIRFGIRLHV IVRETNDEAW 
QAAERLISHL DDETIAKAQA AFARTDSVGQ QRMAALHNGK RDNLEISPNL WAGVGLVRGG 
AGTALVGDGP TVAARINEYA ALGIDSFVLS GYPHLEEAYR VGELLFPLLD VAIPEIPQPQ 
PLNPQGEAVA NDFIPRKVAQ S