Gene EcE24377A_1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1037
Symbol	ssuD
ID	5588937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	1060919
End bp	1062064
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	57%
IMG OID	640924742
Product	alkanesulfonate monooxygenase
Protein accession	YP_001462156
Protein GI	157154796
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03565] alkanesulfonate monooxygenase, FMNH(2)-dependent

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.85076
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCTGA ATATGTTCTG GTTTTTACCG ACCCATGGTG ACGGGCATTA TCTTGGAACG 
GAAGAAGGTT CACGCCCGGT TGATCACGGC TATCTGCAAC AAATTGCGCA AGCGGCGGAT 
CGTCTGGGCT ATACCGGTGT GCTGATCCCA ACGGGGCGAT CGTGTGAAGA TGCGTGGCTG 
GTGGCGGCGT CGATGATCCC GGTGACGCAG CGGCTGAAGT TTCTTGTCGC CCTGCGCCCC 
AGCGTAACCT CACCTACCGT TGCCGCTCGC CAGGCCGCCA CGCTTGACCG TCTCTCAAAT 
GGTCGTGCGT TGTTTAATCT GGTCACAGGC AGCGATCCAC AAGAGCTGGC AGGCGACGGC 
GTGTTCCTTG ATCATAGCGA GCGCTACGAA GCCTCGGCGG AATTTACCCA GGTCTGGCGG 
CGCTTATTGC TGGGGGAAAC CGTCAATTTC AACGGTAAAC ATATTCATGT GCGCGGAGCA 
AAACTGCTCT TCCCGCCGAT TCAACAGCCT TATCCTCCGC TTTACTTTGG CGGATCGTCA 
GACGTCGCCC AGGAGCTGGC GGCAGAACAA GTTGATCTCT ACCTCACCTG GGGCGAACCG 
CCAGAACTAG TAAAAGAGAA GATCGAACAA GTGCGGGCGA AAGCTGCCGC GCATGGACGC 
AAAATTCGTT TCGGTATTCG TCTGCATGTG ATTGTTCGTG AAACTAACGA CGAAGCGTGG 
CAGGCCGCCG AGCGGTTAAT CTCGCATCTT GATGATGAAA CTATCGCCAA AGCACAGGCC 
GCATTCGCCC GGACGGATTC CGTAGGACAA CAGCGAATGG CGGCGTTACA TAACGGCAAG 
CGCGACAATC TGGAGATCAG CCCCAATTTA TGGGCGGGCG TTGGCTTAGT GCGCGGCGGT 
GCCGGAACGG CGCTGGTGGG CGATGGTCCT ACGGTCGCTG CGCGAATCAA CGAATACGCC 
GCGCTTGGCA TCGACAGCTT TGTGCTTTCG GGCTATCCGC ATCTGGAAGA AGCGTATCGG 
GTCGGCGAGT TGCTGTTCCC ACATCTGGAT GTCGCCATTC CGGAAATTCC CCAGCCGCAG 
CCGCTGAATC CGCAAGGCGA AGCGGTGGCG AATGATTTTA TCCCCCGTAA AGTCGCGCAA 
AGCTAA

Protein sequence

MSLNMFWFLP THGDGHYLGT EEGSRPVDHG YLQQIAQAAD RLGYTGVLIP TGRSCEDAWL 
VAASMIPVTQ RLKFLVALRP SVTSPTVAAR QAATLDRLSN GRALFNLVTG SDPQELAGDG 
VFLDHSERYE ASAEFTQVWR RLLLGETVNF NGKHIHVRGA KLLFPPIQQP YPPLYFGGSS 
DVAQELAAEQ VDLYLTWGEP PELVKEKIEQ VRAKAAAHGR KIRFGIRLHV IVRETNDEAW 
QAAERLISHL DDETIAKAQA AFARTDSVGQ QRMAALHNGK RDNLEISPNL WAGVGLVRGG 
AGTALVGDGP TVAARINEYA ALGIDSFVLS GYPHLEEAYR VGELLFPHLD VAIPEIPQPQ 
PLNPQGEAVA NDFIPRKVAQ S