Gene EcolC_2661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2661
Symbol
ID	6067484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2914371
End bp	2915516
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	57%
IMG OID	641602067
Product	alkanesulfonate monooxygenase
Protein accession	YP_001725617
Protein GI	170020663
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03565] alkanesulfonate monooxygenase, FMNH(2)-dependent

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.499815
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0111176
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTGA ATATGTTCTG GTTTTTACCG ACCCACGGTG ACGGGCATTA TCTGGGAACG 
GAAGAAGGTT CACGCCCGGT TGATCACGGT TATCTGCAAC AAATTGCGCA AGCGGCGGAT 
CGTCTTGGCT ATACCGGTGT GCTAATTCCA ACGGGGCGCT CCTGCGAAGA TGCGTGGCTG 
GTTGCCGCAT CGATGATCCC GGTGACGCAG CGGCTGAAGT TTCTTGTCGC CCTGCGTCCC 
AGCGTAACCT CACCTACCGT TGCCGCCCGC CAGGCCGCCA CGCTTGACCG TCTCTCAAAT 
GGACGTGCGT TGTTTAACCT GGTCACAGGC AGCGATCCAC AAGAGCTGGC AGGCGACGGA 
GTGTTCCTTG ATCATAGCGA GCGCTACGAA GCCTCGGCGG AATTTACCCA GGTCTGGCGG 
CGTTTATTGC AGAGAGAAAC CGTCGATTTC AACGGTAAAC ATATTCATGT GCGCGGAGCA 
AAACTGCTCT TCCCGGCGAT TCAACAGCCG TATCCGCCAC TTTACTTTGG CGGATCGTCA 
GATGTCGCCC AGGAGCTGGC GGCAGAACAG GTTGATCTCT ACCTCACCTG GGGCGAACCG 
CCGGAACTGG TTAAAGAGAA AATCGAACAA GTGCGGGCGA AAGCTGCCGC GCATGGACGC 
AAAATTCGTT TCGGTATTCG TCTGCATGTG ATTGTTCGTG AAACTAACGA CGAAGCGTGG 
CAGGCCGCCG AGCGGTTAAT CTCGCATCTT GATGATGAAA CTATCGCCAA AGCACAGGCC 
GCATTCGCCC GGACGGATTC CGTAGGGCAA CAGCGAATGG CGGCGTTACA TAACGGCAAG 
CGCGACAATC TGGAGATCAG CCCCAATTTA TGGGCGGGCG TTGGCTTAGT GCGCGGCGGT 
GCCGGGACGG CGCTGGTGGG CGATGGTCCT ACGGTCGCTG CGCGAATCAA CGAATATGCC 
GCGCTTGGCA TCGACAGTTT TGTGCTTTCG GGCTATCCGC ATCTGGAAGA AGCGTATCGG 
GTTGGCGAGT TGCTGTTCCC GCTTCTGGAT GTCGCCATCC CGGAAATTCC CCAGCCGCAG 
CCGCTGAATC CGCAAGGCGA AGCGGTGGCG AATGATTTTA TCCCCCGTAA AGTCGCGCAA 
AGCTAA

Protein sequence

MSLNMFWFLP THGDGHYLGT EEGSRPVDHG YLQQIAQAAD RLGYTGVLIP TGRSCEDAWL 
VAASMIPVTQ RLKFLVALRP SVTSPTVAAR QAATLDRLSN GRALFNLVTG SDPQELAGDG 
VFLDHSERYE ASAEFTQVWR RLLQRETVDF NGKHIHVRGA KLLFPAIQQP YPPLYFGGSS 
DVAQELAAEQ VDLYLTWGEP PELVKEKIEQ VRAKAAAHGR KIRFGIRLHV IVRETNDEAW 
QAAERLISHL DDETIAKAQA AFARTDSVGQ QRMAALHNGK RDNLEISPNL WAGVGLVRGG 
AGTALVGDGP TVAARINEYA ALGIDSFVLS GYPHLEEAYR VGELLFPLLD VAIPEIPQPQ 
PLNPQGEAVA NDFIPRKVAQ S