Gene EcSMS35_0729 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0729
Symbol	abrB
ID	6147413
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	736291
End bp	737337
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	56%
IMG OID	641615620
Product	protein AbrB
Protein accession	YP_001742819
Protein GI	170681894
COG category	[R] General function prediction only
COG ID	[COG3180] Putative ammonia monooxygenase
TIGRFAM ID	[TIGR03082] membrane protein AbrB duplication

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.218547
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.802179
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGTTT TGCAGTGGGG AATGTTATGT GTGCTCTCAC TTCTACTTTC TATTGGCTTC 
CTCGGATTAC ATCTCCCGGC GGCGCTATTA CTTGGGCCGA TGCTCGCCGG GATCATCTTC 
AGTATGCGCG GAATTACTTT ACAACTCCCC CGCTCCGCTT TTCTCGCCGC GCAGGCCATT 
CTTGGCTGCA TGATTGCGCA AAACCTGACC GGTTCGATCC TGACCACGCT AGCGGTGAAC 
TGGCCGATTG TGTTAGCTAT TTTACTGGTG ACGCTGCTTT CCAGCGCCAT CGTGGGTTGG 
TTATTGGTGC GCTATAGCTC ATTGCCTGGA AATACCGGTG CCTGGGGTTC TTCTCCTGGC 
GGCGCGGCGG CAATGGTCGC TATGGCGCAA GATTACGGCG CAGATATTCG CCTGGTGGCG 
TTTATGCAAT ATCTGCGCGT GCTGTTCGTC GCGGGGGCCG CTGTTCTGGT CACCCGCATG 
ATGCTGGGCG ATAACGCTGA AGCGGTTAAC CAGCAGATCG TCTGGTTCCC GCCAGTGAGC 
ATTAATCTCC TGCTTACGAT TTTGCTCGCG GTCGTTGCCG GTACGGCGGG ATGCTTGCTA 
CGTCTTCCTT CCGGCACGAT GCTCATCCCG ATGCTGGCGG GCGCAGTGCT CCAGTCTGGT 
CAGCTCATCA CCATCGAACT ACCAGAATGG CTGCTGGCGA TGGCGTATAT GGCAATTGGC 
TGGCGGATTG GTCTTGGTTT CGATAAGCAA ATCTTACTGC GGGCATTGCG CCCGCTGCCA 
CAAATCTTGC TGTCGATTTT TGCTCTGCTG GCTATTTGTG CAGGTATGGC GTGGGGACTG 
ACCCGATTTA TGCATATTGA TTTTATGACT GCCTACCTCG CCACCAGTCC CGGCGGGCTT 
GATACCGTGG CGGTCATCGC CGCAGGGAGC AATGCCGATA TGGCGCTCAT CATGGCGATG 
CAAACCCTGC GCCTGTTCAG TATTTTGCTA ACGGGGCCTG CCATCGCACG GTTTATTTCA 
ACCTATGCGC CGAAGCGTTC GGCCTAG

Protein sequence

MPVLQWGMLC VLSLLLSIGF LGLHLPAALL LGPMLAGIIF SMRGITLQLP RSAFLAAQAI 
LGCMIAQNLT GSILTTLAVN WPIVLAILLV TLLSSAIVGW LLVRYSSLPG NTGAWGSSPG 
GAAAMVAMAQ DYGADIRLVA FMQYLRVLFV AGAAVLVTRM MLGDNAEAVN QQIVWFPPVS 
INLLLTILLA VVAGTAGCLL RLPSGTMLIP MLAGAVLQSG QLITIELPEW LLAMAYMAIG 
WRIGLGFDKQ ILLRALRPLP QILLSIFALL AICAGMAWGL TRFMHIDFMT AYLATSPGGL 
DTVAVIAAGS NADMALIMAM QTLRLFSILL TGPAIARFIS TYAPKRSA