Gene EcHS_A4336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4336
Symbol	phnM
ID	5591595
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4340652
End bp	4341788
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	61%
IMG OID	640923434
Product	phosphonate metabolism protein PhnM
Protein accession	YP_001460879
Protein GI	157163561
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3454] Metal-dependent hydrolase involved in phosphonate metabolism
TIGRFAM ID	[TIGR02318] phosphonate metabolism protein PhnM

Plasmid Coverage information

Num covering plasmid clones	77
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTATCA ATAACGTTAA GCTGGTGCTG GAAAACGAGG TGGTGCACGG TTCGCTGGAG 
GTGCAGGATG GCGAAATCCG CGCCTTTGCC GAAAGCCAGA GCCGCCTGCC AGAAGCGATG 
GACGGCGAAG GTGGCTGGCT ACTACCCGGC CTGATTGAGC TGCATACCGA CAACCTCGAT 
AAATTCTTCA CCCCGCGCCC GAAAGTCGAC TGGCCCGCCC ATTCGGCGAT GAGCAGCCAC 
GACGCGCTGA TGGTGGCAAG CGGCATCACC ACCGTGCTGG ACGCGGTGGC GATTGGCGAC 
GTGCGCGACG GCGGCGATCG GCTGGAGAAT CTGGAGAAGA TGATCAACAC CATCGAAGAG 
ACGCAGAAAC GCGGCGTCAA CCGCGCCGAG CACCGCCTGC ACCTGCGCTG CGAACTGCCG 
CATCACACCA CACTGCCGCT GTTTGAAAAA CTGGTTCAGC GCGAACCGGT GACGCTGGTG 
TCGCTGATGG ACCACTCACC GGGCCAGCGC CAGTTCGCTA ACCGCGAGAA GTATCGCGAA 
TATTATCAGG GCAAATACTC CCTCACCGAT GCGCAGATGC AGCAGTACGA AGAAGAGCAA 
TTGGCGCTCG CCGCACGCTG GTCGCAGCCG AATCGCGAAT CCATCGCCGC CCTGTGCCGC 
GCGCGACAAA TTGCGCTCGC CAGCCACGAT GACGCCACAC ACGCCCACGT TGCCGAATCC 
CACCAACTTG GCAGCGTGAT CGCCGAATTT CCCACCACGT TCGAAGCGGC GGAAGCCTCG 
CGTAAGCATG GCATGAACGT GCTGATGGGT GCGCCAAATA TCGTGCGTGG CGGCTCGCAC 
TCCGGCAATG TGGCGGCCAG TGAACTGGCG CAGCTTGGTC TGCTGGATAT CCTCTCTTCC 
GACTACTACC CCGCCAGCCT GCTGGATGCG GCGTTCCGCG TCGCCGATGA CGAGAGCAAC 
CGCTTTACGC TACCGCAGGC GGTGAGGCTG GTGACCAAAA ATCCGGCGCA GGCGCTGAAT 
CTTCAGGATC GCGGGGTGAT TGGCGAGGGT AAACGCGCTG ACCTGGTGCT GGCGCATCGC 
CAGGGCAATC ACATTCATAT CGACCACGTC TGGCGTCAGG GTAAAAGGGT GTTCTGA

Protein sequence

MIINNVKLVL ENEVVHGSLE VQDGEIRAFA ESQSRLPEAM DGEGGWLLPG LIELHTDNLD 
KFFTPRPKVD WPAHSAMSSH DALMVASGIT TVLDAVAIGD VRDGGDRLEN LEKMINTIEE 
TQKRGVNRAE HRLHLRCELP HHTTLPLFEK LVQREPVTLV SLMDHSPGQR QFANREKYRE 
YYQGKYSLTD AQMQQYEEEQ LALAARWSQP NRESIAALCR ARQIALASHD DATHAHVAES 
HQLGSVIAEF PTTFEAAEAS RKHGMNVLMG APNIVRGGSH SGNVAASELA QLGLLDILSS 
DYYPASLLDA AFRVADDESN RFTLPQAVRL VTKNPAQALN LQDRGVIGEG KRADLVLAHR 
QGNHIHIDHV WRQGKRVF