Gene EcHS_A4345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4345
Symbol	phnD
ID	5594419
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4347854
End bp	4348870
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	54%
IMG OID	640923443
Product	phosphonate ABC transporter, periplasmic phosphonate-binding protein
Protein accession	YP_001460888
Protein GI	157163570
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3221] ABC-type phosphate/phosphonate transport system, periplasmic component
TIGRFAM ID	[TIGR01098] phosphate/phosphite/phosphonate ABC transporters, periplasmic binding protein [TIGR03431] phosphonate ABC transporter, periplasmic phosphonate binding protein

Plasmid Coverage information

Num covering plasmid clones	80
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCTA AGATAATTGC CTCGCTGGCC TTCACCAGCA TGTTCAGCCT CAGCACCCTG 
TTAAGCCCGG CACACGCCGA AGAGCAGGAA AAGGCGCTGA ATTTCGGCAT TATTTCAACG 
GAATCACAGC AAAACCTTAA ACCGCAATGG ACGCCATTCT TACAGGATAT GGAGAAGAAG 
CTGGGCGTGA AGGTGAACGC CTTCTTTGCC CCAGACTACG CAGGCATTAT CCAGGGAATG 
CGCTTCAATA AAGTGGATAT CGCCTGGTAC GGCAACCTGT CGGCAATGGA AGCGGTGGAT 
CGCGCCAACG GCCAAGTCTT CGCCCAGACG GTCGCGGCGG ATGGATCGCC AGGTTACTGG 
AGCGTGTTGA TCGTCAACAA AGATAGTCCG ATCAACAACC TGAACGATCT GCTGGCGAAG 
CGGAAAGATC TCACCTTCGG CAATGGCGAT CCTAACTCCA CCTCTGGCTT CCTCGTCCCC 
GGTTACTACG TCTTTGCCAA AAACAATATC TCCGCCAGCG ACTTTAAGCG CACCGTCAAC 
GCTGGGCATG AAACCAACGC GCTGGCCGTC GCCAACAAGC AGGTGGATGT TGCCACCAAC 
AACACCGAAA ACCTCGACAA GCTGAAAACC TCCGCGCCAG AGAAGCTGAA AGAACTGAAG 
GTGATCTGGA AGTCGCCGCT GATCCCAGGC GATCCGATCG TCTGGCGCAA GAATCTCTCC 
GAAACCACCA AAGACAAGAT CTACGACTTC TTTATGAACT ACGGAAAAAC GCCGGAAGAG 
AAAGCGGTGC TGGAACGCCT GGGCTGGGCC CCGTTCCGCG CCTCCAGCGA CCTGCAACTG 
GTGCCGATTC GCCAGCTCGC ACTGTTTAAA GAGATGCAGG GCGTAAAAAG CAATAAAGGA 
CTGAATGAGC AGGACAAGCT GGCGAAAACC ACCGAGATTC AGGCGCAGCT GGATGACCTG 
GACCGCCTGA ACAACGCGTT AAGCGCGATG AGTTCGGTGA GTAAAGCGGT GCAGTAA

Protein sequence

MNAKIIASLA FTSMFSLSTL LSPAHAEEQE KALNFGIIST ESQQNLKPQW TPFLQDMEKK 
LGVKVNAFFA PDYAGIIQGM RFNKVDIAWY GNLSAMEAVD RANGQVFAQT VAADGSPGYW 
SVLIVNKDSP INNLNDLLAK RKDLTFGNGD PNSTSGFLVP GYYVFAKNNI SASDFKRTVN 
AGHETNALAV ANKQVDVATN NTENLDKLKT SAPEKLKELK VIWKSPLIPG DPIVWRKNLS 
ETTKDKIYDF FMNYGKTPEE KAVLERLGWA PFRASSDLQL VPIRQLALFK EMQGVKSNKG 
LNEQDKLAKT TEIQAQLDDL DRLNNALSAM SSVSKAVQ