Gene EcSMS35_0056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0056
Symbol	pdxA
ID	6147478
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	58963
End bp	59952
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	56%
IMG OID	641614957
Product	4-hydroxythreonine-4-phosphate dehydrogenase
Protein accession	YP_001742173
Protein GI	170683725
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1995] Pyridoxal phosphate biosynthesis protein
TIGRFAM ID	[TIGR00557] 4-hydroxythreonine-4-phosphate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.118271
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.401254
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTAAAA CCCAACGTGT TGTGATCACT CCCGGCGAGC CCGCCGGGAT TGGCCCGGAC 
TTAATTGTCC AGCTTGCACA GCGTGAGTGG CCGGTCGAAC TGGTTGTTTG TGCCGATGCC 
ACTCTCCTTA CCGACCGGGC AGCGATGCTC GGTTTGCCGC TCACCCTCCG CCCTTATTCC 
CCCAACTCCC CTGCACAACC GCAAACTGCG GGCACATTAA CGCTACTTCC TGTCGCGCTA 
CGTGAATCTG TCACTGCGGG GCAGTTAGCG GTTGAAAATG GGCATTATGT GGTGGAAACG 
CTGGCGCGAG CGTGTGATGG CTGTCTGAAC GGTGAATTTG CTGCGCTGAT CACAGGCCCC 
GTGCATAAAG GCGTCATTAA CGACGCAGGC ATTCCGTTTA CCGGTCATAC CGAGTTTTTC 
GAAGAGCGTT CGCAGGCGAA AAAAGTGGTG ATGATGCTGG CAACCGAAGA ACTTCGCGTG 
GCGCTGGCAA CGACGCATTT ACCGCTGCGC GATATCGCAG ATGCTATCAC CCCTGCGCTT 
TTGCACGAAG TGATTGCTAT TTTGCATCAC GATTTGCGGA CCAAATTTGG TATTGCCGAA 
CCGCGCATTC TGGTCTGCGG GCTGAATCCG CACGCGGGCG AAGGCGGTCA TATGGGTACG 
GAAGAGATAG ACACCATTAT TCCGGTGCTC GACGAGCTGC GGGCGCAGGG GATGAAACTC 
AACGGGCCGC TGCCTGCCGA TACCCTGTTT CAGCCGAAAT ATCTCGATAA CGCCGACGCC 
GTGCTGGCGA TGTACCACGA TCAGGGTCTT CCCGTGCTAA AATACCAGGG CTTCGGGCGC 
GGTGTGAACA TTACGCTGGG CCTGCCCTTT ATTCGCACAT CAGTGGACCA CGGCACCGCG 
CTTGAACTGG CGGGACGTGG CAAAGCCGAT GTCGGCAGTT TTATTACGGC GCTTAATCTC 
GCCATCAAAA TGATTGTTAA CACCCAATGA

Protein sequence

MVKTQRVVIT PGEPAGIGPD LIVQLAQREW PVELVVCADA TLLTDRAAML GLPLTLRPYS 
PNSPAQPQTA GTLTLLPVAL RESVTAGQLA VENGHYVVET LARACDGCLN GEFAALITGP 
VHKGVINDAG IPFTGHTEFF EERSQAKKVV MMLATEELRV ALATTHLPLR DIADAITPAL 
LHEVIAILHH DLRTKFGIAE PRILVCGLNP HAGEGGHMGT EEIDTIIPVL DELRAQGMKL 
NGPLPADTLF QPKYLDNADA VLAMYHDQGL PVLKYQGFGR GVNITLGLPF IRTSVDHGTA 
LELAGRGKAD VGSFITALNL AIKMIVNTQ