Gene EcolC_3603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3603
Symbol	pdxA
ID	6065044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3944774
End bp	3945763
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	56%
IMG OID	641603021
Product	4-hydroxythreonine-4-phosphate dehydrogenase
Protein accession	YP_001726544
Protein GI	170021590
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1995] Pyridoxal phosphate biosynthesis protein
TIGRFAM ID	[TIGR00557] 4-hydroxythreonine-4-phosphate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.179437
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0001268
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGTTAAAA CCCAACGTGT TGTGATCACT CCCGGCGAGC CCGCCGGGAT TGGCCCGGAC 
TTAGTTGTCC AGCTTGCACA GCGTGAGTGG CCGGTCGAAC TGGTTGTTTG TGCCGATGCC 
ACTCTCCTTA CCGACCGGGC AGCGATGCTC GGTTTGCCGC TCACCCTCCG CCCTTATTCC 
CCCAACTCCC CTGCACAACC GCAAACTACG GGCACATTAA CGCTACTTCC TGTCGCGCTA 
CGTGAATCTG TCACTGCGGG GCAGTTAGCG ATTGAAAATG GACATTACGT GGTGGAGACG 
CTGGCGCGAG CGTGTGATGG CTGTCTGAAC GGTGAATTTG CTGCGCTGAT CACAGGCCCC 
GTGCATAAAG GCGTCATTAA CGACGCAGGC ATTCCGTTTA CCGGTCATAC CGAGTTTTTC 
GAAGAGCGTT CGCAGGCGAA AAAAGTGGTG ATGATGCTGG CGACCGAAGA ACTTCGCGTG 
GCGCTGGCAA CGACGCATTT ACCGCTGCGC GATATCGCAG ATGCTATCAC CCCTGCACTT 
TTGCACGAAG TGATTGCTAT TTTGCATCAC GATTTGCGTA CAAAATTTGG TATTGCCGAA 
CCGCGCATTC TGGTCTGCGG GCTGAATCCG CACGCGGGCG AAGGCGGTCA TATGGGTACG 
GAAGAGATAG ACACCATTAT TCCGGTGCTC GACGAGCTGC GGGCGCAGGG GATGAAACTC 
AACGGGCCGC TGCCTGCCGA TACCCTGTTT CAGCCGAAAT ATCTCGATAA CGCCGACGCC 
GTGCTGGCGA TGTACCACGA TCAGGGTCTT CCCGTGCTAA AATACCAGGG CTTCGGGCGC 
GGTGTGAACA TTACGCTGGG CCTGCCCTTT ATTCGCACAT CAGTGGACCA CGGCACCGCG 
CTTGAACTGG CGGGACGTGG CGAAGCCGAT GTCGGCAGTT TTATTACGGC GCTTAATCTC 
GCCATCAAAA TGATTGTTAA CACCCAATGA

Protein sequence

MVKTQRVVIT PGEPAGIGPD LVVQLAQREW PVELVVCADA TLLTDRAAML GLPLTLRPYS 
PNSPAQPQTT GTLTLLPVAL RESVTAGQLA IENGHYVVET LARACDGCLN GEFAALITGP 
VHKGVINDAG IPFTGHTEFF EERSQAKKVV MMLATEELRV ALATTHLPLR DIADAITPAL 
LHEVIAILHH DLRTKFGIAE PRILVCGLNP HAGEGGHMGT EEIDTIIPVL DELRAQGMKL 
NGPLPADTLF QPKYLDNADA VLAMYHDQGL PVLKYQGFGR GVNITLGLPF IRTSVDHGTA 
LELAGRGEAD VGSFITALNL AIKMIVNTQ