Gene EcSMS35_0413 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0413
Symbol	phoA
ID	6144438
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	424133
End bp	425548
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	54%
IMG OID	641615309
Product	alkaline phosphatase
Protein accession	YP_001742516
Protein GI	170680523
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1785] Alkaline phosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAACAAA GCACTATTGC ACTGGCACTC TTACCGTTAC TGTTTTCCCC TGTGACAAAA 
GCCCGGACAC CAGAAATGCC TGTTCTGGAA AACCGGGCTG CTCAGGGCGA TATTACTGCG 
CCCGGCGGTG CTCGCCGCTT AACGGGTGAT CAGACCGCCG CTCTGCGTGA TTCTCTTAGC 
GATAAACCTG CAAAAAATAT TATTTTGCTG ATTGGCGATG GGATGGGGGA CTCGGAAATT 
ACTGCCGCAC GCAATTATGC CGAAGGTGCG GGCGGCTTTT TTAAAGGTAT CGATGCCTTA 
CCGCTTACCG GGCAATACAC TCACTATGCG CTGAATAAAA AAACCGGCAA ACCGGACTAC 
GTCACCGACT CGGCTGCATC AGCAACCGCC TGGTCAACTG GTGTCAAAAC CTATAACGGC 
GCGCTGGGCA TCGATATTCA CGAAAAAGAT CACCCAACGA TTCTGGAAAT GGCAAAAGCC 
GCAGGTCTGG CGACCGGTAA CGTTTCTACC GCAGAGTTGC AGGATGCCAC GCCCGCTGCG 
CTGGTGGCGC ATGTGACCTC GCGCAAATGC TACGGTCCGA GCGCGACCAG TGAAAAATGT 
CCGGGTAACG CTCTGGAAAA AGGCGGAAAA GGATCGATTA CCGAACAGCT GCTTAACGCC 
CGTGCCGATG TTACGCTTGG CGGCGGCGCA AAAACCTTTG CTGAAACGGC AACCGCCGGT 
GAATGGCAGG GAAAAACGCT GCGTGAACAG GCACAGGCGC GTGGTTATCA GTTGGTGAGT 
GATGCTGCCT CACTGAATTC GGTGACGGAA GCGAATCAGC AAAAACCCCT ATTAGGACTG 
TTTGCTGACG GCAATATGCC AGTGCGCTGG CTAGGACCGA AAGCAACGTA CCACGGCAAT 
ATCGACAAGC CCGCAGTTAC CTGTACGCCT AATCCGCAAC GTAATGACAG CGTACCGACC 
CTGGCGCAGA TGACCGACAA AGCCATTGAA TTGTTGAGTA AAAATGAGAA AGGCTTTTTC 
CTGCAAGTTG AAGGTGCATC AATCGATAAA CAGGATCACG CTGCGAATCC TTGTGGGCAA 
ATTGGCGAGA CGGTCGATCT CGATGAAGCC GTACAACGTG CGCTGGAATT CGCTAAAAAG 
GATGGCAACA CGCTGGTCAT AGTCACCGCT GATCACGCCC ACGCCAGCCA GATTGTCGCG 
CCGGACACCA AAGCGCCGGG CCTCACCCAG GCGCTAAATA CCAAAGATGG CGCAGTGATG 
GTGATGAGTT ACGGGAACTC CGAAGAGGAT TCACAAGAAC ATACCGGCAG TCAGTTGCGT 
ATTGCAGCGT ATGGCCCACA TGCCGCCAAT GTCGTTGGAC TGACCGACCA GACCGATCTC 
TTCTACACCA TGAAAGCCGC CCTGGGGCTG AAATAA

Protein sequence

MKQSTIALAL LPLLFSPVTK ARTPEMPVLE NRAAQGDITA PGGARRLTGD QTAALRDSLS 
DKPAKNIILL IGDGMGDSEI TAARNYAEGA GGFFKGIDAL PLTGQYTHYA LNKKTGKPDY 
VTDSAASATA WSTGVKTYNG ALGIDIHEKD HPTILEMAKA AGLATGNVST AELQDATPAA 
LVAHVTSRKC YGPSATSEKC PGNALEKGGK GSITEQLLNA RADVTLGGGA KTFAETATAG 
EWQGKTLREQ AQARGYQLVS DAASLNSVTE ANQQKPLLGL FADGNMPVRW LGPKATYHGN 
IDKPAVTCTP NPQRNDSVPT LAQMTDKAIE LLSKNEKGFF LQVEGASIDK QDHAANPCGQ 
IGETVDLDEA VQRALEFAKK DGNTLVIVTA DHAHASQIVA PDTKAPGLTQ ALNTKDGAVM 
VMSYGNSEED SQEHTGSQLR IAAYGPHAAN VVGLTDQTDL FYTMKAALGL K