Gene ECH74115_5490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5490
Symbol	pNaS
ID	6968994
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	5139245
End bp	5140876
Gene Length	1632 bp
Protein Length	543 aa
Translation table	11
GC content	55%
IMG OID	643389135
Product	inorganic phosphate transporter, sodium-dependent
Protein accession	YP_002273532
Protein GI	209398736
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1283] Na+/phosphate symporter
TIGRFAM ID	[TIGR00704] Na/Pi-cotransporter [TIGR01013] Phosphate:Na+ Symporter (PNaS) Family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTAACGC TGCTTAACCT GCTTTCTGCC GTCGCCCTGC TGGTCTGGGG GACTCATATT 
GTTCGAACCG GCGTAATGCG CGTCTTCGGC GCGCGTTTGC GTACTGTCCT TAGCCGGAGC 
GTCGAAAAAA AGCCGCTCGC CTTTTGCGCG GGGATCGGCG TTACCGCACT GGTACAGAGC 
AGTAATGCCA CCACCATGCT GGTGACCTCG TTCGTCGCTC AGGATCTGGT AGCCCTCGCA 
CCGGCTCTGG TCATTGTGCT GGGGGCAGAT GTCGGGACGG CGCTAATGGC GCGTATTCTC 
ACCTTCGACT TATCCTGGCT GTCACCGTTA CTTATTTTTA TCGGCGTGAT TTTTTTCCTC 
GGACGCAAAC AGTCACGCGC CGGGCAACTG GGCCGCGTCG GTATTGGTCT TGGGCTGATT 
TTGCTGGCGC TGGAGTTGAT TGTGCAGGCC GTAACGCCGA TCACCCAGGC AAACGGCGTT 
CAGGTGATCT TTGCCTCGCT GACCGGCGAT ATTCTGCTGG ATGCGCTGAT TGGCGCGATG 
TTCGCCATTA TCAGCTACTC CAGCCTTGCT GCTGTACTGC TGACCGCGAC TCTGACCGCC 
GCAGGCATTA TCTCCTTCCC CGTGGCGCTC TGTCTGGTGA TTGGTGCTAA CCTCGGTTCC 
GGCCTGCTGG CGATGCTCAA CAACAGTGCC GCCAATGCCG CAGCCCGCCG TGTCGCGCTG 
GGTAGTCTGC TGTTTAAGCT GGTGGGTAGC CTGATTATCC TGCCGTTTGT CCATTTGCTG 
GCAGAGACAA TGGGGAAGTT GTCATTGCCA AAAGCGGAAC TGGTGATCTA TTTCCACGTC 
TTCTACAACC TTGTACGTTG CCTGGCCATG CTGCCATTTG TTGACCCGAT GGCACGGTTT 
TGCAAAACGA TTATTCGCGA TGAACCGGAA CTGGATACCC AGCTACGGCC TAAACATCTG 
GATGTCAGCG CGCTGGATAC GCCCACGCTT GCTCTGGCGA ACGCCGCGCG CGAAACCCTG 
CGCATTGGCG ACGCCATGGA ACAGATGATG GAAGGGCTGA ATAAAGTGAT GCACGGCGAG 
CCAAGGCAGG AGAAAGAGCT GCGTAAGCTG GCAGATGATA TCAACGTTCT CTATACCGCC 
ATTAAGCTGT ATCTGGCGCG GATGCCAAAA GAGGAACTGG CAGAAGAAGA GTCGCGCCGC 
TGGGCGGAGA TCATCGAAAT GTCGCTCAAC CTTGAACAGG CCTCCGATAT CGTCGAGCGC 
ATGAGTAGTG AAATTGCCGA CAAATCGCTG GCTGCAAGGC GAGCATTTTC GCTTGATGGC 
TTGAAGGAAC TGGATGCGCT CTATGAGCAA TTGCTCAGTA ATTTAAAGCT GGCAATGTCG 
GTGTTCTTCT CTGGCGATGT CACCAGCGCT CGTCGTTTGC GCCGCAGCAA GCATCGCTTT 
CGCATTCTTA ATCGCCGCTA TTCCCACGCC CACGTCGATC GCCTGCATCA GCAAAACGTG 
CAAAGCATTG AAACCAGTTC GCTACATTTA GGCTTACTGG GAGATATGCA GCGTCTGAAC 
TCGCTGTTTT GTTCGGTGGC TTACAGTGTG CTGGAACAGC CTGATGAAGA TGAGGGACGG 
GACGAGTATT AA

Protein sequence

MLTLLNLLSA VALLVWGTHI VRTGVMRVFG ARLRTVLSRS VEKKPLAFCA GIGVTALVQS 
SNATTMLVTS FVAQDLVALA PALVIVLGAD VGTALMARIL TFDLSWLSPL LIFIGVIFFL 
GRKQSRAGQL GRVGIGLGLI LLALELIVQA VTPITQANGV QVIFASLTGD ILLDALIGAM 
FAIISYSSLA AVLLTATLTA AGIISFPVAL CLVIGANLGS GLLAMLNNSA ANAAARRVAL 
GSLLFKLVGS LIILPFVHLL AETMGKLSLP KAELVIYFHV FYNLVRCLAM LPFVDPMARF 
CKTIIRDEPE LDTQLRPKHL DVSALDTPTL ALANAARETL RIGDAMEQMM EGLNKVMHGE 
PRQEKELRKL ADDINVLYTA IKLYLARMPK EELAEEESRR WAEIIEMSLN LEQASDIVER 
MSSEIADKSL AARRAFSLDG LKELDALYEQ LLSNLKLAMS VFFSGDVTSA RRLRRSKHRF 
RILNRRYSHA HVDRLHQQNV QSIETSSLHL GLLGDMQRLN SLFCSVAYSV LEQPDEDEGR 
DEY