Gene ECH74115_4737 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4737
Symbol
ID	6969749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4380363
End bp	4381355
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	47%
IMG OID	643388438
Product	hypothetical protein
Protein accession	YP_002272866
Protein GI	209400933
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0226] ABC-type phosphate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAAT TCACCGGTGT TTTACTATTA GGCACGGCGT TACTGGCGGG ATGTGTCGAC 
CGGGAAGGGT ACTATAACAG CGTCAGGGAA GAAGAGAGCC ATGGACTGAC GTCTCTGCGG 
GGGCAACCTG CATTACGTTA CAGCGATGAT TGGTCAAGAT GGCCGAGAGT GTACGGCGCT 
ACAGCCTTAT ACCCGCTGTA TGCCTCCGCG TATTATAAAT TAGTACCCGA GCCAAAAGAT 
AAGGATCGAA CCTCGCTGGC CTGGCAGGCG TATGGTTTGC AGCAAACCCG AACAGCTGAA 
GCCTACGATA GTCTGATTAA AGGTTCCGCG ACGGTTATTT TTGTTGCACA ACCGTCGGAA 
GGACAGAAAA AACGTGCAGA AGAAGCGGGT GTTAAACTGA AATATACCGC TTTCGCCCGC 
GAAGCCTTTG TCTTTATCGT TGATATTAAT AACCCGGTAA ATTCTCTCTC TGAGCACCAG 
GTTAAAGATA TTTTTAGCGG CAAAACTAGC CGCTGGAATA AAGTAGGTGG TAGTGACGAA 
CATATAAAAG TCTGGCAGCG CCCTGAAGAT TCTGGAAGCC AAACGATTAT GAAGGGGTTG 
GTTATGCAAG ACACCCCAAT GCTGCCAGCT AAAAAATCCA CTGTGATTGA TCTTATGGGC 
GGTTTAATTA CTGAAGTTGC CGACTATCAA AACACGCCAT CTTCCATTGG GTACACCTTC 
CACTATTACG TCACTCGTAT GAATGACAAT ATGCTCAAAA TGCGCAAGCA GATTAAACTT 
TTGGCTATAA ATGGCGTTGC GCCTACCGAG GAAAATATCC GCAACGGCAC TTATCCATAC 
ATTGTGGATG CCTATATGGT GACGCGTGAA AATCCCACGC CGGAAACGCA GAAATTTGTT 
GACTGGTTTA TAAGTCAGCA GGGGCAACAG TTGGTAGAGG ATGTGGGGTA TGTGCCGCTG 
TATGAAGCAT CCCCCGAATC ATCAGGACAA TAA

Protein sequence

MNKFTGVLLL GTALLAGCVD REGYYNSVRE EESHGLTSLR GQPALRYSDD WSRWPRVYGA 
TALYPLYASA YYKLVPEPKD KDRTSLAWQA YGLQQTRTAE AYDSLIKGSA TVIFVAQPSE 
GQKKRAEEAG VKLKYTAFAR EAFVFIVDIN NPVNSLSEHQ VKDIFSGKTS RWNKVGGSDE 
HIKVWQRPED SGSQTIMKGL VMQDTPMLPA KKSTVIDLMG GLITEVADYQ NTPSSIGYTF 
HYYVTRMNDN MLKMRKQIKL LAINGVAPTE ENIRNGTYPY IVDAYMVTRE NPTPETQKFV 
DWFISQQGQQ LVEDVGYVPL YEASPESSGQ