Gene EcHS_A4072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4072
Symbol	trkH
ID	5594754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4063405
End bp	4064856
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	53%
IMG OID	640923175
Product	potassium transporter
Protein accession	YP_001460641
Protein GI	157163323
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0168] Trk-type K+ transport systems, membrane components
TIGRFAM ID	[TIGR00933] potassium uptake protein, TrkH family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.000000000258715
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATTTTC GCGCCATTAC CCGAATCGTT GGACTACTGG TCATCTTATT TTCAGGGACC 
ATGATTATCC CTGGGCTGGT AGCACTCATC TACCGGGATG GAGCGGGCCG CGCTTTTACC 
CAGACCTTTT TTGTCGCCCT CGCCATTGGC TCTATGCTGT GGTGGCCGAA CCGCAAAGAG 
AAGGGCGAAC TGAAATCCCG TGAGGGGTTT CTGATAGTGG TGCTGTTTTG GACCGTGCTG 
GGTAGTGTCG GTGCGCTCCC TTTTATCTTC TCGGAAAGCC CGAACCTCAC GATTACCGAT 
GCGTTTTTTG AATCTTTCTC TGGCCTGACC ACCACCGGGG CCACTACGCT GGTGGGGCTG 
GATTCGCTCC CTCATGCCAT CCTCTTTTAT CGCCAGATGC TGCAATGGTT TGGCGGGATG 
GGGATCATCG TGTTAGCGGT TGCGATACTG CCTATCCTCG GCGTGGGTGG GATGCAGCTC 
TATCGCGCAG AAATGCCCGG CCCGCTGAAA GATAACAAAA TGCGCCCGCG AATTGCGGAA 
ACGGCGAAAA CCCTGTGGTT GATTTATGTC TTGCTGACCG TCGCCTGTGC GCTGGCGTTG 
TGGTTTGCCG GAATGGATGC CTTTGATGCC ATCGGCCATA GCTTTGCGAC TATCGCTATT 
GGCGGCTTCT CGACACATGA TGCCAGTATC GGTTATTTCG ACAGCCCGAC TATTAACACT 
ATCATTGCTA TCTTCCTGCT GATCTCCGGC TGTAACTACG GTCTGCACTT TTCACTGTTA 
AGTGGGCGTA GTCTGAAGGT TTATTGGCGC GATCCGGAAT TTCGCATGTT TATCGGCGTA 
CAGTTTACGC TGGTGGTTAT TTGTACACTC GTACTGTGGT TTCATAATGT CTACAGTTCG 
GCGCTGATGA CAATTAACCA GGCGTTTTTC CAGGTGGTAT CGATGGCGAC AACCGCCGGG 
TTTACGACTG ACAGCATTGC CCGCTGGCCG CTCTTTTTGC CGGTACTGCT TTTATGTTCA 
GCTTTTATCG GCGGTTGTGC CGGGTCAACG GGCGGTGGCC TGAAAGTGAT CCGCATCCTG 
CTGCTGTTTA AGCAGGGGAA CCGTGAGCTG AAACGACTGG TGCATCCGAA CGCCGTCTAT 
AGCATTAAGC TGGGGAATCG CGCACTGCCG GAACGTATCC TCGAAGCCGT TTGGGGATTT 
TTCTCCGCCT ATGCATTGGT GTTTATTGTC AGTATGCTGG CGATTATCGC CACGGGCGTG 
GATGACTTTT CTGCTTTTGC CTCGGTTGTT GCGACATTGA ATAACCTGGG GCCGGGGCTT 
GGCGTGGTTG CTGATAACTT TACCAGTATG AACCCGGTGG CTAAATGGAT CCTGATTGCC 
AACATGCTGT TTGGTCGTCT CGAGGTCTTT ACATTGCTGG TGCTCTTTAC CCCGACTTTC 
TGGCGTGAAT GA

Protein sequence

MHFRAITRIV GLLVILFSGT MIIPGLVALI YRDGAGRAFT QTFFVALAIG SMLWWPNRKE 
KGELKSREGF LIVVLFWTVL GSVGALPFIF SESPNLTITD AFFESFSGLT TTGATTLVGL 
DSLPHAILFY RQMLQWFGGM GIIVLAVAIL PILGVGGMQL YRAEMPGPLK DNKMRPRIAE 
TAKTLWLIYV LLTVACALAL WFAGMDAFDA IGHSFATIAI GGFSTHDASI GYFDSPTINT 
IIAIFLLISG CNYGLHFSLL SGRSLKVYWR DPEFRMFIGV QFTLVVICTL VLWFHNVYSS 
ALMTINQAFF QVVSMATTAG FTTDSIARWP LFLPVLLLCS AFIGGCAGST GGGLKVIRIL 
LLFKQGNREL KRLVHPNAVY SIKLGNRALP ERILEAVWGF FSAYALVFIV SMLAIIATGV 
DDFSAFASVV ATLNNLGPGL GVVADNFTSM NPVAKWILIA NMLFGRLEVF TLLVLFTPTF 
WRE