Gene EcHS_A3696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3696
Symbol
ID	5595303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3683373
End bp	3684842
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	52%
IMG OID	640922810
Product	inner membrane transporter YhiP
Protein accession	YP_001460290
Protein GI	157162972
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3104] Dipeptide/tripeptide permease
TIGRFAM ID	[TIGR00924] amino acid/peptide transporter (Peptide:H+ symporter), bacterial

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACAA CAACACCCAT GGGGATGCTG CAGCAACCTC GCCCATTTTT CATGATCTTT 
TTTGTCGAGT TATGGGAGCG ATTCGGCTAC TACGGCGTGC AGGGCGTACT GGCGGTTTTC 
TTCGTTAAAC AGCTTGGATT CTCGCAAGAG CAGGCTTTTG TCACTTTTGG TGCTTTTGCT 
GCGCTGGTCT ATGGCCTCAT TTCCATTGGC GGCTATGTCG GCGACCACCT GCTGGGGACC 
AAACGCACCA TTGTTCTTGG TGCACTTGTG CTGGCGATTG GCTACTTCAT GACCGGCATG 
TCGCTACTTA AGCCTGACCT GATTTTCATC GCCCTGGGGA CTATCGCTGT AGGTAACGGC 
CTGTTTAAAG CTAACCCAGC CAGCTTGCTT TCGAAGTGCT ATCCGCCGAA AGATCCGCGG 
CTTGATGGCG CATTCACCCT GTTCTATATG TCGATCAACA TCGGCTCGTT GATAGCGTTA 
TCGCTGGCCC CTGTGATCGC TGATAGATTC GGTTATTCAG TCACCTACAA CCTGTGCGGG 
GCGGGGTTAA TTATCGCATT ACTGGTTTAC ATCGCCTGTC GTGGAATGGT GAAAGACATT 
GGTTCTGAAC CCGACTTCCG GCCAATGAGC TTCAGCAAAC TGTTGTACGT GTTACTTGGC 
AGCGTGGTGA TGATCTTCGT ATGCGCATGG CTGATGCACA ACGTAGAAGT CGCCAATCTG 
GTGCTGATTG TTCTCTCCAT CGTCGTCACC ATCATCTTCT TTCGTCAGGC ATTCAAGCTG 
GATAAAACCG GGCGCAATAA AATGTTTGTC GCCTTTGTCC TGATGCTCGA AGCGGTGGTG 
TTTTACATTC TCTACGCCCA GATGCCAACA TCGCTGAACT TCTTTGCCAT CAACAACGTG 
CATCATGAAA TTCTCGGTTT TTCCATCAAC CCGGTCAGCT TCCAGGCGCT TAACCCGTTC 
TGGGTGGTAC TCGCCAGCCC AATACTGGCA GGCATTTACA CGCATCTGGG TAACAAAGGC 
AAAGACCTCT CGATGCCGAT GAAATTTACT CTCGGCATGT TTATGTGCTC ACTGGGCTTT 
TTGACGGCGG CAGCTGCGGG AATGTGGTTT GCGGATGCAC AAGGGCTGAC ATCGCCATGG 
TTTATCGTGC TGGTGTACTT ATTCCAGAGC TTAGGTGAAC TGTTTATTAG CGCCCTTGGC 
CTGGCGATGA TTGCTGCCCT GGTGCCGCAG CATTTGATGG GCTTTATTCT CGGGATGTGG 
TTCCTGACGC AGGCTGCCGC GTTCTTGCTG GGCGGCTATG TGGCAACATT TACCGCGGTG 
CCGGACAACA TTACCGATCC GCTTGAGACG TTGCCCGTCT ATACCAACGT GTTTGGTAAG 
ATTGGTCTGG TCACGCTGGG CGTTGCAGTA GTGATGCTGT TGATGGTGCC GTGGCTGAAA 
CGCATGATTG CGACGCCGGA AAGCCATTAA

Protein sequence

MNTTTPMGML QQPRPFFMIF FVELWERFGY YGVQGVLAVF FVKQLGFSQE QAFVTFGAFA 
ALVYGLISIG GYVGDHLLGT KRTIVLGALV LAIGYFMTGM SLLKPDLIFI ALGTIAVGNG 
LFKANPASLL SKCYPPKDPR LDGAFTLFYM SINIGSLIAL SLAPVIADRF GYSVTYNLCG 
AGLIIALLVY IACRGMVKDI GSEPDFRPMS FSKLLYVLLG SVVMIFVCAW LMHNVEVANL 
VLIVLSIVVT IIFFRQAFKL DKTGRNKMFV AFVLMLEAVV FYILYAQMPT SLNFFAINNV 
HHEILGFSIN PVSFQALNPF WVVLASPILA GIYTHLGNKG KDLSMPMKFT LGMFMCSLGF 
LTAAAAGMWF ADAQGLTSPW FIVLVYLFQS LGELFISALG LAMIAALVPQ HLMGFILGMW 
FLTQAAAFLL GGYVATFTAV PDNITDPLET LPVYTNVFGK IGLVTLGVAV VMLLMVPWLK 
RMIATPESH