Gene EcHS_A4517 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4517
Symbol
ID	5593275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4522377
End bp	4523477
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	55%
IMG OID	640923613
Product	putative permease
Protein accession	YP_001461054
Protein GI	157163736
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	4.2463499999999995e-20
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATAATCA TAAGATATCT GGTGCGGGAG ACGCTCAAAA GCCAGCTGGC GATACTCTTC 
ATCTTGCTTT TGATCTTCTT CTGTCAAAAG TTAGTGAGGA TCCTCGGCGC AGCGGTTGAC 
GGCGATATTC CGGCGAATCT GGTGCTCTCC CTTCTCGGGT TGGGCGTGCC GGAAATGGCG 
CAGCTTATCC TGCCATTAAG CCTGTTCCTC GGGCTGCTGA TGACGCTGGG CAAACTGTAT 
ACCGAAAGTG AAATTACGGT AATGCATGCC TGCGGCCTGA GCAAAGCGGT TCTGGTGAAA 
GCGGCAATGA TCCTTGCGGT ATTCACGGCA ATCGTCGCGG CGGTTAACGT GATGTGGGCG 
GGACCGTGGT CATCGCGTCA TCAGGATGAA GTGTTAGCAG AAGCGAAAGC GAACCCTGGC 
ATGGCGGCGC TGGCGCAAGG GCAATTCCAG CAAGCGACTA ATGGCAGTTC GGTGCTGTTC 
ATCGAAAGCG TTGACGGCAG CGATTTCAAA GATGTGTTCC TCGCGCAAAT TCGACCAAAA 
GGTAATGCAC GTCCTTCTGT GGTGGTGGCC GATTCCGGAC ATTTAACCCA GCTGCGCGAC 
GGCTCCCAGG TCGTCACTCT CAACCAGGGA ACGCGCTTCG AAGGCACTGC ACTGTTACGT 
GATTTCCGCA TTACGGATTT CCAGGATTAT CAGGCGATCA TTGGTCACCA GGCGGTGGCG 
CTCGACCCGA ACGATACCGA CCAGATGGAC ATGCGCACAT TGTGGAACAC TGACACCGAT 
CGTGCTCGCG CAGAACTGAA CTGGCGTATC ACGTTGGTGT TCACCGTGTT TATGATGGCA 
CTTATGGTCG TACCGCTGAG CGTGGTTAAC CCGCGTCAGG GGCGCGTACT ATCGATGCTG 
CCAGCCATGC TGCTGTATCT GTTGTTCTTC CTGATCCAGA CCTCCCTGAA ATCGAACGGC 
GGTAAAGGTA AGCTGGACCC GACGCTGTGG ATGTGGACCG TTAACCTGAT TTATCTGGCT 
TTGGCGATTG TTCTCAACCT TTGGGACACC GTGCCGGTCC GCCGCCTGCG CGCCAGTTTT 
TCGCGTAAAG GAGCGGTGTG A

Protein sequence

MIIIRYLVRE TLKSQLAILF ILLLIFFCQK LVRILGAAVD GDIPANLVLS LLGLGVPEMA 
QLILPLSLFL GLLMTLGKLY TESEITVMHA CGLSKAVLVK AAMILAVFTA IVAAVNVMWA 
GPWSSRHQDE VLAEAKANPG MAALAQGQFQ QATNGSSVLF IESVDGSDFK DVFLAQIRPK 
GNARPSVVVA DSGHLTQLRD GSQVVTLNQG TRFEGTALLR DFRITDFQDY QAIIGHQAVA 
LDPNDTDQMD MRTLWNTDTD RARAELNWRI TLVFTVFMMA LMVVPLSVVN PRQGRVLSML 
PAMLLYLLFF LIQTSLKSNG GKGKLDPTLW MWTVNLIYLA LAIVLNLWDT VPVRRLRASF 
SRKGAV