Gene EcHS_A4518 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4518
Symbol
ID	5593276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4523477
End bp	4524559
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	54%
IMG OID	640923614
Product	putative permease
Protein accession	YP_001461055
Protein GI	157163737
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0000000000136034
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACCTT TTGGCGTACT TGACCGCTAT ATCGGTAAAA CTATTTTCAC CACCATCATG 
ATGACGCTGT TCATGCTGGT GTCGCTGTCG GGCATTATCA AGTTTGTCGA TCAGCTGAAA 
AAAGCCGGGC AGGGGAGTTA CGACGCGTTA GGCGCAGGAA TGTATACCTT GCTGAGCGTG 
CCGAAAGATG TGCAAATCTT CTTCCCGATG GCAGCTCTGC TTGGGGCGTT GCTTGGTCTT 
GGGATGCTGG CGCAGCGCAG CGAACTGGTG GTGATGCAGG CTTCTGGTTT CACCCGTATG 
CAGGTTGCGC TGTCGGTGAT GAAAACCGCC ATTCCGCTAG TCTTGCTGAC GATGGCGATT 
GGTGAATGGG TCGCGCCGCA GGGCGAGCAG ATGGCGCGTA ACTACCGTGC GCAGGCGATG 
TACGGCGGCT CGTTGCTCTC TACCCAGCAA GGCTTATGGG CGAAAGATGG CAACAACTTC 
GTCTACATTG AGCGGGTTAA AGGTGACGAA GAGTTAGGTG GCATCAGCAT TTATGCCTTT 
AACGAAAATC GTCGTCTGCA ATCCGTACGC TATGCCGCTA CTGCGAAGTT TGACCCGGAA 
CATAAAGTCT GGCGTCTGTC GCAGGTTGAT GAATCTGATC TGACCAATCC GAAACAGATC 
ACCGGTTCGC AGACGGTGAG CGGCACCTGG AAAACCAACC TCACGCCAGA CAAACTGGGC 
GTGGTGGCGC TGGACCCGGA TGCACTCTCA ATCAGCGGTT TGCACAACTA CGTGAAGTAT 
CTGAAGTCGA GCGGTCAGGA CGCTGGACGT TATCAGCTCA ACATGTGGAG CAAAATCTTC 
CAGCCGCTAT CCGTGGCGGT GATGATGCTG ATGGCGCTGT CGTTCATCTT TGGCCCACTG 
CGTAGCGTAC CGATGGGCGT GCGTGTGGTC ACCGGTATCA GCTTCGGTTT TGTCTTCTAC 
GTACTGGACC AGATCTTCGG CCCGTTGACG TTGGTTTATG GCATCCCGCC GATCATCGGC 
GCACTGTTGC CAAGCGCCAG CTTCTTCTTA ATCAGCCTGT GGCTGTTAAT GAGAAAATCG 
TAA

Protein sequence

MQPFGVLDRY IGKTIFTTIM MTLFMLVSLS GIIKFVDQLK KAGQGSYDAL GAGMYTLLSV 
PKDVQIFFPM AALLGALLGL GMLAQRSELV VMQASGFTRM QVALSVMKTA IPLVLLTMAI 
GEWVAPQGEQ MARNYRAQAM YGGSLLSTQQ GLWAKDGNNF VYIERVKGDE ELGGISIYAF 
NENRRLQSVR YAATAKFDPE HKVWRLSQVD ESDLTNPKQI TGSQTVSGTW KTNLTPDKLG 
VVALDPDALS ISGLHNYVKY LKSSGQDAGR YQLNMWSKIF QPLSVAVMML MALSFIFGPL 
RSVPMGVRVV TGISFGFVFY VLDQIFGPLT LVYGIPPIIG ALLPSASFFL ISLWLLMRKS