Gene EcHS_A4400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4400
Symbol
ID	5594680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4409135
End bp	4410637
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	47%
IMG OID	640923498
Product	amino acid permease family protein
Protein accession	YP_001460942
Protein GI	157163624
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTCACA CGATAAAAAA GATGAGTCTG ATAGGACTCA TATTGATGAT CTTTACTTCC 
GTATTTGGAT TTGCCAATAG CCCATCGGCT TATTACTTAA TGGGTTATAG TGCGATTCCC 
TTTTATATAT TTTCTGCATT GTTATTCTTT ATTCCATTCG CCTTAATGAT GGCTGAAATG 
GGAGCTGCTT ATCGCAAAGA AGAAGGCGGT ATCTATTCCT GGATGAATAA TAGTGTCGGA 
CCACGTTTTG CCTTCATTGG TACGTTTATG TGGTTTTCCT CTTATATCAT CTGGATGGTG 
AGTACCTCCG CGAAAGTTTG GGTACCGTTC TCAACATTCC TCTATGGTAG CGACATGACC 
CAGCACTGGC GTATTGCTGG ACTGGAGCCT ACGCAGGTGG TTGGTCTGCT GGCAGTGGCA 
TGGATGATTC TGGTCACCGT CGTTGCTTCA AAGGGGATTA ATAAAATTGC CCGCATTACT 
GCGGTGGGCG GTATTGCAGT AATGTGTCTG AATTTAGTAT TGCTGTTAGT AAGCATTACT 
ATTTTGTTAT TAAATGGTGG GCATTTCGCG CAGGATATTA ATTTCCTTGC ATCACCGAAC 
CCAGGTTATC AGTCCGGTCT GGCAATGCTA TCGTTTGTGG TATTTGCTAT TTTTGCCTAT 
GGCGGAATTG AAGCGGTTGG TGGTCTGGTC GATAAAACGG AAAATCCAGA AAAGAACTTT 
GCCAAAGGTA TTGTTTTTGC CGCTATTGTT ATTTCAATCG GTTATTCGCT GGCAATATTT 
TTATGGGGTG TCAGCACAAA CTGGCAGCAG GTATTAAGTA ATGGTTCCGT TAACCTCGGC 
AATATTACCT ATGTGCTGAT GAAGAGCCTC GGGGTGACGC TGGGTAACGC ACTGCATTTG 
TCACCTGAAG CGTCATTGTC GCTGGGTGTA TGGTTTGCGC GTATTACCGG ACTTTCGATG 
TTCCTCGCTT ATACCGGGGC GTTCTTTACG CTTTGCTATT CACCGCTGAA AGCCATCATC 
CAGGGGACGC CGAAAGCGTT GTGGCCGGAA CCGATGACGC GCCTGAATGC GATGGGGATG 
CCTTCTATCG CCATGTGGAT GCAGTGCGGG TTGGTTACTG TCTTCATCCT GCTGGTTTCG 
TTTGGTGGCG GTACCGCATC GGCGTTCTTT AACAAGCTGA CGCTGATGGC GAACGTGTCT 
ATGACGCTTC CTTACCTGTT CCTCGCGCTG GCTTTCCCGT TCTTTAAAGC ACGTCAGGAT 
CTCGACAGAC CGTTTGTGAT TTTCAAAACG CATTTGTCGG CAATGATTGC GACAGTGGTT 
GTCGTACTGG TGGTGACATT TGCGAACGTC TTCACCATCA TTCAACCTGT GGTTGAAGCC 
GGAGACTGGG ACAGCACATT GTGGATGATT GGCGGCCCTG TCTTCTTCTC GCTGTTAGCG 
ATGGCGATTT ACCAGAACTA TTGCAGTCGC ATGGCGAATA AACCTGAGTT AGCTCTCGAC 
TGA

Protein sequence

MPHTIKKMSL IGLILMIFTS VFGFANSPSA YYLMGYSAIP FYIFSALLFF IPFALMMAEM 
GAAYRKEEGG IYSWMNNSVG PRFAFIGTFM WFSSYIIWMV STSAKVWVPF STFLYGSDMT 
QHWRIAGLEP TQVVGLLAVA WMILVTVVAS KGINKIARIT AVGGIAVMCL NLVLLLVSIT 
ILLLNGGHFA QDINFLASPN PGYQSGLAML SFVVFAIFAY GGIEAVGGLV DKTENPEKNF 
AKGIVFAAIV ISIGYSLAIF LWGVSTNWQQ VLSNGSVNLG NITYVLMKSL GVTLGNALHL 
SPEASLSLGV WFARITGLSM FLAYTGAFFT LCYSPLKAII QGTPKALWPE PMTRLNAMGM 
PSIAMWMQCG LVTVFILLVS FGGGTASAFF NKLTLMANVS MTLPYLFLAL AFPFFKARQD 
LDRPFVIFKT HLSAMIATVV VVLVVTFANV FTIIQPVVEA GDWDSTLWMI GGPVFFSLLA 
MAIYQNYCSR MANKPELALD