Gene EcHS_A1411 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1411
Symbol
ID	5592100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1405255
End bp	1406640
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	53%
IMG OID	640920566
Product	amino acid permease
Protein accession	YP_001458125
Protein GI	157160807
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	49
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTATTA ATTCACCACT GAATATTGCT GCGCAACCCG GCAAAACCCG TCTGCGAAAA 
TCACTGAAAT TGTGGCAGGT GGTAATGATG GGTCTGGCCT ATCTCACGCC GATGACTGTG 
TTCGATACTT TTGGCATTGT GTCAGGCATT AGCGACGGTC ACGTTCCGGC GTCCTATTTG 
CTGGCGCTGG CGGGCGTGCT GTTTACCGCT ATCAGCTACG GCAAACTGGT TCGCCAGTTT 
CCGGAGGCCG GTTCGGCCTA TACCTACGCG CAAAAGTCGA TTAACCCGCA CGTCGGATTT 
ATGGTCGGCT GGTCATCACT GCTGGATTAT CTCTTTTTGC CGATGATCAA CGTTTTGTTG 
GCGAAAATCT ATCTCTCCGC CCTCTTCCCG GAAGTGCCGC CGTGGGTGTG GGTGGTAACC 
TTCGTCGCCA TTTTAACCGC CGCGAATCTG AAGAGCGTCA ACCTGGTCGC TAACTTCAAT 
ACCCTGTTTG TGTTGGTGCA AATCTCCATC ATGGTGGTGT TTATCTTCCT GGTGGTTCAG 
GGACTGCATA AAGGAGAAGG CGTTGGCACG GTCTGGTCGT TACAGCCGTT TATCAGCGAG 
AACGCGCATC TGATTCCGAT TATTACCGGG GCGACGATCG TCTGCTTCTC TTTCCTTGGT 
TTCGATGCAG TGACCACACT TTCGGAAGAG ACACCAGACG CCGCACGCGT GATCCCGAAA 
GCCATCTTCC TGACGGCGGT CTATGGTGGC GTTATCTTTA TCGCGGCGTC GTTCTTTATG 
CAGCTGTTCT TCCCCGATAT CAGCCGCTTT AAAGACCCGG ACGCCGCACT GCCTGAAATT 
GCACTCTACG TCGGCGGTAA GCTGTTCCAG TCGATTTTCC TTTGCACCAC GTTTGTGAAC 
ACGTTAGCGT CTGGCCTGGC CTCACATGCC AGCGTGTCAC GTCTGCTGTA TGTGATGGGG 
CGCGACAATG TGTTTCCGGA GCGCGTGTTT GGCTATGTGC ATCCGAAATG GCGGACTCCG 
GCACTGAACG TCATTATGGT CGGGATTGTC GCGATGTCGG CGCTGTTCTT CGATTTAGTT 
ACCGCCACAG CGTTAATTAA CTTCGGCGCG TTGGTAGCGT TTACCTTCGT TAACCTGTCG 
GTGTTCAACC ACTTCTGGCG GCGCAAAGGA ATGAATAAAA GCTGGAAGGA ACACTTCCAC 
TATTTATTAA TGCCGCTGGT TGGCGCGCTG ACGGTGGGCG TGCTGTGGAT TAACCTCGAA 
GCCACCTCGC TGACGCTGGG TCTGGTATGG GCTTCGTTAG GCGGCGCATA TTTGTGGTAT 
CTGATTCGCC GCTATCGCAA AGTGCCGCTG TACGAAGGTG ACAGAACGCC AGTGAGCGAA 
ACGTAA

Protein sequence

MAINSPLNIA AQPGKTRLRK SLKLWQVVMM GLAYLTPMTV FDTFGIVSGI SDGHVPASYL 
LALAGVLFTA ISYGKLVRQF PEAGSAYTYA QKSINPHVGF MVGWSSLLDY LFLPMINVLL 
AKIYLSALFP EVPPWVWVVT FVAILTAANL KSVNLVANFN TLFVLVQISI MVVFIFLVVQ 
GLHKGEGVGT VWSLQPFISE NAHLIPIITG ATIVCFSFLG FDAVTTLSEE TPDAARVIPK 
AIFLTAVYGG VIFIAASFFM QLFFPDISRF KDPDAALPEI ALYVGGKLFQ SIFLCTTFVN 
TLASGLASHA SVSRLLYVMG RDNVFPERVF GYVHPKWRTP ALNVIMVGIV AMSALFFDLV 
TATALINFGA LVAFTFVNLS VFNHFWRRKG MNKSWKEHFH YLLMPLVGAL TVGVLWINLE 
ATSLTLGLVW ASLGGAYLWY LIRRYRKVPL YEGDRTPVSE T