Gene EcHS_A3462 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3462
Symbol
ID	5594806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3463385
End bp	3464410
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	49%
IMG OID	640922580
Product	amino acid ABC transporter, periplasmic amino acid-binding protein
Protein accession	YP_001460068
Protein GI	157162750
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID	[TIGR01096] lysine-arginine-ornithine-binding periplasmic protein

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	0.117773
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGA TGATGATAGC CACACTGGCT GCCGCCAGCG TGCTGCTTGC CGTTGCAAAT 
CAGGCGCATG CTGGCGCGAC GCTTGATGCC GTACAGAAAA AAGGTTTTGT GCAATGCGGG 
ATCAGTGATG GATTACCTGG GTTCTCTTAT GCCGATGCTG ACGGTAAATT TTCAGGTATT 
GATGTTGATA TTTGTCGTGG TGTTGCCGCT GCTGTATTTG GTGACGACAC GAAAGTGAAA 
TATACCCCAC TCACAGCAAA AGAACGCTTC ACGGCTTTAC AGTCAGGGGA AGTGGATTTG 
CTCTCCCGTA ATACGACCTG GACTTCATCT CGCGACGCCG GGATGGGAAT GGCATTTACT 
GGCGTCACTT ATTACGACGG CATTGGCTTC CTGACGCACG ATAAAGCGGG GCTAAAAAGC 
GCGAAAGAAC TGGATGGCGC TACCGTCTGT ATTCAGGCGG GTACTGATAC CGAACTCAAC 
GTTGCCGACT ATTTCAAGGC AAACAATATG AAGTACACAC CGGTGACTTT CGATCGCTCT 
GACGAATCAG CGAAGGCACT GGAATCTGGT CGCTGCGATA CGCTGGCCTC GGATCAGTCG 
CAACTGTATG CCCTGCGCAT CAAATTAAGC AACCCAGCTG AATGGATTGT CTTACCGGAG 
GTTATCTCTA AAGAACCGCT TGGGCCGGTA GTTCGTCGTG GCGATGATGA ATGGTTCTCG 
ATTGTACGCT GGACGCTTTT CGCCATGCTG AATGCTGAAG AGATGGGCAT CAATTCCCAG 
AACGTTGATG AAAAAGCGGC TAATCCAGCA ACGCCTGATA TGGCACATCT GCTGGGTAAA 
GAAGGCGATT ACGGCAAGGA TCTGAAGTTG GATAATAAAT GGGCCTATAA CATCATCAAA 
CAGGTGGGTA ACTACTCGGA AATTTTTGAG CGTAACGTAG GTTCAGAAAG CCCGCTGAAA 
ATTAAACGTG GGCAAAATAA TCTCTGGAAT AACGGCGGTA TTCAGTACGC ACCGCCCGTG 
CGTTAA

Protein sequence

MKKMMIATLA AASVLLAVAN QAHAGATLDA VQKKGFVQCG ISDGLPGFSY ADADGKFSGI 
DVDICRGVAA AVFGDDTKVK YTPLTAKERF TALQSGEVDL LSRNTTWTSS RDAGMGMAFT 
GVTYYDGIGF LTHDKAGLKS AKELDGATVC IQAGTDTELN VADYFKANNM KYTPVTFDRS 
DESAKALESG RCDTLASDQS QLYALRIKLS NPAEWIVLPE VISKEPLGPV VRRGDDEWFS 
IVRWTLFAML NAEEMGINSQ NVDEKAANPA TPDMAHLLGK EGDYGKDLKL DNKWAYNIIK 
QVGNYSEIFE RNVGSESPLK IKRGQNNLWN NGGIQYAPPV R