Gene EcolC_0436 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0436
Symbol
ID	6067883
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	472513
End bp	473616
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	52%
IMG OID	641599842
Product	polar amino acid ABC transporter, inner membrane subunit
Protein accession	YP_001723441
Protein GI	170018487
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0765] ABC-type amino acid transport system, permease component
TIGRFAM ID	[TIGR01726] amine acid ABC transporter, permease protein, 3-TM region, His/Glu/Gln/Arg/opine family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.497316
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAAAG TATTGCTGTC TCATCCCCCG CGCCCGGCGA GCCATAACTC AAACCGCGCG 
ATGGTGTGGG TGCGAAAAAA TCTGTTCTCC AGCTGGAGCA ATAGCCTGCT GACTATTGGC 
TGCATATGGT TGATGTGGGA ACTGATCCCA CCGTTGCTGA ACTGGGCATT TTTGCAGGCT 
AACTGGGTTG GCTCAACGCG TGCCGACTGC ACAAAAGCCG GTGCCTGTTG GGTCTTCATC 
CACGAACGAT TTGGTCAGTT TATGTATGGG CTTTACCCAC ACGACCAACG CTGGCGAATT 
AACCTCGCAT TACTGATTGG GCTTGTGTCG ATCGCACCAA TGTTCTGGAA AATACTCCCG 
CATCGCGGTC GCTATATTGC GGCCTGGGCG GTGATTTACC CACTGATTGT CTGGTGGCTG 
ATGTATGGCG GTTTTTTTGC TCTTGAGCGG GTTGAAACCC GGCAATGGGG CGGGCTGACG 
CTAACTTTAA TTATTGCATC AGTTGGGATT GCGGGGGCGC TACCGTGGGG GATCTTACTG 
GCGTTAGGTC GCCGCTCCCA TATGCCGATT GTGCGTATCT TATCGGTCAT TTTTATCGAG 
TTCTGGCGCG GCGTACCGTT GATTACCGTA TTGTTTATGT CTTCGGTCAT GCTGCCGTTG 
TTTATGGCAG AAGGCACCAG TATCGACAAA CTGATCCGCG CGCTGGTTGG CGTGATCCTG 
TTTCAGTCAG CATATGTTGC GGAAGTCGTG CGAGGCGGAT TACAGGCACT GCCTAAAGGG 
CAGTATGAAG CGGCAGAGTC GCTGGCGTTG GGTTACTGGA AAACTCAGGG GCTGGTTATT 
CTGCCACAGG CGTTGAAGCT GGTAATTCCT GGGCTGGTAA ATACCATCAT CGCACTCTTC 
AAAGATACCA GCCTGGTGAT CATTATCGGG TTGTTCGATC TTTTCAGTAG CGTTCAGCAG 
GCAACCGTTG ATCCCGCCTG GTTGGGTATG TCGACGGAAG GGTATGTTTT CGCCGCGCTG 
ATCTACTGGA TCTTCTGTTT CAGCATGTCG CGCTATAGCC AGCATCTGGA AAAACGTTTT 
AACACCGGGC GTACACCGCA TTGA

Protein sequence

MTKVLLSHPP RPASHNSNRA MVWVRKNLFS SWSNSLLTIG CIWLMWELIP PLLNWAFLQA 
NWVGSTRADC TKAGACWVFI HERFGQFMYG LYPHDQRWRI NLALLIGLVS IAPMFWKILP 
HRGRYIAAWA VIYPLIVWWL MYGGFFALER VETRQWGGLT LTLIIASVGI AGALPWGILL 
ALGRRSHMPI VRILSVIFIE FWRGVPLITV LFMSSVMLPL FMAEGTSIDK LIRALVGVIL 
FQSAYVAEVV RGGLQALPKG QYEAAESLAL GYWKTQGLVI LPQALKLVIP GLVNTIIALF 
KDTSLVIIIG LFDLFSSVQQ ATVDPAWLGM STEGYVFAAL IYWIFCFSMS RYSQHLEKRF 
NTGRTPH