Gene EcolC_1517 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1517
Symbol
ID	6066963
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1676437
End bp	1677594
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	57%
IMG OID	641600936
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001724506
Protein GI	170019552
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1174] ABC-type proline/glycine betaine transport systems, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.89368
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTTATC TACGTATTAA TCCTGTTCTG GCGCTGCTGC TGTTGCTGAC GGCAATCGCA 
GCGGCGCTGC CGTTTATCAG TTACGCGCCT AATCGTTTAG TCTCGGGTGA AGGGCGTCAT 
CTCTGGCAAC TGTGGCCGCA AACGATCTGG ATGCTGGTGG GCGTTGGTTG CGCCTGGCTG 
ACAGCCTGTT TTATTCCCGC TAAAAAAGGC AGCATTTTTG CACTCATTCT GGCGCAATTC 
GTCTTCGTAT TGCTGGTGTG GGGAGCAGGA AAGGCGGCGA CCCAACTGGC GCAAAATGGC 
AGTGCGCTGG CGCGTACCAG CCTCGGCAGT GGTTTCTGGC TGGCTGCGGC GCTGACATTG 
CTGGCCTGTA GCGATGCCAT CCGCCGAATC TCCACGCATC CGCTGTGGCG CTGGTTGTTG 
CATATGCAGA TTGCCATTAT TCCGCTGTGG TTGCTGTACT CCGGCACGCT TAACGATCTC 
TCACTAATGA AAGAATACGC CAACCGTCAG GATGTGTTTG ACGACGCGCT GGCACAGCAT 
TTGACGTTGC TGTTTGGTGC GGTGCTGCCT GCGTTAGTGA TTGGTGTGCC GTTGGGCATC 
TGGTGCTACT TTTCCACTGC GCGGCAGGGG GCAATTTTTT CTCTGCTCAA TGTCATTCAG 
ACCGTGCCTT CGGTGGCGCT CTTTGGCCTG TTGATTGCGC CGCTTGCCGC GCTGGTTACG 
GCCTTTCCGT GGCTGGGGAA GCTCGGCATA GCAGGAACCG GAATGACACC CGCACTGATT 
GCGCTGGTGC TCTATGCCTT GCTGCCGCTG GTGCGCGGCG TGGTAGTCGG TTTGAACCAG 
ATCCCGCGCG ATGTGCTGGA GAGCGCCAGA GCGATGGGGA TGAGCGGGGC GCAGCGATTC 
CTGCATGTTC AGTTACCACT GGCGTTACCG GTATTTCTGC GCAGCCTGCG GGTGGTGATG 
GTGCAAACTG TAGGTATGGC GGTGATTGCG GCGTTAATCG GCGCAGGCGG TTTTGGTGCG 
CTGGTTTTCC AGGGGCTGCT AAGCAGCGCC ATTGATTTAG TGTTGCTGGG GGTGATCCCG 
GTAATTGTTC TGGCGGTGCT TACCGACGCG CTGTTCGATT TGCTTATCGC ACTGCTGAAG 
GTGAAACGTA ATGATTGA

Protein sequence

MTYLRINPVL ALLLLLTAIA AALPFISYAP NRLVSGEGRH LWQLWPQTIW MLVGVGCAWL 
TACFIPAKKG SIFALILAQF VFVLLVWGAG KAATQLAQNG SALARTSLGS GFWLAAALTL 
LACSDAIRRI STHPLWRWLL HMQIAIIPLW LLYSGTLNDL SLMKEYANRQ DVFDDALAQH 
LTLLFGAVLP ALVIGVPLGI WCYFSTARQG AIFSLLNVIQ TVPSVALFGL LIAPLAALVT 
AFPWLGKLGI AGTGMTPALI ALVLYALLPL VRGVVVGLNQ IPRDVLESAR AMGMSGAQRF 
LHVQLPLALP VFLRSLRVVM VQTVGMAVIA ALIGAGGFGA LVFQGLLSSA IDLVLLGVIP 
VIVLAVLTDA LFDLLIALLK VKRND