Gene EcolC_2946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2946
Symbol
ID	6065618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3212669
End bp	3214150
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	52%
IMG OID	641602358
Product	amino acid/peptide transporter
Protein accession	YP_001725900
Protein GI	170020946
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3104] Dipeptide/tripeptide permease
TIGRFAM ID	[TIGR00924] amino acid/peptide transporter (Peptide:H+ symporter), bacterial

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.701623
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAAC ACGCATCACA GCCGCGCGCT ATTTACTATG TCGTTGCGCT GCAAATCTGG 
GAATATTTTA GCTTTTACGG CATGCGTGCC CTGCTGATTC TCTATCTCAC CAATCAACTA 
AAATACAACG ATACTCACGC CTACGAGTTA TTTAGCGCCT ACTGTTCGCT GGTGTATGTC 
ACGCCAATCC TCGGTGGCTT TTTGGCGGAT AAAGTTCTCG GCAATCGCAT GGCGGTGATG 
CTGGGGGCGT TGTTGATGGC GATCGGTCAT GTGGTGCTGG GTGCCAGTGA GATCCATCCG 
TCATTCCTCT ATCTGTCCCT GGCGATTATC GTCTGCGGCT ATGGCCTGTT TAAATCTAAC 
GTAAGCTGTC TGCTCGGCGA GCTGTATGAG CCAACCGATC CGCGTCGTGA TGGCGGTTTC 
TCGCTGATGT ATGCGGCGGG TAACGTGGGG TCTATTATCG CACCTATCGC CTGTGGTTAC 
GCCCAGGAAG AGTACAGCTG GGCGATGGGC TTTGGCCTGG CGGCGGTTGG CATGATCGCG 
GGTCTGGTCA TTTTCTTATG TGGCAATCGT CATTTCACTC ATACCCGCGG CGTTAACAAA 
AAAGTACTGC GTGCGACAAA CTTTCTCCTG CCGAACTGGG GATGGCTGCT GGTTCTGCTG 
GTGGCAACGC CTGCACTGAT TACCATACTG TTCTGGAAAG AGTGGTCGGT ATACGCCTTA 
ATTGTCGCGA CTATTATTGG CCTGGGTGTA CTGGCAAAAA TTTATCGCAA AGCAGAAAAC 
CAGAAACAGC GGAAGGAGCT GGGGCTGATT GTGACGCTCA CCTTCTTCAG TATGTTGTTC 
TGGGCCTTCG CACAACAGGG CGGTAGCTCG ATTAGCCTTT ATATCGACCG CTTCGTTAAC 
CGCGATATAT TTGGTTATAC CGTTCCGACC GCGATGTTCC AGTCGATTAA TGCCTTCGCA 
GTTATGCTGT GCGGTGTGTT CCTGGCGTGG GTGGTAAAAG AGAGTGTCGC GGGTAATCGT 
ACCGTGCGCA TCTGGGGGAA ATTTGCTCTT GGCCTTGGCC TGATGAGCGC CGGATTCTGC 
ATTCTGACCT TAAGCGCCCG CTGGTCCGCA ATGTATGGTC ACTCTTCTCT GCCACTGATG 
GTATTAGGCC TGGCGGTGAT GGGCTTTGCG GAACTGTTTA TCGACCCGGT TGCCATGTCG 
CAAATTACGC GCATTGAAAT CCCCGGTGTG ACCGGCGTAT TAACCGGCAT CTACATGCTG 
CTTTCTGGCG CGATCGCGAA CTATCTGGCG GGCGTGATTG CCGATCAGAC ATCGCAGGCT 
TCGTTTGATG CTTCCGGGGC GATCAACTAC TCCATCAATG CATATATTGA AGTATTTGAT 
CAAATTACCT GGGGCGCACT GGCGTGTGTA GGAGTGGTAC TAATGATTTG GCTGTATCAG 
GCGCTGAAAT TCAGAAACCG CGCGCTGGCG CTGGAGTCAT AA

Protein sequence

MNKHASQPRA IYYVVALQIW EYFSFYGMRA LLILYLTNQL KYNDTHAYEL FSAYCSLVYV 
TPILGGFLAD KVLGNRMAVM LGALLMAIGH VVLGASEIHP SFLYLSLAII VCGYGLFKSN 
VSCLLGELYE PTDPRRDGGF SLMYAAGNVG SIIAPIACGY AQEEYSWAMG FGLAAVGMIA 
GLVIFLCGNR HFTHTRGVNK KVLRATNFLL PNWGWLLVLL VATPALITIL FWKEWSVYAL 
IVATIIGLGV LAKIYRKAEN QKQRKELGLI VTLTFFSMLF WAFAQQGGSS ISLYIDRFVN 
RDIFGYTVPT AMFQSINAFA VMLCGVFLAW VVKESVAGNR TVRIWGKFAL GLGLMSAGFC 
ILTLSARWSA MYGHSSLPLM VLGLAVMGFA ELFIDPVAMS QITRIEIPGV TGVLTGIYML 
LSGAIANYLA GVIADQTSQA SFDASGAINY SINAYIEVFD QITWGALACV GVVLMIWLYQ 
ALKFRNRALA LES