Gene EcolC_3070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3070
Symbol
ID	6066169
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3353888
End bp	3355300
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	53%
IMG OID	641602486
Product	phenylalanine transporter
Protein accession	YP_001726021
Protein GI	170021067
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1113] Gamma-aminobutyrate permease and related permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCCTCA ACAAAAAAGA CACACAGGGG AAAGGCGTGA AAAACGCGTC AACCGTATCG 
GAAGATACTG CGTCGAATCA AGAGCCGACG CTTCATCGCG GATTACATAA CCGTCATATT 
CAACTGATTG CGTTGGGTGG CGCAATTGGT ACTGGTCTGT TTCTTGGCAT TGGCCCGGCG 
ATTCAGATGG CGGGTCCGGC TGTATTGCTG GGCTACGGCG TCGCCGGGAT CATCGCTTTC 
CTGATTATGC GCCAGCTTGG CGAAATGGTG GTTGAGGAGC CGGTATCCGG TTCATTTGCC 
CACTTTGCCT ATAAATACTG GGGACCGTTT GCGGGCTTCC TCTCTGGCTG GAACTACTGG 
GTAATGTTCG TGCTGGTGGG AATGGCAGAG CTGACCGCTG CGGGCATCTA TATGCAGTAC 
TGGTTCCCGG ATGTTCCAAC GTGGATTTGG GCTGCCGCCT TCTTTATTAT CATCAACGCC 
GTTAACCTGG TGAACGTGCG CTTATATGGC GAAACCGAGT TCTGGTTTGC GCTGATTAAA 
GTGCTGGCGA TCATCGGTAT GATCGGCTTT GGCCTGTGGC TGCTGTTTTC TGGTCACGGC 
GGCGAGAAAG CCAGTATCGA CAACCTCTGG CGCTACGGTG GTTTCTTCGC CACCGGCTGG 
AATGGGCTGA TTTTGTCGCT GGCGGTAATT ATGTTCTCCT TCGGCGGTCT GGAGCTGATT 
GGGATTACTG CCGCTGAAGC GCGCGATCCG GAAAAAAGCA TTCCAAAAGC GGTAAATCAG 
GTGGTGTATC GCATCCTGCT GTTTTACATC GGTTCACTGG TGGTTTTACT GGCGCTCTAT 
CCGTGGGTGG AAGTGAAATC CAACAGTAGC CCGTTTGTGA TGATTTTCCA TAATCTCGAC 
AGCAACGTGG TAGCTTCTGC GCTGAACTTC GTCATTCTGG TAGCATCGCT GTCAGTGTAT 
AACAGCGGGG TTTACTCTAA CAGCCGCATG CTGTTTGGCC TTTCTGTGCA GGGTAATGCG 
CCGAAGTTTT TGACTCGCGT CAGCCGTCGC GGTGTGCCGA TTAACTCGCT GATGCTTTCC 
GGAGCGATCA CTTCGCTGGT GGTGTTAATC AACTATCTGC TGCCGCAAAA AGCGTTTGGT 
CTGCTGATGG CGCTGGTGGT AGCAACGCTG CTGTTGAACT GGATTATGAT CTGTCTGGCG 
CATCTGCGTT TTCGTGCAGC GATGCGACGT CAGGGGCGTG AAACACAGTT TAAGGCGCTG 
CTTTATCCGT TCGGCAACTA TCTTTGCATC GCCTTCCTCG GCATGATTTT GCTGCTGATG 
TGCACGATGG ATGATATGCG CTTGTCAGCG ATCCTGCTGC CGGTGTGGAT TGTATTCCTG 
TTTGTGGCAT TTAAAACGCT GCGTCGGAAA TAA

Protein sequence

MPLNKKDTQG KGVKNASTVS EDTASNQEPT LHRGLHNRHI QLIALGGAIG TGLFLGIGPA 
IQMAGPAVLL GYGVAGIIAF LIMRQLGEMV VEEPVSGSFA HFAYKYWGPF AGFLSGWNYW 
VMFVLVGMAE LTAAGIYMQY WFPDVPTWIW AAAFFIIINA VNLVNVRLYG ETEFWFALIK 
VLAIIGMIGF GLWLLFSGHG GEKASIDNLW RYGGFFATGW NGLILSLAVI MFSFGGLELI 
GITAAEARDP EKSIPKAVNQ VVYRILLFYI GSLVVLLALY PWVEVKSNSS PFVMIFHNLD 
SNVVASALNF VILVASLSVY NSGVYSNSRM LFGLSVQGNA PKFLTRVSRR GVPINSLMLS 
GAITSLVVLI NYLLPQKAFG LLMALVVATL LLNWIMICLA HLRFRAAMRR QGRETQFKAL 
LYPFGNYLCI AFLGMILLLM CTMDDMRLSA ILLPVWIVFL FVAFKTLRRK