Gene EcolC_1626 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1626
Symbol
ID	6066151
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1807869
End bp	1809227
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	52%
IMG OID	641601041
Product	amino acid permease-associated region
Protein accession	YP_001724611
Protein GI	170019657
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.287278
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCATA ACGTTACTCC AAACACCTCT CGCGTGGAAT TGCGTAAAAC GCTTACGTTA 
GTTCCGGTTG TAATGATGGG TCTTGCCTAT ATGCAGCCGA TGACGCTGTT TGATACTTTT 
GGTATCGTTT CAGGCCTCAC GGATGGTCAT GTGCCGACAG CCTATGCGTT CGCATTGATT 
GCGATCCTGT TTACGGCTCT GAGCTACGGG AAGCTGGTTC GCCGCTATCC TTCTGCTGGC 
TCTGCATACA CTTACGCCCA GAAATCCATT AGCCCGACTG TCGGCTTTAT GGTGGGTTGG 
TCTTCTCTGC TCGACTATCT GTTCGCGCCG ATGATCAACA TTCTGCTGGC GAAAATTTAT 
TTTGAAGCTC TGGTGCCTTC CATCCCATCG TGGATGTTTG TGGTGGCGCT GGTGGCCTTT 
ATGACCGCCT TTAACCTGCG TAGTCTGAAA TCCGTAGCGA ACTTCAACAC TGTAATCGTC 
GTGTTGCAGG TAGTGCTGAT CGCGGTGATT CTGGGCATGG TTGTTTATGG CGTATTTGAA 
GGTGAAGGCG CTGGTACGCT GGCGAGCACT CGTCCATTCT GGTCTGGCGA TGCGCATGTT 
ATCCCGATGA TTACCGGGGC GACAATCCTG TGCTTCTCCT TTACCGGCTT TGACGGCATC 
AGCAACCTGT CGGAAGAAAC CAAAGATGCA GAGCGCGTGA TCCCGCGTGC GATTTTCCTG 
ACCGCGCTGA TTGGCGGCAT GATCTTCATC TTTGCAACTT ACTTCCTGCA GCTGTACTTC 
CCGGATATCT CTCGCTTTAA AGATCCGGAT GCGTCACAGC CTGAAATCAT GCTGTATGTT 
GCAGGTAAAG CATTCCAGGT TGGTGCGCTG ATCTTCTCCA CCATTACCGT ACTGGCGTCC 
GGTATGGCGG CGCATGCAGG CGTTGCGCGT CTGATGTACG TAATGGGGCG TGACGGCGTA 
TTCCCGAAAA GCTTCTTCGG TTATGTACAC CCGAAATGGC GTACTCCGGC GATGAACATC 
ATCCTGGTTG GCGCGATTGC CTTGCTGGCA ATCAACTTCG ACCTGGTAAT GGCTACAGCG 
CTGATCAACT TTGGTGCGTT GGTGGCGTTC ACCTTCGTTA ACCTGTCGGT CATCTCGCAG 
TTCTGGATCC GTGAGAAGCG TAACAAGACG CTGAAAGATC ACTTCCAGTA TCTGTTCCTG 
CCGATGTGTG GTGCGCTGAC CGTTGGTGCG CTGTGGGTTA ACCTGGAAGA AAGCTCAATG 
GTTCTGGGTC TGATCTGGGC GGCTATCGGT CTGATTTACC TGGCTTGCGT CACCAAGAGT 
TTCCGTAATC CGGTTCCGCA GTACGAAGAC GTAGCGTAA

Protein sequence

MSHNVTPNTS RVELRKTLTL VPVVMMGLAY MQPMTLFDTF GIVSGLTDGH VPTAYAFALI 
AILFTALSYG KLVRRYPSAG SAYTYAQKSI SPTVGFMVGW SSLLDYLFAP MINILLAKIY 
FEALVPSIPS WMFVVALVAF MTAFNLRSLK SVANFNTVIV VLQVVLIAVI LGMVVYGVFE 
GEGAGTLAST RPFWSGDAHV IPMITGATIL CFSFTGFDGI SNLSEETKDA ERVIPRAIFL 
TALIGGMIFI FATYFLQLYF PDISRFKDPD ASQPEIMLYV AGKAFQVGAL IFSTITVLAS 
GMAAHAGVAR LMYVMGRDGV FPKSFFGYVH PKWRTPAMNI ILVGAIALLA INFDLVMATA 
LINFGALVAF TFVNLSVISQ FWIREKRNKT LKDHFQYLFL PMCGALTVGA LWVNLEESSM 
VLGLIWAAIG LIYLACVTKS FRNPVPQYED VA