Gene EcolC_4181 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4181
Symbol
ID	6067347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4619566
End bp	4620465
Gene Length	900 bp
Protein Length	299 aa
Translation table	11
GC content	55%
IMG OID	641603609
Product	carboxylate/amino acid/amine transporter
Protein accession	YP_001727105
Protein GI	170022151
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID	[TIGR00950] Carboxylate/Amino Acid/Amine Transporter

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0864049
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGCTAC TTATCATCAC CACGATTCTG TGGGCCTTCT CCTTTAGCTT TTATGGCGAG 
TACCTTGCGG GGCACGTCGA TAGCTATTTT GCGGTGCTGG TGCGTGTTGG TCTGGCGGCA 
CTCGTTTTTC TGCCGTTTCT GCGTACCCGT GGCAATAGCC TGAAAACGGT CGGCCTGTAT 
ATGCTGGTGG GCGCGATGCA GCTTGGCGTG ATGTATATGC TGAGTTTCCG CGCTTATCTC 
TACCTGACGG TTTCCGAGCT GCTGCTGTTC ACCGTGCTGA CGCCGCTCTA CATCACGCTG 
ATTTATGACA TCATGAGTAA GCGCCGTCTG CGCTGGGGCT ATGCCTTTAG CGCCTTGCTG 
GCGGTGATTG GTGCCGGGAT TATTCGCTAT GATCAGGTCA CCGACCATTT CTGGACTGGC 
TTGCTGCTGG TGCAACTCTC CAATATCACT TTTGCCATTG GCATGGTGGG TTACAAACGC 
CTGATGGAAA CTCGCCCGAT GCCACAGCAT AACGCCTTTG CGTGGTTCTA TCTTGGCGCG 
TTTCTGGTGG CAGTGATTGC ATGGTTCTTG CTGGGAAATG CGCAGAAAAT GCCGCAAACC 
ACGCTGCAAT GGGGCATTCT GGTGTTTCTT GGCGTGGTGG CTTCCGGGAT TGGCTACTTT 
ATGTGGAACT ACGGCGCGAC GCAGGTGGAC GCCGGAACGC TGGGCATTAT GAATAATATG 
CACGTTCCGG CAGGGCTGCT GGTAAACCTG GCTATCTGGC ACCAACAGCC GCACTGGCCA 
ACGTTTATTA CAGGCGCGCT GGTGATCCTG GCCTCACTGT GGGTGCATCG TAAGTGGGTC 
GCTCCGCGCT CTTCACAAAC GGCAGATGAT CGCAGGCGTG ATTGCGCGCT GAGCGAATAA

Protein sequence

MALLIITTIL WAFSFSFYGE YLAGHVDSYF AVLVRVGLAA LVFLPFLRTR GNSLKTVGLY 
MLVGAMQLGV MYMLSFRAYL YLTVSELLLF TVLTPLYITL IYDIMSKRRL RWGYAFSALL 
AVIGAGIIRY DQVTDHFWTG LLLVQLSNIT FAIGMVGYKR LMETRPMPQH NAFAWFYLGA 
FLVAVIAWFL LGNAQKMPQT TLQWGILVFL GVVASGIGYF MWNYGATQVD AGTLGIMNNM 
HVPAGLLVNL AIWHQQPHWP TFITGALVIL ASLWVHRKWV APRSSQTADD RRRDCALSE