Gene EcolC_1043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1043
Symbol
ID	6066479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1128517
End bp	1129917
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	51%
IMG OID	641600456
Product	gamma-aminobutyrate transporter
Protein accession	YP_001724039
Protein GI	170019085
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1113] Gamma-aminobutyrate permease and related permeases
TIGRFAM ID	[TIGR01773] gamma-aminobutyrate permease

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGCAAT CATCGCAACC ACATGAGTTA GGCGGCGGGC TGAAGTCACG CCACGTCACC 
ATGTTGTCTA TTGCCGGTGT TATCGGCGCA AGTCTGTTTG TCGGTTCCAG CGTCGCCATC 
GCCGAAGCGG GCCCGGCGGT ATTACTGGCC TATCTGTTCG CCGGGCTACT GGTGGTTATG 
ATTATGCGGA TGTTGGCGGA AATGGCGGTT GCCACGCCCG ATACCGGTTC GTTTTCCACC 
TATGCCGATA AAGCCATTGG TCGCTGGGCG GGCTATACCA TCGGCTGGTT GTACTGGTGG 
TTTTGGGTAC TGGTTATCCC GCTGGAAGCC AACATCGCCG CCATGATCCT GCACTCATGG 
GTTCCAGGCA TTCCCATCTG GTTATTTTCC CTCGTCATTA CCCTCGCCTT AACTGGCAGT 
AACTTATTAA GCGTTAAAAA CTACGGCGAA TTTGAGTTCT GGCTGGCGCT GTGCAAAGTC 
ATCGCTATCC TGGCCTTTAT TTTCCTTGGT GCAGTCGCAA TTAGCGGTTT TTACCCGTAT 
GCCGAAGTGA GCGGGATCTC AAGATTGTGG GATAGCGGCG GCTTTATGCC CAACGGTTTC 
GGTGCGGTAT TAAGCGCGAT GTTGATCACC ATGTTCTCGT TTATGGGCGC AGAAATTGTC 
ACCATTGCCG CCGCGGAATC CGACACGCCG GAAAAACATA TTGTCCGCGC CACCAACTCG 
GTTATCTGGC GTATTTCTAT CTTCTATTTA TGTTCTATTT TTGTCGTCGT GGCATTAATT 
CCGTGGAATA TGCCCGGACT AAAAGCCGTC GGTTCTTATC GCTCGGTACT GGAATTGCTC 
AATATTCCCC ATGCGAAATT AATCATGGAC TGCGTGATAT TACTTTCCGT AACCAGTTGC 
CTGAACTCGG CGCTGTATAC CGCGTCAAGG ATGCTCTACT CCTTAAGTCG TCGCGGTGAT 
GCTCCCGCGG TAATGGGTAA AATCAACCGC AGTAAAACCC CGTACGTGGC GGTGTTACTC 
TCCACCGGCG CGGCATTCTT AACGGTGGTG GTGAACTATT ACGCGCCTGC GAAGGTATTT 
AAATTTCTGA TCGACAGCTC CGGCGCTATC GCCCTGCTGG TTTATTTAGT CATCGCCGTT 
TCACAGTTGC GGATGCGCAA AATTCTGCGA GCAGAAGGAA GCGAAATTCG CTTGCGAATG 
TGGCTTTATC CGTGGCTCAC CTGGCTAGTC ATCGGCTTTA TTACCTTTGT GTTGGTAGTG 
ATGCTATTCC GTCCGGCGCA ACAGTTAGAA GTGATCTCCA CCGGCTTATT AGCGATAGGG 
ATTATCTGTA CCGTGCCAAT TATGGCTCGC TGGAAAAAGC TGGTATTGTG GCAAAAAACA 
CCCGTTCATA ATACGCGCTG A

Protein sequence

MGQSSQPHEL GGGLKSRHVT MLSIAGVIGA SLFVGSSVAI AEAGPAVLLA YLFAGLLVVM 
IMRMLAEMAV ATPDTGSFST YADKAIGRWA GYTIGWLYWW FWVLVIPLEA NIAAMILHSW 
VPGIPIWLFS LVITLALTGS NLLSVKNYGE FEFWLALCKV IAILAFIFLG AVAISGFYPY 
AEVSGISRLW DSGGFMPNGF GAVLSAMLIT MFSFMGAEIV TIAAAESDTP EKHIVRATNS 
VIWRISIFYL CSIFVVVALI PWNMPGLKAV GSYRSVLELL NIPHAKLIMD CVILLSVTSC 
LNSALYTASR MLYSLSRRGD APAVMGKINR SKTPYVAVLL STGAAFLTVV VNYYAPAKVF 
KFLIDSSGAI ALLVYLVIAV SQLRMRKILR AEGSEIRLRM WLYPWLTWLV IGFITFVLVV 
MLFRPAQQLE VISTGLLAIG IICTVPIMAR WKKLVLWQKT PVHNTR