Gene EcDH1_1020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1020
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	1088109
End bp	1089509
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	51%
IMG OID
Product	GABA permease
Protein accession	ACX38701
Protein GI	260448279
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGCAAT CATCGCAACC ACATGAGTTA GGCGGCGGGC TGAAGTCACG CCACGTCACC 
ATGTTGTCTA TTGCCGGTGT TATCGGCGCA AGTCTGTTTG TCGGTTCCAG CGTCGCCATC 
GCCGAAGCGG GCCCGGCGGT ATTACTGGCC TATCTGTTCG CCGGGCTACT GGTGGTTATG 
ATTATGCGGA TGTTGGCGGA AATGGCGGTT GCCACGCCCG ATACCGGTTC GTTTTCCACC 
TATGCCGATA AAGCCATTGG TCGCTGGGCG GGCTATACCA TCGGCTGGTT GTACTGGTGG 
TTTTGGGTAC TGGTTATCCC GCTGGAAGCC AACATCGCCG CCATGATCCT GCACTCATGG 
GTTCCAGGCA TTCCCATCTG GTTATTTTCC CTCGTCATTA CCCTCGCCTT AACTGGCAGT 
AACTTATTAA GCGTTAAAAA CTACGGCGAA TTTGAGTTCT GGCTGGCGCT GTGCAAAGTC 
ATCGCTATCC TGGCCTTTAT TTTCCTTGGT GCAGTCGCAA TTAGCGGTTT TTACCCGTAT 
GCCGAAGTGA GCGGGATCTC AAGATTGTGG GATAGCGGCG GCTTTATGCC CAACGGTTTC 
GGTGCGGTAT TAAGCGCGAT GTTGATCACC ATGTTCTCGT TTATGGGCGC AGAAATTGTC 
ACCATTGCCG CCGCGGAATC CGACACGCCG GAAAAACATA TTGTCCGCGC CACCAACTCG 
GTTATCTGGC GTATTTCTAT CTTCTATTTA TGTTCTATTT TTGTCGTCGT GGCATTAATT 
CCGTGGAATA TGCCCGGACT AAAAGCCGTC GGTTCTTATC GCTCGGTACT GGAATTGCTC 
AATATTCCCC ATGCGAAATT AATCATGGAC TGCGTGATAT TACTTTCCGT AACCAGTTGC 
CTGAACTCGG CGCTGTATAC CGCGTCAAGG ATGCTCTACT CCTTAAGTCG TCGCGGTGAT 
GCTCCCGCGG TAATGGGTAA AATCAACCGC AGTAAAACCC CGTACGTGGC GGTGTTACTC 
TCCACCGGCG CGGCATTCTT AACGGTGGTG GTGAACTATT ACGCGCCTGC GAAGGTATTT 
AAATTTCTGA TCGACAGCTC CGGCGCTATC GCCCTGCTGG TTTATTTAGT CATCGCCGTT 
TCACAGTTGC GGATGCGCAA AATTCTGCGA GCAGAAGGAA GCGAAATTCG CTTGCGAATG 
TGGCTTTATC CGTGGCTCAC CTGGCTAGTC ATCGGCTTTA TTACCTTTGT GTTGGTAGTG 
ATGCTATTCC GTCCGGCGCA ACAGTTAGAA GTGATCTCCA CCGGCTTATT AGCGATAGGG 
ATTATCTGTA CCGTGCCAAT TATGGCTCGC TGGAAAAAGC TGGTATTGTG GCAAAAAACA 
CCCGTTCATA ATACGCGCTG A

Protein sequence

MGQSSQPHEL GGGLKSRHVT MLSIAGVIGA SLFVGSSVAI AEAGPAVLLA YLFAGLLVVM 
IMRMLAEMAV ATPDTGSFST YADKAIGRWA GYTIGWLYWW FWVLVIPLEA NIAAMILHSW 
VPGIPIWLFS LVITLALTGS NLLSVKNYGE FEFWLALCKV IAILAFIFLG AVAISGFYPY 
AEVSGISRLW DSGGFMPNGF GAVLSAMLIT MFSFMGAEIV TIAAAESDTP EKHIVRATNS 
VIWRISIFYL CSIFVVVALI PWNMPGLKAV GSYRSVLELL NIPHAKLIMD CVILLSVTSC 
LNSALYTASR MLYSLSRRGD APAVMGKINR SKTPYVAVLL STGAAFLTVV VNYYAPAKVF 
KFLIDSSGAI ALLVYLVIAV SQLRMRKILR AEGSEIRLRM WLYPWLTWLV IGFITFVLVV 
MLFRPAQQLE VISTGLLAIG IICTVPIMAR WKKLVLWQKT PVHNTR