Gene EcDH1_3559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3559
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	3829446
End bp	3830960
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	52%
IMG OID
Product	choline/carnitine/betaine transporter
Protein accession	ACX41173
Protein GI	260450751
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAATG AAAAGAGAAA AACGGGAATA GAACCGAAGG TTTTCTTTCC GCCGTTAATA 
ATCGTCGGCA TACTTTGTTG GCTTACAGTC AGAGATCTGG ATGCAGCGAA TGTCGTTATT 
AATGCTGTAT TCAGTTACGT CACCAATGTA TGGGGATGGG CATTTGAATG GTATATGGTG 
GTGATGCTTT TCGGTTGGTT CTGGCTGGTG TTTGGCCCGT ATGCCAAAAA GCGTTTAGGT 
AACGAACCGC CAGAATTTAG CACCGCCAGT TGGATCTTTA TGATGTTCGC CTCCTGTACG 
TCTGCTGCCG TACTGTTCTG GGGATCGATT GAGATCTACT ACTACATCTC CACCCCGCCG 
TTTGGCTTAG AACCGAACTC GACAGGGGCG AAAGAGTTGG GGCTGGCTTA CAGCTTGTTC 
CACTGGGGAC CTCTGCCGTG GGCCACTTAC AGCTTCCTTT CAGTCGCCTT CGCTTACTTC 
TTCTTTGTCC GCAAAATGGA AGTGATTCGC CCCAGCTCGA CACTGGTGCC GCTGGTAGGT 
GAAAAACACG CCAAAGGGTT GTTCGGCACT ATCGTCGACA ACTTCTATCT CGTCGCCTTG 
ATCTTCGCGA TGGGTACCAG TCTGGGCCTT GCCACGCCGC TGGTGACCGA GTGTATGCAA 
TGGTTGTTTG GCATTCCGCA TACCCTGCAA CTGGACGCTA TCATCATTAC CTGCTGGATT 
ATCCTCAACG CCATTTGCGT CGCTTGCGGT CTGCAAAAAG GGGTACGTAT CGCCAGTGAC 
GTGCGTAGTT ACCTGAGCTT CCTGATGCTG GGTTGGGTGT TCATTGTCAG CGGTGCCAGC 
TTCATCATGA ACTACTTCAC CGATTCGGTG GGGATGTTGC TGATGTATCT GCCGCGCATG 
TTGTTCTATA CCGATCCCAT CGCTAAAGGC GGCTTCCCGC AGGGCTGGAC CGTGTTCTAC 
TGGGCATGGT GGGTGATTTA TGCTATCCAG ATGAGTATCT TCCTCGCCCG CATCTCCCGT 
GGTCGTACTG TGCGTGAACT GTGCTTCGGC ATGGTGCTGG GGCTGACAGC GTCAACCTGG 
ATCCTGTGGA CTGTACTCGG TAGTAACACT CTGCTGTTGA TAGATAAAAA CATCATCAAC 
ATTCCAAATC TGATCGAACA GTACGGTGTG GCGCGCGCCA TCATTGAAAC CTGGGCCGCT 
CTGCCACTCA GCACCGCCAC CATGTGGGGC TTCTTCATCC TCTGCTTTAT TGCCACCGTT 
ACGCTGGTTA ACGCCTGCTC TTATACCCTG GCGATGTCCA CTTGCCGCGA AGTACGCGAT 
GGTGAAGAAC CACCTCTGCT GGTGCGTATC GGTTGGTCAA TTCTGGTTGG CATTATCGGT 
ATTGTTCTGC TGGCGCTCGG CGGCCTGAAA CCGATTCAAA CCGCCATTAT CGCCGGAGGA 
TGCCCGCTGT TCTTCGTCAA CATTATGGTG ACGCTCTCCT TTATTAAAGA CGCGAAACAG 
AACTGGAAAG ATTAA

Protein sequence

MKNEKRKTGI EPKVFFPPLI IVGILCWLTV RDLDAANVVI NAVFSYVTNV WGWAFEWYMV 
VMLFGWFWLV FGPYAKKRLG NEPPEFSTAS WIFMMFASCT SAAVLFWGSI EIYYYISTPP 
FGLEPNSTGA KELGLAYSLF HWGPLPWATY SFLSVAFAYF FFVRKMEVIR PSSTLVPLVG 
EKHAKGLFGT IVDNFYLVAL IFAMGTSLGL ATPLVTECMQ WLFGIPHTLQ LDAIIITCWI 
ILNAICVACG LQKGVRIASD VRSYLSFLML GWVFIVSGAS FIMNYFTDSV GMLLMYLPRM 
LFYTDPIAKG GFPQGWTVFY WAWWVIYAIQ MSIFLARISR GRTVRELCFG MVLGLTASTW 
ILWTVLGSNT LLLIDKNIIN IPNLIEQYGV ARAIIETWAA LPLSTATMWG FFILCFIATV 
TLVNACSYTL AMSTCREVRD GEEPPLLVRI GWSILVGIIG IVLLALGGLK PIQTAIIAGG 
CPLFFVNIMV TLSFIKDAKQ NWKD