Gene EcDH1_3532 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3532
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	3796856
End bp	3798466
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	58%
IMG OID
Product	thiamine ABC transporter, inner membrane subunit
Protein accession	ACX41146
Protein GI	260450724
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACGC GCCGTCAGCC GTTAATTCCC GGCTGGTTAA TTCCAGGTGT AAGCGCCACC 
ACGCTGGTGG TAGCGGTTGC GCTGGCGGCG TTTCTCGCCC TGTGGTGGAA CGCGCCGCAG 
GATGACTGGG TGGCAGTCTG GCAGGACAGC TATCTGTGGC ATGTGGTGCG CTTCTCCTTC 
TGGCAGGCGT TTCTCTCGGC ACTGCTCTCT GTCATACCCG CGATATTCCT CGCCCGCGCG 
CTCTATCGCA GGCGCTTTCC GGGTCGGCTG GCGCTGTTGC GTCTGTGTGC AATGACCTTG 
ATCCTCCCGG TGTTGGTCGC TGTTTTCGGC ATTCTTAGCG TCTATGGTCG CCAGGGCTGG 
CTGGCAACAC TCTGCCAATC GCTCGGTCTG GAGTGGACCT TTTCGCCCTA CGGCCTGCAA 
GGTATTTTGC TGGCCCATGT GTTTTTTAAT CTGCCGATGG CGAGCCGCTT ATTACTCCAG 
GCACTGGAAA ACATCCCCGG CGAACAGCGT CAACTTGCCG CCCAGCTTGG GATGCGTAGC 
TGGCATTTTT TCCGCTTCGT CGAATGGCCG TGGTTACGGC GACAAATCCC GCCGGTTGCT 
GCGCTTATCT TTATGCTCTG TTTCGCCAGC TTCGCCACCG TGCTATCGCT GGGGGGCGGT 
CCGCAGGCGA CCACTATCGA GCTGGCAATC TATCAGGCGC TGAGTTACGA CTACGATCCT 
GCCCGCGCGG CAATGCTGGC GCTGCTCCAG ATGGTGTGCT GCCTCGGGCT GGTGCTGTTG 
AGTCAGCGAT TGAGTAAGGC CATTGCGCCC GGCACCACGC TGCTGCAAGG CTGGCGCGAC 
CCGGACGATC GTCTGCATAG CCGCATTTGC GACACGGTGT TAATTGTGCT GGCGCTGCTG 
CTGTTGCTGC CACCGTTACT GGCGGTGATC GTCGATGGGG TAAATCGCCA GTTGCCGGAA 
GTGCTGGCAC AACCGGTGCT GTGGCAGGCG CTGTGGACCT CGTTGCGTAT TGCGCTGGCG 
GCAGGTGTAT TGTGCGTAGT GCTGACCATG ATGCTGCTAT GGAGCAGTCG CGAACTGCGG 
GCGCGGCAGA AAATGCTGGC GGGTCAGGTG CTGGAGATGA GCGGCATGTT GATCCTCGCC 
ATGCCGGGGA TTGTGCTGGC TACCGGCTTC TTTTTACTGC TCAACAACAC TATCGGCCTG 
CCACAATCTG CTGACGGCAT TGTGATTTTC ACCAATGCGT TAATGGCGAT CCCTTATGCG 
CTGAAAGTGC TGGAAAACCC GATGCGCGAT ATCACCGCCC GCTACAGCAT GTTATGTCAG 
TCGCTGGGGA TTGAAGGCTG GTCACGCTTA AAAGTGGTGG AGCTGCGCGC CCTGAAACGT 
CCACTGGCGC AGGCGCTGGC CTTTGCATGC GTGCTGTCGA TTGGTGATTT TGGCGTGGTG 
GCGTTGTTCG GTAACGATGA TTTCCGCACC CTGCCGTTTT ATCTCTACCA GCAAATTGGC 
TCCTATCGCA GCCAGGACGG TGCGGTCACC GCGTTAATTC TGCTGCTGCT CTGTTTTCTG 
CTGTTTACCG TGATTGAAAA ACTACCGGGG CGAAATGTTA AAACTGACTG A

Protein sequence

MATRRQPLIP GWLIPGVSAT TLVVAVALAA FLALWWNAPQ DDWVAVWQDS YLWHVVRFSF 
WQAFLSALLS VIPAIFLARA LYRRRFPGRL ALLRLCAMTL ILPVLVAVFG ILSVYGRQGW 
LATLCQSLGL EWTFSPYGLQ GILLAHVFFN LPMASRLLLQ ALENIPGEQR QLAAQLGMRS 
WHFFRFVEWP WLRRQIPPVA ALIFMLCFAS FATVLSLGGG PQATTIELAI YQALSYDYDP 
ARAAMLALLQ MVCCLGLVLL SQRLSKAIAP GTTLLQGWRD PDDRLHSRIC DTVLIVLALL 
LLLPPLLAVI VDGVNRQLPE VLAQPVLWQA LWTSLRIALA AGVLCVVLTM MLLWSSRELR 
ARQKMLAGQV LEMSGMLILA MPGIVLATGF FLLLNNTIGL PQSADGIVIF TNALMAIPYA 
LKVLENPMRD ITARYSMLCQ SLGIEGWSRL KVVELRALKR PLAQALAFAC VLSIGDFGVV 
ALFGNDDFRT LPFYLYQQIG SYRSQDGAVT ALILLLLCFL LFTVIEKLPG RNVKTD