Gene EcE24377A_0069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0069
Symbol	thiP
ID	5590217
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	74601
End bp	76211
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	58%
IMG OID	640923800
Product	thiamine transporter membrane protein
Protein accession	YP_001461237
Protein GI	157157490
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1178] ABC-type Fe3+ transport system, permease component
TIGRFAM ID	[TIGR01253] thiamine ABC transporter, permease protein

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACGC GCCGTCAGCC GTTAATTCCC GGCTGGTTAA TTCCAGGTGT AAGCGCCGCC 
ACGCTGGTGG TAGCGGTTGC GCTCGCGGCG TTTCTCGCCC TGTGGTGGAA CGCGCCGCAG 
GGTAACTGGG TGGCAGTCTG GCAGGACAGC TACCTGTGGC ATGTGGTGCG CTTCTCCTTC 
TGGCAGGCGT TTCTCTCGGC GCTACTCTCT GTCGTACCCG CGATATTCCT CGCCCGCGCC 
CTCTATCGCA GGCGCTTTCC GGGTCGGCTG GCGCTGTTGC GTCTGTGCGC AATGACCTTG 
ATCCTCCCGG TGCTGGTTGC TGTTTTCGGC ATTCTTAGCG TCTATGGTCA TCAGGGCTGG 
CTGGCATCGC TCTGCCAATC GCTCGGTCTG GAGTGGACCT TTTCGCCCTA CGGCCTGCAA 
GGCATTTTGC TGGCGCACGT ATTTTTTAAT CTGCCGATGG CGAGCCGCTT ATTACTCCAG 
GCACTGGAAA ACATTCCCGG CGAACAACGT CAGCTTGCCG CCCAGCTTGG GATGCGCGGC 
TGGCATTTTT TCCGCTTCGT CGAATGGCCG TGGCTACGGC GACAAATCCC GCCGGTTGCC 
GCGCTTATCT TTATGCTCTG TTTCGCCAGC TTCGCCACCG TGCTATCGCT GGGCGGCGGT 
CCGCAGGCAA CTACTATCGA GCTGGCTATT TATCAGGCGC TGAGTTACGA CTACGATCCT 
GCCCGCGCGG CGATGCTGGC GCTGCTCCAG ATGGTGTGTT GCCTTGGGCT GGTGCTGTTG 
AGTCAGCGAC TAAGTAAGGC CATTGCGCCC GGTACCACGC TGCTGCAAGG CTGGCGCGAT 
CCGGACGATC GTCTGCATAG CCGCATTTGC GACACGGTGT TAATAGTGCT GGCGCTGCTG 
CTGTTGCTGC CACCGTTGCT GGCGGTGATC GTCGATGGGG TAAATCGCCA GTTGCCGGAA 
GTGCTGGCAC AACCGGTGCT GTGGCAGGCG CTGTGGACCT CGTTGCGTAT TGCGCTGGCG 
GCAGGTGTAT TGTGCGTAGT GCTGACCATG ATGCTGCTAT GGAGCAGTCG CGAACTGCGG 
GCGCGGCAGA AAATGCTGGC GGGTCAGGCG CTGGAGATGA GCGGCATGTT GATCCTCGCC 
ATGCCGGGGA TTGTGCTGGC TACCGGCTTC TTTTTACTGC TCAACAACAC CATTGGCCTG 
CCGCAATCTG CTGACGGCAT TGTGATTTTC ACCAATGCGT TAATGGCGAT CCCTTATGCG 
CTGAAAGTAC TGGAAAACCC GATGCGCGAT ATCACCGCCC GCTACAGTAT GTTGTGTCAG 
TCGCTGGGCA TTGAAGGCTG GTCGCGCTTA AAAGTGGTCG AGCTGCGCGC CCTGAAACGT 
CCACTGGCGC AGGCGCTGGC TTTTGCCTGC GTGCTGTCGA TTGGTGATTT TGGCGTAGTG 
GCGTTGTTCG GTAACGATGA TTTCCGTACC CTGCCGTTTT ATCTCTACCA GCAAATTGGC 
TCCTATCGCA GCCAGGACGG CGCGGTCACC GCGTTAATTC TGCTACTACT CTGTTTTCTG 
CTGTTTACCG TGATTGAAAA ACTACCGGGG CGAAATGTTA AAACTGACTG A

Protein sequence

MATRRQPLIP GWLIPGVSAA TLVVAVALAA FLALWWNAPQ GNWVAVWQDS YLWHVVRFSF 
WQAFLSALLS VVPAIFLARA LYRRRFPGRL ALLRLCAMTL ILPVLVAVFG ILSVYGHQGW 
LASLCQSLGL EWTFSPYGLQ GILLAHVFFN LPMASRLLLQ ALENIPGEQR QLAAQLGMRG 
WHFFRFVEWP WLRRQIPPVA ALIFMLCFAS FATVLSLGGG PQATTIELAI YQALSYDYDP 
ARAAMLALLQ MVCCLGLVLL SQRLSKAIAP GTTLLQGWRD PDDRLHSRIC DTVLIVLALL 
LLLPPLLAVI VDGVNRQLPE VLAQPVLWQA LWTSLRIALA AGVLCVVLTM MLLWSSRELR 
ARQKMLAGQA LEMSGMLILA MPGIVLATGF FLLLNNTIGL PQSADGIVIF TNALMAIPYA 
LKVLENPMRD ITARYSMLCQ SLGIEGWSRL KVVELRALKR PLAQALAFAC VLSIGDFGVV 
ALFGNDDFRT LPFYLYQQIG SYRSQDGAVT ALILLLLCFL LFTVIEKLPG RNVKTD