Gene EcDH1_2150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2150
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2299136
End bp	2300821
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	44%
IMG OID
Product	ABC transporter related protein
Protein accession	ACX39803
Protein GI	260449381
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.675746
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAACCA TTCCCATTAC GCTTCGTATG TTGATAGCAA AGTATCTCTG TCTGTTGAAG 
CCCTTTTGGC TGCGTAAGAA TAATAAAACT TCAGTGTTGT TAATCATTAT TATCCTCGCC 
ATGATCCTTG GCGTGGTTAA AATTCAGGTC TGGTTAAACG ACTGGAATAA TGATTTTTTC 
AATGCGCTAA GCCAGAAAGA AACCGATAAG CTTTGGCAGC TTGTCCTTTG GTTCCCTGCC 
CTGCTGGGGA TCTTTGTATT AATATCCGTA AACAAAACAT GGTTAATTAA ACTACTGACT 
ATTCGCTGGC GCGAATGGTT AACAGATTAC TACCTTAATC GGTGGTTTGC AGATAAAAAC 
TACTACTTCA CGCAGATCTA CGGCGAGCAT AAAAATACAG ATAACCCTGA CCAACGTATC 
GCTGAAGACA TTCTCTTACT GATCAGCAAA ACGCTCAGTC TTTCATTTGG CTTCATCCAG 
TCACTTAGCA TGCTGATCAC CTTTACCGTT ATTCTTTGGG AAAGCGCGGG TACGCTCTCA 
TTCACTGTTG GTGGAACAGA ATGGAATATC CAGGGGTATA TGGTCTATAC CGTCGTGCTC 
ATTGTGATCG GTGGAACTTT ATTTACCCAT AAGGTGGGTA AACGTATTCG TCCGCTTAAT 
GTGGAAAAAC AACGTAGCGA AGCGACATTT CGAACAAATC TTGTGCAGCA TAATAAGCAG 
GCAGAACTGA TTGCGCTAAG CAATGCTGAG TCTCTACAAC GCCAGGAGTT GAGCGACAAT 
TTTCATACCA TTAAAGAGAA CTGGCATCGT TTAATGAATC GTCAGCGGTG GCTTGATTAC 
TGGCAGAATA TTTATTCGCG CTCGCTTAGC GTTCTTCCCT ACTTTCTGTT ATTGCCGCAG 
TTTATTAGCG GGCAGATCAA TCTGGGCGGA CTGATGAAAT CGCGCCAGGC ATTTATGCTG 
GTATCGAACA ATTTAAGCTG GTTTATTTAT AAATATGACG AACTTGCTGA ACTGGCTGCG 
GTTATCGATC GCTTGTATGA GTTCCATCAA CTCACTGAAC AGCGCCCTAC GAATAAGCCT 
AAAAATTGCC AACATGCGGT ACAAGTGGCT GATGCGAGTA TTCGTACGCC TGATAATAAG 
ATCATATTAG AGAACCTGAA CTTTCATGTT TCGCCAGGCA AATGGCTATT ACTGAAAGGC 
TACTCTGGCG CGGGAAAAAC CACACTGCTT AAAACATTAT CCCACTGCTG GCCGTGGTTT 
AAAGGTGATA TTTCTTCTCC TGCTGACAGT TGGTATGTGT CACAAACACC GTTAATCAAA 
ACCGGCTTAC TGAAAGAGAT TATTTGTAAA GCACTTCCCC TGCCCGTAGA CGATAAATCG 
TTGAGCGAAG TACTGCATCA GGTTGGTCTT GGGAAATTGG CTGCGCGTAT TCATGACCAC 
GATCGCTGGG GAGATATTCT TTCCAGCGGC GAAAAACAAC GTATCGCCCT GGCACGATTA 
ATTTTACGAC GTCCGAAATG GATATTTCTT GACGAAACTA CCTCTCATCT TGAGGAACAA 
GAGGCTATCC GCTTACTGCG TTTAGTGCGT GAAAAACTAC CCACAAGCGG CGTCATTATG 
GTTACACATC AACCCGGTGT CTGGAACCTG GCCGATGATA TTTGTGACAT TAGCGCGGTT 
TTATAA

Protein sequence

MITIPITLRM LIAKYLCLLK PFWLRKNNKT SVLLIIIILA MILGVVKIQV WLNDWNNDFF 
NALSQKETDK LWQLVLWFPA LLGIFVLISV NKTWLIKLLT IRWREWLTDY YLNRWFADKN 
YYFTQIYGEH KNTDNPDQRI AEDILLLISK TLSLSFGFIQ SLSMLITFTV ILWESAGTLS 
FTVGGTEWNI QGYMVYTVVL IVIGGTLFTH KVGKRIRPLN VEKQRSEATF RTNLVQHNKQ 
AELIALSNAE SLQRQELSDN FHTIKENWHR LMNRQRWLDY WQNIYSRSLS VLPYFLLLPQ 
FISGQINLGG LMKSRQAFML VSNNLSWFIY KYDELAELAA VIDRLYEFHQ LTEQRPTNKP 
KNCQHAVQVA DASIRTPDNK IILENLNFHV SPGKWLLLKG YSGAGKTTLL KTLSHCWPWF 
KGDISSPADS WYVSQTPLIK TGLLKEIICK ALPLPVDDKS LSEVLHQVGL GKLAARIHDH 
DRWGDILSSG EKQRIALARL ILRRPKWIFL DETTSHLEEQ EAIRLLRLVR EKLPTSGVIM 
VTHQPGVWNL ADDICDISAV L