Gene EcDH1_0914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0914
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	981894
End bp	983171
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	50%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	ACX38597
Protein GI	260448175
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.385609
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACACA ACTCATATCG CCGTTGGATA ACCCTCGCGA TAATTAGTTT TAGCGGCGGC 
GTTAGTTTCG ACCTGGCTTA TTTACGTTAT ATTTATCAAA TTCCCATGGC GAAATTTATG 
GGATTCAGCA ATACCGAGAT AGGTTTAATA ATGAGTACCT TTGGTATTGC GGCCATTATT 
CTTTATGCCC CCAGCGGCGT TATTGCCGAT AAATTTTCAC ACCGCAAAAT GATTACTTCC 
GCGATGATCA TTACCGGATT ACTGGGTCTG TTAATGGCAA CGTATCCACC GCTGTGGGTA 
ATGCTCTGTA TTCAGATCGC CTTTGCGATA ACGACGATTT TAATGCTGTG GTCGGTGTCG 
ATTAAAGCTG CATCGTTGCT TGGCGATCAT AGCGAGCAAG GGAAAATTAT GGGCTGGATG 
GAAGGGCTGC GCGGCGTCGG TGTAATGTCG CTGGCGGTGT TTACCATGTG GGTCTTTTCT 
CGCTTTGCAC CGGATGACAG CACCAGCCTG AAAACGGTCA TTATCATCTA TAGTGTGGTT 
TACATCTTGT TGGGGATTCT GTGCTGGTTT TTTGTTAGCG ATAACAACAA CCTGCGCAGT 
GCCAATAACG AAGAAAAACA GTCATTCCAG CTTAGCGACA TCCTGGCCGT TTTGCGTATC 
AGCACCACCT GGTATTGCAG CATGGTGATT TTTGGCGTCT TCACCATCTA CGCCATTCTG 
AGTTACTCCA CCAACTATCT GACCGAAATG TATGGCATGT CGCTGGTGGC GGCGAGCTAC 
ATGGGGATTG TGATCAACAA AATATTCCGC GCGCTGTGCG GCCCACTTGG CGGCATAATC 
ACCACCTACA GCAAAGTGAA ATCCCCTACC CGCGTGATCC AAATCCTTTC CGTACTCGGC 
CTGCTGACGT TAACTGCCCT GCTCGTCACG AACTCTAACC CGCAATCGGT CGCGATGGGG 
ATTGGCCTGA TTTTACTGCT GGGATTCACC TGTTACGCCT CACGCGGGCT GTACTGGGCC 
TGCCCTGGCG AAGCGAGAAC ACCGTCTTAC ATTATGGGCA CCACGGTAGG TATTTGTTCG 
GTGATTGGAT TCCTGCCGGA TGTCTTCGTT TACCCAATTA TCGGCCACTG GCAAGACACC 
CTGCCCGCTG CAGAAGCCTA CCGCAATATG TGGCTGATGG GCATGGCGGC GCTTGGCATG 
GTGATTGTCT TTACCTTTTT GCTGTTCCAA AAAATTCGTA CTGCTGATAG CGCCCCCGCA 
ATGGCTAGCA GCAAGTAA

Protein sequence

MQHNSYRRWI TLAIISFSGG VSFDLAYLRY IYQIPMAKFM GFSNTEIGLI MSTFGIAAII 
LYAPSGVIAD KFSHRKMITS AMIITGLLGL LMATYPPLWV MLCIQIAFAI TTILMLWSVS 
IKAASLLGDH SEQGKIMGWM EGLRGVGVMS LAVFTMWVFS RFAPDDSTSL KTVIIIYSVV 
YILLGILCWF FVSDNNNLRS ANNEEKQSFQ LSDILAVLRI STTWYCSMVI FGVFTIYAIL 
SYSTNYLTEM YGMSLVAASY MGIVINKIFR ALCGPLGGII TTYSKVKSPT RVIQILSVLG 
LLTLTALLVT NSNPQSVAMG IGLILLLGFT CYASRGLYWA CPGEARTPSY IMGTTVGICS 
VIGFLPDVFV YPIIGHWQDT LPAAEAYRNM WLMGMAALGM VIVFTFLLFQ KIRTADSAPA 
MASSK