Gene ECD_03371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03371
Symbol	yhjE
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	3535974
End bp	3537296
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	56%
IMG OID
Product	predicted transporter
Protein accession	ACT45172
Protein GI	253979502
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGCAA CAGCCACAAC ACTCGACCAC GAGCAAGAAT ACACGCCGAT CAACTCGCGT 
AATAAAGTCC TTGTCGCCTC TCTCATTGGC ACAGCCATTG AGTTCTTCGA CTTTTACATT 
TACGCCACTG CGGCCGTTAT TGTGTTTCCG CATATCTTCT TCCCGCAGGG CGATCCTACG 
GCAGCAACGC TACAGTCGCT CGCCACCTTC GCCATCGCCT TCGTCGCGCG CCCCATTGGC 
TCTGCCGTTT TTGGTCATTT TGGCGATCGC GTTGGGCGTA AAGCGACGCT GGTCGCCTCG 
TTGCTAACGA TGGGGATTTC GACCGTGGTG ATTGGTCTGC TGCCGGGCTA TGCCACGATT 
GGTATTTTCG CCCCGCTGCT GCTGGCGCTG GCTCGATTTG GTCAGGGTCT GGGCTTAGGC 
GGTGAATGGG GCGGCGCGGC GCTGCTGGCG ACTGAAAACG CCCCACCGCG CAAACGTGCA 
CTGTATGGCT CCTTTCCGCA GCTGGGCGCA CCGATTGGCT TCTTCTTTGC CAATGGCACT 
TTCTTGCTGC TTTCCTGGCT ACTGACCGAC GAGCAGTTTA TGAGCTGGGG CTGGCGTGTG 
CCATTTATCT TCTCGGCGGT GCTGGTCATT ATCGGCCTGT ATGTTCGCGT GTCGCTGCAT 
GAGTCGCCGG TGTTTGAGAA AGTCGCTAAA GCGAAAAAAC AGGTGAAGAT CCCGCTGGGT 
ACGCTGCTGA CCAAACATGT TCGCGTAACC GTACTGGGTA CGTTCATTAT GCTGGCAACC 
TATACGCTGT TTTACATCAT GACGGTCTAC TCTATGACCT TTAGTACCGC CACCGCGCCA 
GTTGGGCTTG GCCTGCCGCG TAACGAAGTG TTGTGGATGT TGATGATGGC AGTTATTGGT 
TTTGGCGTGA TGGTGCCAGT CGCTGGATTA CTGGCTGATG CCTTTGGTCG CCGTAAAAGC 
ATGGTAATCA TCACCACGCT GATCATCCTG TTCGCGCTGT TCGCCTTTAA CCCACTGCTC 
GGTTCTGGCA ACCCGATTCT GGTTTTTGCC TTCCTGCTGC TGGGGTTAAG TCTGATGGGT 
CTGACCTTCG GGCCAATGGG TGCGCTGTTA CCAGAGCTGT TTCCGACAGA AGTGCGTTAC 
ACCGGAGCAT CGTTCTCTTA CAACGTAGCG TCGATTCTCG GGGCTTCCGT TGCGCCATAT 
ATCGCAGCCT GGTTGCAGAC TAACTACGGG CTAGGTGCGG TGGGGTTATA TCTGGCGGCG 
ATGGCTGGCT TGACGTTAAT CGCCCTGCTG CTGACCCATG AGACGCGACA TCAGTCGTTG 
TAA

Protein sequence

MQATATTLDH EQEYTPINSR NKVLVASLIG TAIEFFDFYI YATAAVIVFP HIFFPQGDPT 
AATLQSLATF AIAFVARPIG SAVFGHFGDR VGRKATLVAS LLTMGISTVV IGLLPGYATI 
GIFAPLLLAL ARFGQGLGLG GEWGGAALLA TENAPPRKRA LYGSFPQLGA PIGFFFANGT 
FLLLSWLLTD EQFMSWGWRV PFIFSAVLVI IGLYVRVSLH ESPVFEKVAK AKKQVKIPLG 
TLLTKHVRVT VLGTFIMLAT YTLFYIMTVY SMTFSTATAP VGLGLPRNEV LWMLMMAVIG 
FGVMVPVAGL LADAFGRRKS MVIITTLIIL FALFAFNPLL GSGNPILVFA FLLLGLSLMG 
LTFGPMGALL PELFPTEVRY TGASFSYNVA SILGASVAPY IAAWLQTNYG LGAVGLYLAA 
MAGLTLIALL LTHETRHQSL