Gene ECD_03762 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03762
Symbol	yihP
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	3972503
End bp	3973909
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	53%
IMG OID
Product	predicted transporter
Protein accession	ACT45555
Protein GI	253979885
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCAAAG GGAGAACATC GATGAGTCAC ATCACAACGG AAGATCCAGC AACTTTACGC 
CTGCCCTTTA AAGAGAAACT CTCTTACGGT ATTGGCGACC TGGCCTCTAA CATCCTGCTG 
GATATCGGTA CGCTTTATCT TTTGAAGTTT TATACCGACG TTCTGGGGCT GCCAGGCACC 
TATGGCGGCA TTATCTTTTT GATTTCAAAA TTCTTTACTG CGTTTACCGA TATGGGTACC 
GGCATTATGT TGGATTCCCG ACGCAAGATC GGTCCAAAAG GTAAGCTCCG TCCTTTTATT 
CTGTATGCGT CATTCCCGGT CACCTTACTG GCGATCGCCA ACTTTGTCGG CACACCGTTT 
GATGTCACCG GTAAAACGGT GATGGCCACT ATTCTGTTTA TGCTTTACGG ACTGTTTTTC 
AGCATGATGA ACTGCTCCTA CGGCGCAATG GTTCCCGCTA TCACCAAAAA CCCCAACGAA 
CGCGCCTCAC TGGCGGCATG GCGTCAGGGC GGCGCTACGC TGGGCCTGCT GCTGTGCACG 
GTGGGATTCG TGCCAGTTAT GAATCTTATC GAAGGTAATC AGCAACTTGG CTATATCTTC 
GCCGCCACGC TGTTTTCACT GTTTGGCCTG CTGTTTATGT GGATCTGCTA CTCGGGCGTG 
AAAGAGCGTT ATGTCGAAAC CCAGCCTGCT AATCCGGCGC AAAAGCCGGG CCTGCTGCAA 
TCTTTCCGCG CAATTGCGGG TAACCGCCCG CTGTTCATTC TGTGCATTGC CAACCTCTGC 
ACTTTAGGGG CGTTTAACGT CAAGCTCGCC ATCCAGGTCT ATTACACCCA GTACGTGCTT 
AACGATCCCA TCCTGTTGTC GTATATGGGA TTTTTCAGCA TGGGCTGTAT TTTCATCGGC 
GTATTCCTGA TGCCTGCCTC AGTCAGACGT TTTGGCAAGA AGAAAGTTTA TATCGGCGGC 
CTGCTGATTT GGGTGCTGGG CGATCTGCTC AACTATTTCT TCGGCGGCGG TTCGGTCAGC 
TTCGTGGCGT TCTCCTGCCT GGCGTTCTTT GGCTCAGCGT TTGTTAACAG CCTGAACTGG 
GCGCTGGTTT CCGACACCGT CGAGTACGGC GAGTGGCGCA CCGGCGTGCG TTCGGAAGGA 
ACGGTCTACA CCGGCTTCAC CTTCTTTCGC AAAGTTTCTC AGGCGCTGGC AGGTTTCTTC 
CCCGGCTGGA TGCTGACGCA AATTGGCTAT GTGCCGAACG TCGCACAGGC TGACCACACC 
ATTGAAGGGT TGCGCCAGCT GATCTTCATC TACCCAAGCG CACTGGCGGT AGTCACCATT 
GTAGCGATGG GCTGCTTCTA CAGCCTGAAC GAGAAGATGT ATGTCCGCAT TGTTGAAGAA 
ATAGAAGCCC GTAAACGCAC GGCGTAA

Protein sequence

MGKGRTSMSH ITTEDPATLR LPFKEKLSYG IGDLASNILL DIGTLYLLKF YTDVLGLPGT 
YGGIIFLISK FFTAFTDMGT GIMLDSRRKI GPKGKLRPFI LYASFPVTLL AIANFVGTPF 
DVTGKTVMAT ILFMLYGLFF SMMNCSYGAM VPAITKNPNE RASLAAWRQG GATLGLLLCT 
VGFVPVMNLI EGNQQLGYIF AATLFSLFGL LFMWICYSGV KERYVETQPA NPAQKPGLLQ 
SFRAIAGNRP LFILCIANLC TLGAFNVKLA IQVYYTQYVL NDPILLSYMG FFSMGCIFIG 
VFLMPASVRR FGKKKVYIGG LLIWVLGDLL NYFFGGGSVS FVAFSCLAFF GSAFVNSLNW 
ALVSDTVEYG EWRTGVRSEG TVYTGFTFFR KVSQALAGFF PGWMLTQIGY VPNVAQADHT 
IEGLRQLIFI YPSALAVVTI VAMGCFYSLN EKMYVRIVEE IEARKRTA