Gene B21_03711 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03711
Symbol	yihP
ID	8114943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3970582
End bp	3971988
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	53%
IMG OID	644849872
Product	hypothetical protein
Protein accession	YP_003001445
Protein GI	251787141
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID	[TIGR00792] sugar (Glycoside-Pentoside-Hexuronide) transporter

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCAAAG GGAGAACATC GATGAGTCAC ATCACAACGG AAGATCCAGC AACTTTACGC 
CTGCCCTTTA AAGAGAAACT CTCTTACGGT ATTGGCGACC TGGCCTCTAA CATCCTGCTG 
GATATCGGTA CGCTTTATCT TTTGAAGTTT TATACCGACG TTCTGGGGCT GCCAGGCACC 
TATGGCGGCA TTATCTTTTT GATTTCAAAA TTCTTTACTG CGTTTACCGA TATGGGTACC 
GGCATTATGT TGGATTCCCG ACGCAAGATC GGTCCAAAAG GTAAGCTCCG TCCTTTTATT 
CTGTATGCGT CATTCCCGGT CACCTTACTG GCGATCGCCA ACTTTGTCGG CACACCGTTT 
GATGTCACCG GTAAAACGGT GATGGCCACT ATTCTGTTTA TGCTTTACGG ACTGTTTTTC 
AGCATGATGA ACTGCTCCTA CGGCGCAATG GTTCCCGCTA TCACCAAAAA CCCCAACGAA 
CGCGCCTCAC TGGCGGCATG GCGTCAGGGC GGCGCTACGC TGGGCCTGCT GCTGTGCACG 
GTGGGATTCG TGCCAGTTAT GAATCTTATC GAAGGTAATC AGCAACTTGG CTATATCTTC 
GCCGCCACGC TGTTTTCACT GTTTGGCCTG CTGTTTATGT GGATCTGCTA CTCGGGCGTG 
AAAGAGCGTT ATGTCGAAAC CCAGCCTGCT AATCCGGCGC AAAAGCCGGG CCTGCTGCAA 
TCTTTCCGCG CAATTGCGGG TAACCGCCCG CTGTTCATTC TGTGCATTGC CAACCTCTGC 
ACTTTAGGGG CGTTTAACGT CAAGCTCGCC ATCCAGGTCT ATTACACCCA GTACGTGCTT 
AACGATCCCA TCCTGTTGTC GTATATGGGA TTTTTCAGCA TGGGCTGTAT TTTCATCGGC 
GTATTCCTGA TGCCTGCCTC AGTCAGACGT TTTGGCAAGA AGAAAGTTTA TATCGGCGGC 
CTGCTGATTT GGGTGCTGGG CGATCTGCTC AACTATTTCT TCGGCGGCGG TTCGGTCAGC 
TTCGTGGCGT TCTCCTGCCT GGCGTTCTTT GGCTCAGCGT TTGTTAACAG CCTGAACTGG 
GCGCTGGTTT CCGACACCGT CGAGTACGGC GAGTGGCGCA CCGGCGTGCG TTCGGAAGGA 
ACGGTCTACA CCGGCTTCAC CTTCTTTCGC AAAGTTTCTC AGGCGCTGGC AGGTTTCTTC 
CCCGGCTGGA TGCTGACGCA AATTGGCTAT GTGCCGAACG TCGCACAGGC TGACCACACC 
ATTGAAGGGT TGCGCCAGCT GATCTTCATC TACCCAAGCG CACTGGCGGT AGTCACCATT 
GTAGCGATGG GCTGCTTCTA CAGCCTGAAC GAGAAGATGT ATGTCCGCAT TGTTGAAGAA 
ATAGAAGCCC GTAAACGCAC GGCGTAA

Protein sequence

MGKGRTSMSH ITTEDPATLR LPFKEKLSYG IGDLASNILL DIGTLYLLKF YTDVLGLPGT 
YGGIIFLISK FFTAFTDMGT GIMLDSRRKI GPKGKLRPFI LYASFPVTLL AIANFVGTPF 
DVTGKTVMAT ILFMLYGLFF SMMNCSYGAM VPAITKNPNE RASLAAWRQG GATLGLLLCT 
VGFVPVMNLI EGNQQLGYIF AATLFSLFGL LFMWICYSGV KERYVETQPA NPAQKPGLLQ 
SFRAIAGNRP LFILCIANLC TLGAFNVKLA IQVYYTQYVL NDPILLSYMG FFSMGCIFIG 
VFLMPASVRR FGKKKVYIGG LLIWVLGDLL NYFFGGGSVS FVAFSCLAFF GSAFVNSLNW 
ALVSDTVEYG EWRTGVRSEG TVYTGFTFFR KVSQALAGFF PGWMLTQIGY VPNVAQADHT 
IEGLRQLIFI YPSALAVVTI VAMGCFYSLN EKMYVRIVEE IEARKRTA