Gene B21_02402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02402
Symbol	yphD
ID	8115854
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2540842
End bp	2541840
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	56%
IMG OID	644848604
Product	hypothetical protein
Protein accession	YP_003000177
Protein GI	251785873
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGCTT CGTCATTACC ATTGCCGCAG GGCAAGAGCG TCTCGCTCAA ACAATTTGTC 
AGTCGCCATA TTAATGAGAT CGGTTTGCTG GTGGTGATTG CCATTCTTTA TCTGGTCTTC 
TCCCTGAACG CGCCTGGCTT TATCTCATTG AATAACCAGA TGAACGTGCT GCGCGATGCC 
GCCACCATTG GGATTGCCGC CTGGGCGATG ACACTGATTA TTATCTCCGG TGAAATTGAT 
GTCAGCGTTG GGCCGATGGT GGCTTTTGTC TCGGTGTGCC TGGCATTTTT GCTGCAATTT 
GAAGTTCCGC TGGCGGTGGC GTGCCTGCTG GTGTTGCTGT TAGGCGCGCT GATGGGAACG 
CTCGCCGGGG TGCTGCGCGG CGTGTTTAAT GTACCAAGTT TCGTTGCCAC ACTGGGGCTG 
TGGAGCGCCC TGCGCGGAAT GGGGCTGTTT ATGACGAACG CACTGCCAGT GCCGATTGAT 
GAAAACGAGG TGCTGGACTG GCTGGGCGGA CAATTTCTCG GTGTGCCGGT ATCCGCGCTG 
ATCATGATTG TGTTGTTTGC GCTGTTTGTG TTCATCAGCC GCAAAACCGC CTTCGGGCGC 
TCGGTTTTTG CCGTTGGCGG TAATGCTACG GCGGCGCAGT TGTGCGGCAT CAACGTTCGT 
CGGGTGCGCA TTCTTATCTT TACCCTTTCG GGATTATTAG CGGCGGTGAC CGGCATTTTG 
TTGGCGGCGC GCCTCGGTTC TGGTAACGCA GGTGCCGCAA ACGGTCTGGA GTTTGACGTC 
ATCGCCGCGG TCGTGGTCGG CGGTACGGCA CTTTCCGGCG GTCGCGGTTC CCTGTTCGGT 
ACATTGCTTG GTGTGCTGGT GATTACGCTA ATCGGTAACG GTCTGGTGCT GCTCGGTATT 
AACTCCTTTT TCCAGCAGGT GGTACGCGGC GTCATCATCG TGGTGGCGGT GCTGGCGAAT 
ATCTTGCTGA CCCAGCGAAG CAGTAAAGCG AAACGCTAA

Protein sequence

MSASSLPLPQ GKSVSLKQFV SRHINEIGLL VVIAILYLVF SLNAPGFISL NNQMNVLRDA 
ATIGIAAWAM TLIIISGEID VSVGPMVAFV SVCLAFLLQF EVPLAVACLL VLLLGALMGT 
LAGVLRGVFN VPSFVATLGL WSALRGMGLF MTNALPVPID ENEVLDWLGG QFLGVPVSAL 
IMIVLFALFV FISRKTAFGR SVFAVGGNAT AAQLCGINVR RVRILIFTLS GLLAAVTGIL 
LAARLGSGNA GAANGLEFDV IAAVVVGGTA LSGGRGSLFG TLLGVLVITL IGNGLVLLGI 
NSFFQQVVRG VIIVVAVLAN ILLTQRSSKA KR