Gene B21_00559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_00559
Symbol	ybdN
ID	8114610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	595626
End bp	596696
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	48%
IMG OID	644846836
Product	hypothetical protein
Protein accession	YP_002998409
Protein GI	251784105
COG category	[R] General function prediction only
COG ID	[COG3969] Predicted phosphoadenosine phosphosulfate sulfotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0408138
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GCCCGACAAA TGGGCAAAAA AATCTGCGTT TTGTTTATCG ACTGGGAGGC GCAATTCTCT 
TGCACCATTA ACTATGTTCA GTCCCTGCGC GAGTTGTACA CCGATGTCAT CGAAGAGTTT 
TACTGGGTTG CGCTCCCGCT TACGACGCAA AATTCCCTTT CACAATACCA ACCCGAATGG 
CAGTGCTGGG AACCTGATGT CGAATGGGTA CGTCAACCTC CCCAAGATGC GATAACCGAC 
CCTGACTTTT TCTCCTTTTA CCAGCCAGGC ATGACCTTCG AACAATTTGT ACGTGAGTTT 
GCCGAATGGT TTTCACAAAA ACGTCCGGCG GCGATGATGA TCGGCATCCG TGCGGATGAG 
TCCTACAACC GTTTTGTCGC CATCGCCAGT TTAAATAAAC AACGTTTTGC CGACGATAAA 
CCCTGGACTA CGGCCGCACC AGGCGGTCAT AGCTGGTACA TTTACCCCAT TTACGACTGG 
AAAGTGGCTG ATATCTGGAC CTGGTATGCA AATCATCAAA GTCTCTGCAA CCCACTGTAT 
AACCTAATGT ATCAGGCAGG CGTTCCTCTG CGTCATATGC GAATTTGCGA ACCTTTTGGC 
CCGGAGCAAC GACAAGGATT ATGGCTCTAT CACGTTATCG AACCGGATCG CTGGGCTGCT 
ATGTGCGCAC GAGTCAGCGG GGTAAAAAGT GGCGGCATTT ACGCCGGACA TGACAATCAT 
TTCTATGGGC ATCGGAAAAT CCTCAAGCCA GAACATTTAG ACTGGCAAGA ATATGCATTA 
TTGCTGCTCA ATAGCATGCC GGAAAAAACA GCTGAGCATT ACCGCAATAA AATCGCCATT 
TATTTGCACT GGTATCAGAA AAAAGGCATC GAGGTTCCAC AAACCCAGCA AGGGGACATT 
GGCGCGAAAG ATATCCCCTC CTGGCGGCGG ATATGCAAAG TTTTACTCAA TAACGATTAC 
TGGTGTCGGG CATTATCATT TAGCCCCACA AAATCGAAGA ACTATCAGCG TTATAACGAA 
CGGATAAAAG GAAAACGTCA GGAATGGGGG ATACTATGCA ACAACGATTA A

Protein sequence

ARQMGKKICV LFIDWEAQFS CTINYVQSLR ELYTDVIEEF YWVALPLTTQ NSLSQYQPEW 
QCWEPDVEWV RQPPQDAITD PDFFSFYQPG MTFEQFVREF AEWFSQKRPA AMMIGIRADE 
SYNRFVAIAS LNKQRFADDK PWTTAAPGGH SWYIYPIYDW KVADIWTWYA NHQSLCNPLY 
NLMYQAGVPL RHMRICEPFG PEQRQGLWLY HVIEPDRWAA MCARVSGVKS GGIYAGHDNH 
FYGHRKILKP EHLDWQEYAL LLLNSMPEKT AEHYRNKIAI YLHWYQKKGI EVPQTQQGDI 
GAKDIPSWRR ICKVLLNNDY WCRALSFSPT KSKNYQRYNE RIKGKRQEWG ILCNND