Gene B21_01760 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01760
Symbol	yeaW
ID	8113710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	1829707
End bp	1830831
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	52%
IMG OID	644847981
Product	hypothetical protein
Protein accession	YP_002999554
Protein GI	251785250
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAATC TGAGCCCTGA CTTTGTACTA CCCGAAAATT TTTGCGCTAA CCCGCAAGAG 
GCGTGGACCA TTCCTGCCCG TTTTTATACC GATCAGAACG CGTTTGAACA CGAAAAAGAG 
AACGTCTTCG CCAAAAGCTG GATTTGCGTC GCTCACAGCA GCGAACTGGC GAATGCCAAT 
GATTATGTGA CGCGTGAGAT CATTGGCGAA AGCATCGTGC TGGTACGCGG TCGTGATAAG 
GTTTTGCGCG CGTTCTATAA CGTGTGTCCG CACCGTGGTC ATCAGTTGTT GAGCGGTGAA 
GGAAAAGCAA AAAATGTGAT TACCTGCCCG TATCACGCAT GGGCATTCAA ACTCGATGGC 
AACCTGGCCC ATGCACGTAA CTGCGAAAAC GTCGCCAATT TCGATAGCGA CAAAGCGCAA 
CTGGTTCCGG TGCGTCTGGA AGAATATGCC GGATTCGTCT TCATCAACAT GGACCCCAAC 
GCCACCAGCG TAGAAGATCA ATTACCCGGC CTGGGCGCGA AAGTGCTGGA AGCCTGCCCG 
GAAGTCCACG ATCTGAAACT GGCGGCCCGC TTTACCACCC GCACGCCTGC CAACTGGAAG 
AACATTGTCG ATAACTATCT CGAGTGCTAT CACTGTGGTC CGGCGCATCC AGGTTTCTCC 
GACTCCGTAC AGGTTGATCG TTACTGGCAC ACCATGCACG GTAACTGGAC GCTGCAATAC 
GGTTTCGCCA AACCGTCCGA ACAGTCGTTT AAATTTGAAG AGGGTACGGA TGCGGCATTC 
CACGGTTTCT GGCTGTGGCC GTGCACGATG CTGAACGTCA CCCCGATCAA AGGGATGATG 
ACGGTCATTT ATGAATTCCC GGTGGATTCT GAAACTACCC TGCAAAACTA CGATATTTAC 
TTCACCAATG AAGAGTTAAC CGACGAGCAA AAATCGCTGA TTGAGTGGTA TCGCGATGTG 
TTCCGTCCGG AAGATTTACG TCTGGTTGAA AGCGTACAGA AAGGGCTGAA ATCGCGTGGC 
TATCGTGGTC AGGGGCGCAT CATGGCCGAC AGTAGCGGTA GTGGCATTTC CGAACATGGT 
ATCGCCCATT TCCATAATCT GCTGGCGCAG GTGTTTAAGG ACTAA

Protein sequence

MSNLSPDFVL PENFCANPQE AWTIPARFYT DQNAFEHEKE NVFAKSWICV AHSSELANAN 
DYVTREIIGE SIVLVRGRDK VLRAFYNVCP HRGHQLLSGE GKAKNVITCP YHAWAFKLDG 
NLAHARNCEN VANFDSDKAQ LVPVRLEEYA GFVFINMDPN ATSVEDQLPG LGAKVLEACP 
EVHDLKLAAR FTTRTPANWK NIVDNYLECY HCGPAHPGFS DSVQVDRYWH TMHGNWTLQY 
GFAKPSEQSF KFEEGTDAAF HGFWLWPCTM LNVTPIKGMM TVIYEFPVDS ETTLQNYDIY 
FTNEELTDEQ KSLIEWYRDV FRPEDLRLVE SVQKGLKSRG YRGQGRIMAD SSGSGISEHG 
IAHFHNLLAQ VFKD