Gene B21_02244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02244
Symbol	yfdU
ID	8114120
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2367454
End bp	2369148
Gene Length	1695 bp
Protein Length	564 aa
Translation table	11
GC content	47%
IMG OID	644848449
Product	hypothetical protein
Protein accession	YP_003000022
Protein GI	251785718
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID	[TIGR03254] oxalyl-CoA decarboxylase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGATC AACTTCAAAT GACAGATGGT ATGCATATCA TCGTTGAAGC ATTAAAACAG 
AATAATATTG ACACTATTTA TGGTGTTGTA GGTATTCCTG TGACGGATAT GGCACGCCAT 
GCCCAGGCGG AAGGCATTCG TTATATTGGT TTTCGTCATG AGCAGTCGGC AGGCTATGCC 
GCTGCGGCAA GCGGTTTTCT TACCCAAAAA CCGGGGATCT GCCTGACAGT TTCTGCGCCA 
GGATTCCTCA ATGGTTTGAC CGCATTGGCC AACGCAACGG TAAATGGTTT TCCGATGATC 
ATGATTAGCG GCTCCAGCGA CCGCGCGATC GTCGACCTAC AGCAAGGTGA TTATGAAGAG 
CTGGACCAAA TGAATGCGGC AAAACCGTAT GCCAAAGCAG CATTTCGCGT TAATCAGCCG 
CAGGATCTTG GCATTGCATT GGCACGCGCT ATCCGGGTCT CTGTATCGGG TCGCCCTGGC 
GGAGTTTATC TTGATTTGCC AGCAAATGTC CTGGCCGCGA CGATGGAAAA AGACGAAGCG 
TTAACCACGA TTGTTAAAGT TGAAAATCCG TCGCCAGCAT TATTGCCATG CCCGAAGTCA 
GTCACTAGCG CAATTTCGCT TTTAGCAAAA GCTGAACGGC CATTAATTAT CCTTGGCAAA 
GGCGCGGCGT ATTCACAAGC TGATGAACAG CTTCGTGAAT TTATTGAAAG TGCTCAGATT 
CCATTCCTGC CAATGTCTAT GGCGAAAGGG ATCCTTGAAG ATACGCATCC ACTTTCTGCG 
GCAGCTGCGC GTTCGTTTGC CCTGGCAAAT GCTGACGTTG TCATGCTTGT TGGTGCACGA 
CTGAATTGGT TATTGGCACA CGGTAAAAAA GGATGGGCGG CAGATACACA GTTTATTCAA 
CTGGATATTG AACCGCAGGA AATTGACAGC AACCGCCCCA TTGCTGTGCC AGTCGTTGGT 
GATATTGCAT CCAGTATGCA AGGTATGCTG GCAGAACTGA AACAAAACAC ATTTACGACT 
CCACTGGTAT GGCGCGATAT TTTAAATATC CACAAGCAGC AAAATGCACA AAAAATGCAT 
GAAAAATTAA GTACAGATAC TCAACCATTA AATTACTTTA ATGCATTAAG TGCTGTGCGC 
GACGTATTGC GCGAGAACCA GGATATTTAT TTAGTTAATG AAGGTGCAAA TACCCTGGAT 
AATGCACGAA ATATTATTGA TATGTATAAA CCACGTCGTC GTCTGGATTG TGGTACCTGG 
GGTGTCATGG GCATCGGTAT GGGCTATGCC ATCGGTGCTA GCGTGACTTC TGGTTCTCCG 
GTTGTCGCCA TTGAAGGTGA TAGTGCTTTT GGTTTCAGTG GGATGGAAAT TGAAACGATT 
TGTCGATATA ACCTGCCGGT GACGATCGTT ATTTTTAATA ATGGCGGCAT CTACAGAGGA 
GACGGTGTTG ATCTCAGTGG CGCTGGTGCA CCATCACCAA CGGATCTGTT GCACCATGCA 
AGGTATGACA AATTAATGGA TGCGTTTCGT GGCGTTGGCT ATAACGTCAC CACGACAGAT 
GAACTTCGTC ATGCTTTAAC CACCGGTATT CAGTCGCGCA AACCGACCAT TATTAATGTG 
GTCATCGACC CTGCAGCAGG AACTGAAAGT GGCCATATTA CCAAACTTAA CCCAAAACAA 
GTCGCTGGTA ATTAA

Protein sequence

MSDQLQMTDG MHIIVEALKQ NNIDTIYGVV GIPVTDMARH AQAEGIRYIG FRHEQSAGYA 
AAASGFLTQK PGICLTVSAP GFLNGLTALA NATVNGFPMI MISGSSDRAI VDLQQGDYEE 
LDQMNAAKPY AKAAFRVNQP QDLGIALARA IRVSVSGRPG GVYLDLPANV LAATMEKDEA 
LTTIVKVENP SPALLPCPKS VTSAISLLAK AERPLIILGK GAAYSQADEQ LREFIESAQI 
PFLPMSMAKG ILEDTHPLSA AAARSFALAN ADVVMLVGAR LNWLLAHGKK GWAADTQFIQ 
LDIEPQEIDS NRPIAVPVVG DIASSMQGML AELKQNTFTT PLVWRDILNI HKQQNAQKMH 
EKLSTDTQPL NYFNALSAVR DVLRENQDIY LVNEGANTLD NARNIIDMYK PRRRLDCGTW 
GVMGIGMGYA IGASVTSGSP VVAIEGDSAF GFSGMEIETI CRYNLPVTIV IFNNGGIYRG 
DGVDLSGAGA PSPTDLLHHA RYDKLMDAFR GVGYNVTTTD ELRHALTTGI QSRKPTIINV 
VIDPAAGTES GHITKLNPKQ VAGN