Gene B21_03519 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03519
Symbol	dgoD
ID	8114512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3758724
End bp	3759872
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	53%
IMG OID	644849689
Product	hypothetical protein
Protein accession	YP_003001262
Protein GI	251786958
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.84784
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCA CCAAAATTAC CACGTATCGT TTACCTCCCC GCTGGATGTT CCTGAAAATT 
GAAACCGATG AAGGCGTGGT CGGTTGGGGC GAGCCCGTGA TCGAAGGCCG CGCCCGTACG 
GTGGAAGCGG CAGTTCACGA GCTGGGTGAC TATTTGATTG GTCAGGATCC ATCGCGCATC 
AATGACTTAT GGCAAGTGAT GTATCGCGCC GGATTCTATC GCGGCGGTCC GATCCTGATG 
AGCGCCATCG CCGGGATTGA CCAGGCATTA TGGGATATCA AAGGTAAAGT GCTGAATGCG 
CCGGTCTGGC AACTGATGGG CGGCCTGGTT CGCGACAAAA TTAAAGCCTA CAGTTGGGTT 
GGCGGCGATC GTCCGGCGGA TGTTATCGAC GGCATTAAAA CGCTACGCGA AATCGGCTTC 
GATACCTTCA AACTGAACGG TTGTGAAGAA CTGGGGCTAA TTGATAACTC CCGCGCGGTA 
GATGCGGCGG TTAACACCGT GGCACAAATT CGTGAAGCTT TTGGCAATCA GATTGAGTTT 
GGTCTTGATT TCCACGGTCG CGTCAGCGCG CCGATGGCGA AAGTGCTGAT TAAAGAACTG 
GAGCCGTATC GCCCGCTGTT TATTGAGGAG CCGGTGCTGG CGGAACAAGC CGAATACTAC 
CCGAAACTGG CGGCACAAAC GCATATTCCA CTGGCGGCGG GTGAACGCAT GTTCTCACGC 
TTCGATTTTA AACGCGTGCT GGAGGCAGGC GGTATTTCGA TTCTGCAACC GGATCTCTCC 
CACGCGGGCG GTATTACCGA ATGCTACAAA ATCGCCGGAA TGGCAGAAGC CTATGACGTG 
ACCCTTGCGC CGCACTGTCC GCTCGGACCG ATTGCACTGG CGGCTTGCCT GCATATCGAC 
TTTGTTTCCT ATAACGCCGT ACTTCAGGAA CAAAGTATGG GAATTCATTA CAACAAAGGC 
GCGGAGTTAC TCGACTTTGT GAAAAACAAA GAAGACTTCA GCATGGTCGG CGGCTTCTTT 
AAACCGTTAA CGAAACCGGG CTTAGGCGTG GAAATCGACG AAGCTAAAGT GATTGAGTTC 
AGTAAAAATG CCCCGGACTG GCGTAATCCG CTCTGGCGTC ATGAAGATAA CAGCGTAGCA 
GAGTGGTAA

Protein sequence

MKITKITTYR LPPRWMFLKI ETDEGVVGWG EPVIEGRART VEAAVHELGD YLIGQDPSRI 
NDLWQVMYRA GFYRGGPILM SAIAGIDQAL WDIKGKVLNA PVWQLMGGLV RDKIKAYSWV 
GGDRPADVID GIKTLREIGF DTFKLNGCEE LGLIDNSRAV DAAVNTVAQI REAFGNQIEF 
GLDFHGRVSA PMAKVLIKEL EPYRPLFIEE PVLAEQAEYY PKLAAQTHIP LAAGERMFSR 
FDFKRVLEAG GISILQPDLS HAGGITECYK IAGMAEAYDV TLAPHCPLGP IALAACLHID 
FVSYNAVLQE QSMGIHYNKG AELLDFVKNK EDFSMVGGFF KPLTKPGLGV EIDEAKVIEF 
SKNAPDWRNP LWRHEDNSVA EW