Gene B21_02668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02668
Symbol	ygeZ
ID	8113996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	2840098
End bp	2841483
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	53%
IMG OID	644848864
Product	hypothetical protein
Protein accession	YP_003000437
Protein GI	251786133
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR02033] D-hydantoinase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGTAT TGATCAAAAA CGGCACTGTC GTTAACGCAG ATGGACAAGC CAAACAGGAT 
TTGCTGATTG AAAGCGGGAT TGTTCGCCAG TTGGGCAACA ATATTTCGCC GCAGCTCCCG 
TATGAAGAAA TTGATGCCAC TGGCTGTTAC GTTTTCCCTG GCGGCGTGGA TGTCCATACG 
CATTTCAATA TTGATGTCGG CATCGCGCGC AGTTGTGATG ATTTTTTTAC CGGTACCCGC 
GCAGCTGCGT GTGGCGGTAC AACAACCATT ATTGACCATA TGGGATTTGG CCCAAACGGC 
TGTCGGTTAC GCCATCAACT GGAGGTTTAT CGTGGTTATG CCGCCCATAA AGCGGTCATC 
GATTACAGCT TTCACGGTGT GATCCAGCAC ATTAATCACG CAATCCTCGA CGAAATCCCG 
ATGATGGTCG AGGAAGGACT GAGCAGTTTT AAACTCTATT TAACCTATCA ATACAAACTC 
AACGATGACG AGGTTTTGCA GGCATTACGC CGTCTGCATG AATCCGGCGC GCTGACCACC 
GTGCACCCGG AAAATGATGC GGCTATCGCC AGCAAGCGGG CGGAGTTTAT CGCCGCAGGG 
TTAACCGCGC CGCGCTATCA CGCCTTGAGT CGCCCTCTGG AATGCGAAGC GGAAGCCATC 
GCCCGCATGA TTAACCTGGC ACAAATTGCC GGTAACGCCC CGCTCTATAT CGTGCACCTG 
TCTAACGGCT TAGGTCTGGA TTATCTGCGT CTTGCCCGTG CGAATCACCA GCCAGTCTGG 
GTTGAAACCT GCCCACAATA TCTCCTGTTG GACGAACGCA GTTACGATAC AGAAGATGGC 
ATGAAGTTCA TTCTTAGCCC ACCGCTGCGT AACGTACGCG AGCAGGACAA ACTGTGGTGT 
GGCATCAGCG ATGGTGCGAT TGACGTGGTG GCAACCGATC ACTGCACCTT CTCGATGGCT 
CAACGCCTGC AAATTTCTAA AGGCGATTTC AGTCGCTGCC CAAATGGCTT ACCCGGTGTG 
GAAAACCGCA TGCAGTTACT GTTTTCCAGT GGCGTGATGA CGGGACGTAT AACACCGGAA 
CGCTTTGTTG AATTAACCAG CGCAATGCCC GCCAGGCTGT TTGGCCTGTG GCCGCAAAAA 
GGATTATTAG CGCCCGGTTC CGACGGCGAC GTGGTGATTA TCGACCCACG TCAGAGCCAA 
CAAATTCAGC ATCGCCATCT CCACGACAAC GCCGACTACT CGCCATGGGA GGGTTTTACC 
TGTCAGGGCG CGATTGTCAG AACCTTATCC CGTGGTGAAA CGATTTTCTG TGACGGCACC 
TTTACAGGCA AAGCCGGGCG AGGTCGTTTC CTGCGACGCA AACCGTTTGT CCCTCCCGTG 
CTCTAA

Protein sequence

MRVLIKNGTV VNADGQAKQD LLIESGIVRQ LGNNISPQLP YEEIDATGCY VFPGGVDVHT 
HFNIDVGIAR SCDDFFTGTR AAACGGTTTI IDHMGFGPNG CRLRHQLEVY RGYAAHKAVI 
DYSFHGVIQH INHAILDEIP MMVEEGLSSF KLYLTYQYKL NDDEVLQALR RLHESGALTT 
VHPENDAAIA SKRAEFIAAG LTAPRYHALS RPLECEAEAI ARMINLAQIA GNAPLYIVHL 
SNGLGLDYLR LARANHQPVW VETCPQYLLL DERSYDTEDG MKFILSPPLR NVREQDKLWC 
GISDGAIDVV ATDHCTFSMA QRLQISKGDF SRCPNGLPGV ENRMQLLFSS GVMTGRITPE 
RFVELTSAMP ARLFGLWPQK GLLAPGSDGD VVIIDPRQSQ QIQHRHLHDN ADYSPWEGFT 
CQGAIVRTLS RGETIFCDGT FTGKAGRGRF LRRKPFVPPV L