Gene B21_02666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02666
Symbol	ygeX
ID	8113994
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	2837580
End bp	2838776
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	53%
IMG OID	644848862
Product	hypothetical protein
Protein accession	YP_003000435
Protein GI	251786131
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01747] diaminopropionate ammonia-lyase family [TIGR03528] diaminopropionate ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGTTT TCTCATTGAA GATTGATATC GCCGATAACA AATTTTTCAA CGGCGAAACA 
TCACCGCTCT TTTCGCAAAG CCAAGCCAAA CTGGCGCGCC AGTTCCACCA GAAAATAGCT 
GGTTATCGCC CAACACCGCT TTGTGCGCTG GACGATCTCG CAAACCTTTT TGGTGTGAAG 
AAAATTCTCG TCAAAGACGA ATCAAAACGA TTCGGTCTGA ACGCCTTCAA AATGCTTGGC 
GGTGCGTACG CCATCGCTCA ATTATTGTGT GAAAAATATC ATCTTGATAT CGAAACGCTG 
TCATTTGAGC ACCTGAAAAA TACCATCGGC GAAAAAATGA CTTTCGCGAC CACCACCGAC 
GGCAACCACG GGCGCGGTGT GGCGTGGGCA GCACAGCAAC TCGGACAGAA TGCGGTGATT 
TACATGCCGA AAGGTTCTGC TCAGGAACGC GTTGACGCCA TTCTGAACCT CGGTGCCGAG 
TGCATCGTCA CAGATATGAA CTATGACGAT ACCGTTCGCC TGACCATGCA ACACGCGCAG 
CAGCACGGCT GGGAAGTGGT ACAGGACACG GCATGGGAAG GTTACACCAA AATCCCAACC 
TGGATCATGC AAGGCTACGC AACCCTGGCA GATGAAGCCG TCGAGCAAAT GCGTGAAATG 
GGCGTAACCC CGACGCACGT TCTGCTGCAA GCCGGTGTCG GAGCAATGGC CGGTGGTGTG 
CTGGGTTATC TGGTCGACGT CTACAGCCCG CAAAATCTGC ACAGCATTAT TGTTGAACCT 
GACAAAGCTG ACTGTATTTA TCGCTCCGGC GTCAAAGGCG ACATCGTCAA CGTTGGCGGT 
GATATGGCCA CCATCATGGC GGGCCTGGCC TGTGGCGAAC CTAACCCGCT GGGCTGGGAA 
ATCCTACGTA ACTGCGCCAC CCAATTCATC TCCTGCCAGG ACAGCGTTGC CGCATTAGGT 
ATGCGCGTGC TGGGTAATCC GTACGGCAAC GACCCGCGCA TCATCTCCGG TGAATCCGGC 
GCTGTCGGTT TGGGCGTTCT CGCAGCGGTT CATTATCACC CGCAACGTCA AAGCCTGATG 
GAAAAACTGG CGCTGAACAA AGATGCCGTA GTGCTGGTTA TCAGTACTGA AGGCGACACC 
GACGTGAAGC ACTACCGCGA AGTTGTCTGG GAAGGCAAAC ACGCTGTAGC ACCTTAA

Protein sequence

MSVFSLKIDI ADNKFFNGET SPLFSQSQAK LARQFHQKIA GYRPTPLCAL DDLANLFGVK 
KILVKDESKR FGLNAFKMLG GAYAIAQLLC EKYHLDIETL SFEHLKNTIG EKMTFATTTD 
GNHGRGVAWA AQQLGQNAVI YMPKGSAQER VDAILNLGAE CIVTDMNYDD TVRLTMQHAQ 
QHGWEVVQDT AWEGYTKIPT WIMQGYATLA DEAVEQMREM GVTPTHVLLQ AGVGAMAGGV 
LGYLVDVYSP QNLHSIIVEP DKADCIYRSG VKGDIVNVGG DMATIMAGLA CGEPNPLGWE 
ILRNCATQFI SCQDSVAALG MRVLGNPYGN DPRIISGESG AVGLGVLAAV HYHPQRQSLM 
EKLALNKDAV VLVISTEGDT DVKHYREVVW EGKHAVAP