Gene B21_02034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02034
Symbol	yeiT
ID	8114698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	2128250
End bp	2129488
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	51%
IMG OID	644848246
Product	hypothetical protein
Protein accession	YP_002999819
Protein GI	251785515
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0493] NADPH-dependent glutamate synthase beta chain and related oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGCAAC AAAATTATCT GGATGAACTC ACTCCGGCTT TTACGTCTTT ACTGGCGATT 
AAAGAAGCCT CTCGCTGTTT ATTATGTCAC GACGCTCCCT GTAGTCAGGC TTGCCCGGCA 
CAGACCGATC CGGGGAAATT TATTCGCTCA ATCTACTTTC GTAATTTTAA AGGCGCTGCC 
GAGACAATTC GCGAAAATAA TGCCCTCGGT GCCGTTTGTG CCAGAGTGTG CCCGACGGAG 
AAATTATGCC AAAGCGGTTG TACCCGTGCC GGTGTTGATG CTCCCATTGA TATCGGCCGC 
TTACAGCGTT TTGTTACTGA TTTTGAACAA CAAACCGGAA TGGAAATTTA TCAGCCCGGT 
ACTAAAACGC TCGGCAAAGT CGCGATTATT GGCGCAGGTC CTGCCGGATT GCAGGCCAGT 
GTGACACTGA CAAACCAGGG TTATGACGTC ACGATTTATG AGAAAGAAGC GCACCCCGGT 
GGCTGGTTGC GTAACGGTAT TCCGCAATTC CGGTTACCGC AATCAGTGCT GGATGCAGAG 
ATCGCCCGTA TTGAAAAAAT GGGCGTGACC ATTAAGTGCA ACAACGAAGT CGGTAACACA 
CTCACCCTTG AGCAGCTGAA AGCAGAAAAC CGCGCGGTAC TGGTCACCGT GGGGTTATCA 
AGCGGTTCCG GGCTACCGCT GTTTGAGCAT AGTGACGTTG AGATTGCCGT CGACTTCTTG 
CAACGTGCAC GACAGGCGCA AGGCGATATC AGCATTCCAC AAAGCGCATT AATTATCGGC 
GGCGGTGATG TCGCGATGGA CGTAGCCAGC ACGCTGAAAG TTCTCGGCTG TCAGGCGGTA 
ACTTGCGTAG CGCGTGAAGA GTTAGATGAG TTTCCGGCAA GCGAAAAAGA GTTTACCAGC 
GCCCGGGAGC TGGGCGTTTC GATCATCGAT GGATTCACGC CAGTAGCCGT GGAAGGCAAT 
AAAGTCACGT TTAAGCATGT ACGGTTATCG GGCGAACTGA CGATGGCGGC AGATAAAATT 
ATTCTCGCCG TCGGTCAGCA TGCCAGACTA GATGCCTTTG CGGAGTTAGA GCCGCAGCGT 
AACACCATCA AAACACAAAA TTACCAGACC CGCGACCCGC AAGTCTTTGC TGCTGGCGAT 
ATTGTTGAGG GTGACAAAAC CGTGGTCTAT GCCGTGAAAA CCGGGAAAGA AGCCGCCGAG 
GCGATTCATC ACTATTTAGA GGGAGCTTGC TCATGTTAA

Protein sequence

MPQQNYLDEL TPAFTSLLAI KEASRCLLCH DAPCSQACPA QTDPGKFIRS IYFRNFKGAA 
ETIRENNALG AVCARVCPTE KLCQSGCTRA GVDAPIDIGR LQRFVTDFEQ QTGMEIYQPG 
TKTLGKVAII GAGPAGLQAS VTLTNQGYDV TIYEKEAHPG GWLRNGIPQF RLPQSVLDAE 
IARIEKMGVT IKCNNEVGNT LTLEQLKAEN RAVLVTVGLS SGSGLPLFEH SDVEIAVDFL 
QRARQAQGDI SIPQSALIIG GGDVAMDVAS TLKVLGCQAV TCVAREELDE FPASEKEFTS 
ARELGVSIID GFTPVAVEGN KVTFKHVRLS GELTMAADKI ILAVGQHARL DAFAELEPQR 
NTIKTQNYQT RDPQVFAAGD IVEGDKTVVY AVKTGKEAAE AIHHYLEGAC SC