Gene B21_01137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01137
Symbol	purB
ID	8114442
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	1193391
End bp	1194761
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	52%
IMG OID	644847391
Product	hypothetical protein
Protein accession	YP_002998964
Protein GI	251784660
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0015] Adenylosuccinate lyase
TIGRFAM ID	[TIGR00928] adenylosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATTAT CCTCACTGAC CGCCGTTTCC CCTGTCGATG GACGCTACGG CGATAAAGTC 
AGCGCGCTGC GCGGGATTTT CAGCGAATAT GGTTTGCTGA AATTCCGTGT ACAAGTTGAA 
GTACGTTGGC TGCAAAAACT GGCCGCGCAC GCAGCGATCA AGGAAGTTCC TGCTTTTGCT 
GCCGACGCAA TCGGTTACCT TGATGCAATT GTCGCCAATT TCAGCGAAGA AGATGCCGCA 
CGCATCAAAA CCATCGAGCG TACTACTAAC CACGACGTTA AAGCGGTTGA GTATTTCCTG 
AAAGAAAAAG TGGCGGAGAT CCCGGAACTG CACGCGGTTT CTGAATTCAT CCACTTTGCC 
TGTACTTCGG AAGATATCAA TAACCTCTCC CACGCATTAA TGCTGAAAAC CGCGCGTGAT 
GAAGTGATCC TGCCGTACTG GCGTCAACTG ATTGATGGCA TTAAAGATCT CGCCGTTCAG 
TACCGCGATA TCCCGCTGCT GTCTCGTACC CACGGTCAGC CAGCCACGCC GTCAACCATC 
GGTAAAGAGA TGGCAAACGT CGCCTACCGT ATGGAGCGCC AGTACCGCCA GCTTAACCAG 
GTGGAGATCC TCGGCAAAAT CAACGGCGCG GTCGGTAACT ATAACGCCCA CATCGCCGCT 
TACCCGGAAG TTGACTGGCA TCAGTTCAGC GAAGAGTTCG TCACCTCGCT GGGTATTCAA 
TGGAACCCGT ACACTACCCA GATTGAACCG CACGACTACA TTGCCGAACT GTTTGATTGC 
GTTGCGCGCT TCAACACCAT TCTGATCGAC TTTGACCGTG ACGTCTGGGG TTATATCGCC 
CTTAACCACT TCAAACAGAA AACCATCGCC GGTGAGATTG GTTCTTCCAC CATGCCGCAT 
AAAGTTAACC CGATCGACTT CGAGAACTCC GAAGGGAACC TGGGCCTTTC CAACGCGGTA 
TTGCAGCATC TGGCAAGCAA ACTGCCGGTT TCCCGCTGGC AGCGTGACCT GACCGACTCC 
ACCGTGCTGC GTAACCTCGG CGTAGGTATC GGTTATGCGC TGATTGCGTA TCAATCCACC 
CTGAAAGGCG TGAGCAAACT GGAAGTGAAC CGTGACCATC TGCTGGATGA ACTGGATCAC 
AACTGGGAAG TGCTGGCAGA ACCAATCCAG ACAGTTATGC GTCGCTATGG CATCGAAAAA 
CCGTACGAGA AATTGAAAGA GCTGACTCGC GGTAAGCGCG TTGACGCCGA AGGCATGAAG 
CAGTTTATCG ACGGTCTGGC GTTGCCAGAA GAAGAGAAAG CCCGCCTGAA AGCGATGACG 
CCGGCTAACT ATATTGGTCG AGCTATCACG ATGGTTGATG AGCTGAAATA A

Protein sequence

MELSSLTAVS PVDGRYGDKV SALRGIFSEY GLLKFRVQVE VRWLQKLAAH AAIKEVPAFA 
ADAIGYLDAI VANFSEEDAA RIKTIERTTN HDVKAVEYFL KEKVAEIPEL HAVSEFIHFA 
CTSEDINNLS HALMLKTARD EVILPYWRQL IDGIKDLAVQ YRDIPLLSRT HGQPATPSTI 
GKEMANVAYR MERQYRQLNQ VEILGKINGA VGNYNAHIAA YPEVDWHQFS EEFVTSLGIQ 
WNPYTTQIEP HDYIAELFDC VARFNTILID FDRDVWGYIA LNHFKQKTIA GEIGSSTMPH 
KVNPIDFENS EGNLGLSNAV LQHLASKLPV SRWQRDLTDS TVLRNLGVGI GYALIAYQST 
LKGVSKLEVN RDHLLDELDH NWEVLAEPIQ TVMRRYGIEK PYEKLKELTR GKRVDAEGMK 
QFIDGLALPE EEKARLKAMT PANYIGRAIT MVDELK