Gene B21_02473 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02473
Symbol	ybl113
ID	8116776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	2621732
End bp	2622961
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	46%
IMG OID	644848673
Product	hypothetical protein
Protein accession	YP_003000246
Protein GI	251785942
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.36664
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAAAA TCGCTAAGAA GCTCACTGAC ACTGAAATCA AAAGCACCAA ACCTGCCGAA 
AAAGAGGTTA ACCTTTTTGA CGGCGATGGT TTGCTGTTGC GAATCGCTCC CCTGGCGAAG 
GGAGGGAAGA AAAATTGGTA TTTCAGATAT GCAGTGCCTG TGACCAAAAA GCGAACTAAG 
GTGAGCTTAG GAACCTATCC TCACCTTACA CTTGCGAAGG CACGAGCTTT ACGTGATGAA 
TACTTGTCGT TGCTTACAAA TGGTATAGAC CCCCAAGTTC ATAACAACCA AAAAGCCAAT 
GCACTGAAAG ATGCCACGGA ACATACATTT CAAGCAGTAG CCAAGAAGTG GCTTGATGAG 
AAAGTCAAAA CGTCAGGCAT CTCCCAAGAT CATGCTAACG ACATCTGGCG AAGCCTAGAG 
AGAAATATCT TTTCCACATT GGGTGATACC CCAATTAAGG AGATTCGCCC TAAAATGCTT 
AAACAGCATT TAGAACCCAT AGAAAAACGA GGTGTCCTTG AAACACTTCG CCGCATCATA 
TCCCGCCTGA ATGAAATTTT CCGCTATGCA GCAACAGAAG AACTCATAGA ATTCAACCCG 
GCAGACAACC TGGGGCAACG GTTCAGCAAG CCAAAAAAAC AGAATATGCC AGCATTACCC 
CCTTCCGAAC TCCCTCGCTT CTTGGTTGCT CTAAACAATG CTTCTATCCG TTTGGAAACA 
AGGCTACTGA TTGAGTGGCA ACTTCTCACA TGGGTTCGCC CAGGTGAAGC TGTTCGCACA 
AGATGGTCAG ATATTGATAT TGAAACTGGC ATGTGGAACA TCCCGGCGGA GTTTATGAAA 
ATGAAGAAGC CTCACAAAGT TCCACTGAGC AAAGAAGCTT TGCGAGTTTT GGATTTAATG 
AAAGTCATCA GCGGGCATAG AGAGTGGGTG TTCCCCAGTA TCAAAGCTCC ACTCAATCAC 
ATGCATGAAC AAACAGCTAA TGCGGCCATA ATCCGTATGG GTTTCGGAGG TGAGCTTGTA 
GCTCACGGTA TGCGATCCAT TGCTAGAACG GCTGCTGAGG AGTCTGGCAA GTTTAGGACT 
GATGTCTTAG AAGCCGCCCT TGCCCACTCG AAGAAAGATG AAATAATTGC AGCCTACAAT 
CGTGCAGAGT ATCTCACTGA ACGGGTGGTT CTCATGCAAT GGTGGAGTGA CTATGTTTCG 
TCTCAAAAAT GCAAAGTTAT TGCCGCATAA

Protein sequence

MAKIAKKLTD TEIKSTKPAE KEVNLFDGDG LLLRIAPLAK GGKKNWYFRY AVPVTKKRTK 
VSLGTYPHLT LAKARALRDE YLSLLTNGID PQVHNNQKAN ALKDATEHTF QAVAKKWLDE 
KVKTSGISQD HANDIWRSLE RNIFSTLGDT PIKEIRPKML KQHLEPIEKR GVLETLRRII 
SRLNEIFRYA ATEELIEFNP ADNLGQRFSK PKKQNMPALP PSELPRFLVA LNNASIRLET 
RLLIEWQLLT WVRPGEAVRT RWSDIDIETG MWNIPAEFMK MKKPHKVPLS KEALRVLDLM 
KVISGHREWV FPSIKAPLNH MHEQTANAAI IRMGFGGELV AHGMRSIART AAEESGKFRT 
DVLEAALAHS KKDEIIAAYN RAEYLTERVV LMQWWSDYVS SQKCKVIAA