Gene B21_04100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_04100
Symbol	intB
ID	8115794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	4406434
End bp	4407624
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	46%
IMG OID	644850247
Product	hypothetical protein
Protein accession	YP_003001820
Protein GI	251787516
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATCTGC TTGTCCATCC AAATGGTTCT AAGTACTGGC GTTTGCAGTA CCGTTATGAG 
GGAAAGCAAA AAATGCTGGC ACTTGGGGTT TATCCTGAAA TCACACTAGC GGATGCCAGA 
GTACGTCGTG ACGAGACGCG TAAGCTGCTT GCGAATGGCG TCGATCCGGG AGACAAAAAG 
AAAAATGATA AGGTTGAACA GAGTAAAGCA CGAACCTTTA AAGAAGTCGC GATTGAGTGG 
CATGGCACCA ATAAAAAGTG GTCTGAAGAT CACGCCCATC GTGTGCTAAA AAGTCTTGAA 
GATAATCTTT TTGCAGCGCT TGGTGAACGT AATATCGCTG AGTTAAAAAC TCGAGATTTA 
TTAGCACCTA TTAAGGCCGT AGAAATGTCT GGACGTCTTG AAGTGGCCGC TCGTCTTCAG 
CAGCGCACTA CAGCCATCAT GCGCTATGCA GTGCAAAGTG GGTTAATTGA TTATAACCCG 
GCACAAGAGA TGGCTGGGGC GGTTGCTTCC TGTAATCGAC AACATCGTCC CGCGCTTGAA 
TTAAAGCGCA TCCCTGAGTT GCTTACAAAA ATAGATAGCT ATACTGGTAG GCCGCTAACC 
CGATGGGCGA TAGAACTCAC TTTGCTGATC TTTATTCGGT CCAGTGAGCT GCGTTTTGCT 
CGTTGGTCAG AGATCGATTT CGAAGCGTCT ATATGGACTA TCCCACCGGA GCGGGAGCCT 
ATTCCTGGAG TGAAACATTC CCATAGAGGC TCAAAAATGC GTACAACGCA TCTAGTGCCT 
CTTTCAACGC AAGCTCTTGC AATTTTAAAG CAGATAAAAC AGTTTTATGG GGCCCATGAC 
TTGATATTTA TTGGTGATCA CGATTCGCAC AAACCCATGA GTGAGAATAC GGTAAATAGT 
GCGTTACGGG TCATGGGGTA TGATACAAAA GTAGAGGTTT GTGGTCATGG CTTTCGAACA 
ATGGCCTGTA GTTCATTGGT CGAATCAGGT CTGTGGTCTC GTGATGCTGT TGAACGTCAG 
ATGAGCCACA TGGCGCGAAA TTCAGTGAGG GCCGCGTATA TCCATAAAGC AGAGCATCTG 
GAAGAACGGC GATTGATGCT ACAGTGGTGG GCCGATTTTC TGGATGTAAA CAGAGAAAGG 
TTTATCAGTC CATTTGAATA TGCAAAGATT AATAATCCAT TAAAACAGTA A

Protein sequence

MHLLVHPNGS KYWRLQYRYE GKQKMLALGV YPEITLADAR VRRDETRKLL ANGVDPGDKK 
KNDKVEQSKA RTFKEVAIEW HGTNKKWSED HAHRVLKSLE DNLFAALGER NIAELKTRDL 
LAPIKAVEMS GRLEVAARLQ QRTTAIMRYA VQSGLIDYNP AQEMAGAVAS CNRQHRPALE 
LKRIPELLTK IDSYTGRPLT RWAIELTLLI FIRSSELRFA RWSEIDFEAS IWTIPPEREP 
IPGVKHSHRG SKMRTTHLVP LSTQALAILK QIKQFYGAHD LIFIGDHDSH KPMSENTVNS 
ALRVMGYDTK VEVCGHGFRT MACSSLVESG LWSRDAVERQ MSHMARNSVR AAYIHKAEHL 
EERRLMLQWW ADFLDVNRER FISPFEYAKI NNPLKQ