Gene B21_03347 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03347
Symbol	eptB
ID	8114549
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3569014
End bp	3570705
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	50%
IMG OID	644849521
Product	hypothetical protein
Protein accession	YP_003001094
Protein GI	251786790
COG category	[R] General function prediction only
COG ID	[COG2194] Predicted membrane-associated, metal-dependent hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATACA TCAAATCGAT TACACAGCAG AAGCTGAGCT TTTTGCTTGC AATCTATATT 
GGCCTTTTTA TGAATGGCGC GGTTTTTTAC CGCCGCTTCG GCAGCTATGC GCACGATTTT 
ACCGTCTGGA AAGGCATTTC TGCTGTTGTT GAACTGGCCG CCACCGTACT GGTGACCTTC 
TTTTTACTAC GTCTTCTTTC GCTGTTTGGC CGCCGCAGCT GGCGTATTCT GGCATCGCTG 
GTGGTGCTCT TTTCCGCAGG TGCCAGCTAT TACATGACCT TCCTTAATGT GGTCATTGGT 
TATGGCATCA TCGCTTCCGT CATGACCACC GATATCGACC TGTCAAAAGA AGTTGTTGGT 
CTGAACTTTA TTCTCTGGTT AATCGCCGTT AGTGCATTGC CTCTTATCCT TATCTGGAAT 
AACCGCTGTC GCTACACCTT GCTCCGACAA CTGCGAACCC CAGGGCAGCG TATTCGCAGC 
CTGGCGGTCG TCGTACTGGC GGGTATTATG GTTTGGGCAC CGATTCGTTT GCTGGATATC 
CAGCAGAAGA AAGTGGAGAG GGCGACCGGC GTTGATTTGC CGAGTTATGG CGGTGTCGTA 
GCGAACTCTT ATCTGCCATC AAACTGGCTT TCTGCGTTGG GGCTGTATGC CTGGGCGCGG 
GTCGATGAAT CTTCCGATAA TAATTCATTG CTTAATCCGG CGAAGAAATT CACTTATCAG 
GCACCGCAAA ACGTTGATGA CACTTATGTC GTGTTTATCA TCGGTGAAAC CACGCGTTGG 
GACCATATGG GTATTTTCGG CTATGAGCGT AATACCACGC CGAAACTGGC CCAGGAGAAA 
AATCTGGCGG CGTTCCGTGG TTACTCCTGT GATACCGCAA CCAAACTCTC ACTGCGTTGC 
ATGTTTGTAC GTCAGGGGGG CGCGGAAGAT AATCCGCAGC GCACATTAAA AGAACAGAAC 
ATTTTCGCGG TTCTGAAGCA GTTAGGATTC AGTTCTGACC TCTACGCTAT GCAGAGCGAA 
ATGTGGTTCT ACAGCAACAC GATGGCGGAC AACATTGCTT ATCGTGAGCA GATTGGTGCG 
GAGCCACGTA ATCGTGGCAA GCCGGTAGAT GATATGTTGC TGGTAGACGA AATGCAGCAA 
TCGCTAGGGC GCAACCCGGA TGGTAAGCAT CTGATCATTC TGCATACCAA AGGTTCGCAT 
TTTAACTACA CCCAGCGTTA TCCGCGTAGC TTCGCGCAGT GGAAGCCGGA ATGTATTGGT 
GTTGATAGCG GCTGTACCAA AGCGCAGATG ATCAACTCCT ATGACAACTC GGTGACCTAT 
GTGGATCACT TTATCTCCAG CGTAATTGAT CAGGTTCGCG ATAAGAAAGC GATTGTGTTC 
TACGCAGCTG ACCACGGTGA GTCAATTAAT GAACGCGAGC ACCTGCACGG CACGCCGCGT 
GAACTGGCAC CGCCGGAGCA GTTCCGCGTA CCGATGATGG TCTGGATGTC AGATAAATAT 
CTGGAAAATC CGGCCAATGC GCAGGCGTTT GCGCAGCTGA AAAAAGAAGC CGACATGAAA 
GTGCCACGCC GTCACGTAGA GCTGTACGAT ACCATCATGG GTTGTCTTGG CTATACTTCA 
CCGGATGGTG GAATTAACGA AAACAACAAC TGGTGTCACA TCCCGCAGGC AAAAGAGGCA 
GCGGCTAACT AA

Protein sequence

MRYIKSITQQ KLSFLLAIYI GLFMNGAVFY RRFGSYAHDF TVWKGISAVV ELAATVLVTF 
FLLRLLSLFG RRSWRILASL VVLFSAGASY YMTFLNVVIG YGIIASVMTT DIDLSKEVVG 
LNFILWLIAV SALPLILIWN NRCRYTLLRQ LRTPGQRIRS LAVVVLAGIM VWAPIRLLDI 
QQKKVERATG VDLPSYGGVV ANSYLPSNWL SALGLYAWAR VDESSDNNSL LNPAKKFTYQ 
APQNVDDTYV VFIIGETTRW DHMGIFGYER NTTPKLAQEK NLAAFRGYSC DTATKLSLRC 
MFVRQGGAED NPQRTLKEQN IFAVLKQLGF SSDLYAMQSE MWFYSNTMAD NIAYREQIGA 
EPRNRGKPVD DMLLVDEMQQ SLGRNPDGKH LIILHTKGSH FNYTQRYPRS FAQWKPECIG 
VDSGCTKAQM INSYDNSVTY VDHFISSVID QVRDKKAIVF YAADHGESIN EREHLHGTPR 
ELAPPEQFRV PMMVWMSDKY LENPANAQAF AQLKKEADMK VPRRHVELYD TIMGCLGYTS 
PDGGINENNN WCHIPQAKEA AAN