Gene B21_04092 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_04092
Symbol	yjgQ
ID	8115804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	4397001
End bp	4398083
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	54%
IMG OID	644850240
Product	hypothetical protein
Protein accession	YP_003001813
Protein GI	251787509
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00829119
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACCTT TTGGCGTACT TGACCGCTAT ATCGGTAAAA CTATTTTCAC CACCATCATG 
ATGACACTGT TCATGCTGGT GTCGCTGTCG GGCATTATCA AGTTTGTCGA TCAGCTGAAA 
AAAGCCGGGC AGGGGAGTTA CGACGCGTTA GGCGCAGGAA TGTATACCTT GCTGAGCGTG 
CCGAAAGATG TGCAGATCTT CTTCCCGATG GCGGCTCTGC TTGGGGCGTT GCTTGGTCTT 
GGGATGCTGG CGCAGCGCAG CGAACTGGTG GTGATGCAGG CTTCTGGTTT TACCCGTATG 
CAGGTGGCGC TGTCGGTGAT GAAAACCGCC ATTCCGCTGG TCTTGCTGAC GATGGCGATT 
GGCGAATGGG TCGCGCCGCA GGGCGAGCAG ATGGCGCGTA ACTACCGTGC GCAGGCGATG 
TACGGCGGCT CGTTGCTCTC TACCCAGCAA GGCTTATGGG CGAAAGATGG CAACAACTTC 
GTCTACATTG AGCGGGTTAA AGGTGACGAA GAGTTAGGTG GCATCAGCAT TTATGCCTTT 
AACGAGAATC GTCGTCTGCA ATCCGTACGC TATGCCGCTA CTGCGAAGTT TGACCCGGAA 
CATAAAGTCT GGCGTCTGTC GCAGGTTGAT GAATCTGATC TGACCAATCC GAAACAGATT 
ACCGGTTCGC AGACGGTGAG CGGCACCTGG AAAACCAACC TCACGCCGGA CAAACTGGGC 
GTGGTGGCGC TGGACCCGGA TGCACTCTCT ATCAGCGGTT TGCACAACTA TGTGAAGTAT 
CTGAAGTCGA GCGGTCAGGA TGCCGGACGT TATCAGCTCA ACATGTGGAG CAAAATCTTC 
CAGCCGCTAT CTGTGGCGGT GATGATGCTG ATGGCGCTGT CGTTCATCTT TGGCCCACTG 
CGTAGCGTAC CGATGGGCGT GCGTGTGGTC ACCGGTATCA GTTTCGGTTT TGTCTTCTAC 
GTACTGGACC AGATCTTCGG CCCGCTGACG TTGGTTTATG GCATCCCGCC GATCATCGGC 
GCACTGTTGC CAAGCGCCAG CTTCTTCTTA ATCAGCCTGT GGCTGTTAAT GAGAAAATCG 
TAA

Protein sequence

MQPFGVLDRY IGKTIFTTIM MTLFMLVSLS GIIKFVDQLK KAGQGSYDAL GAGMYTLLSV 
PKDVQIFFPM AALLGALLGL GMLAQRSELV VMQASGFTRM QVALSVMKTA IPLVLLTMAI 
GEWVAPQGEQ MARNYRAQAM YGGSLLSTQQ GLWAKDGNNF VYIERVKGDE ELGGISIYAF 
NENRRLQSVR YAATAKFDPE HKVWRLSQVD ESDLTNPKQI TGSQTVSGTW KTNLTPDKLG 
VVALDPDALS ISGLHNYVKY LKSSGQDAGR YQLNMWSKIF QPLSVAVMML MALSFIFGPL 
RSVPMGVRVV TGISFGFVFY VLDQIFGPLT LVYGIPPIIG ALLPSASFFL ISLWLLMRKS