Gene B21_03441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03441
Symbol	rfaQ
ID	8115641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3671935
End bp	3672957
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	47%
IMG OID	644849614
Product	hypothetical protein
Protein accession	YP_003001187
Protein GI	251786883
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02201] lipopolysaccharide heptosyltransferase III, putative

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.331205
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTTTTC ATGGGGATAT GTTATTAACG ACTCCCGTCA TTAGTTCGCT GAAAAAAAAT 
TACCCTGACG CAAAAATCGA TGTGCTGCTT TATCAGGACA CCATCCCGAT CCTGTCTGAA 
AATCCAGAGA TTAACGCGCT CTACGGCATA AAAAATAAAA AAGCAAAAGC CTCAGAAAAA 
ATTGCCAACT TTTTTCATCT CATCAAGGTA TTACGTGCCA ATAAGTATGA CCTTATCGTC 
AATCTTACCG ATCAATGGAT GGTTGCTATA CTGGTTCGCT TATTAAATGC CCGTGTGAAA 
ATTTCCCAGG ATTATCATCA TCGGCAGTCT GCTTTTTGGC GTAAAAGTTT CACCCATTTG 
GTGCCGTTGC AGGGTGGAAA TGTGGTGGAA AGTAACTTAT CCGTGCTGAC ACCATTGGGA 
CTTGATTCGT TGGTGAAGCA GACAACCATG AGTTACCCGC CTGCAAGCTG GAAACGTATG 
CGTCGCGAAC TTGATCACGC TGGTGTTGGA CAAAATTATG TGGTTATCCA ACCTACGGCG 
CGGCAAATCT TCAAATGCTG GGACAACGCC AAGTTTTCCG CTGTGATTGA TGCCTTACAT 
GCTCGTGGTT ATGAAGTTGT TCTGACGTCC GGCCCGGATA AAGACGATCT GGCCTGCGTC 
AATGAAATTG CGCAGGGATG CCAGACGCCA CCAGTAACGG CGCTGGCTGG AAAGGTGACC 
TTCCCGGAAC TTGGTGCGTT AATCGATCAT GCGCAGCTGT TTATTGGCGT TGATTCCGCA 
CCGGCGCATA TTGCCGCTGC AGTTAATACG CCGCTGATAT CGCTGTTTGG CGCAACAGAT 
CATATTTTCT GGCGTCCCTG GTCAAATAAC ATGATTCAAT TCTGGGCGGG AGATTACCGG 
GAAATGCCAA CGCGCGATCA GCGTGACCGA AATGAGATGT ATCTTTCGGC TATTCCGGCG 
GCAGATGTCA TTGCTGCTGT CGATAAATTA CTGCCCTCCT CCACGACAGG TACGTCGTTA 
TGA

Protein sequence

MRFHGDMLLT TPVISSLKKN YPDAKIDVLL YQDTIPILSE NPEINALYGI KNKKAKASEK 
IANFFHLIKV LRANKYDLIV NLTDQWMVAI LVRLLNARVK ISQDYHHRQS AFWRKSFTHL 
VPLQGGNVVE SNLSVLTPLG LDSLVKQTTM SYPPASWKRM RRELDHAGVG QNYVVIQPTA 
RQIFKCWDNA KFSAVIDALH ARGYEVVLTS GPDKDDLACV NEIAQGCQTP PVTALAGKVT 
FPELGALIDH AQLFIGVDSA PAHIAAAVNT PLISLFGATD HIFWRPWSNN MIQFWAGDYR 
EMPTRDQRDR NEMYLSAIPA ADVIAAVDKL LPSSTTGTSL