Gene EcSMS35_4218 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4218
Symbol	ubiB
ID	6143929
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4315462
End bp	4317102
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	50%
IMG OID	641619041
Product	putative ubiquinone biosynthesis protein UbiB
Protein accession	YP_001746169
Protein GI	170681731
COG category	[R] General function prediction only
COG ID	[COG0661] Predicted unusual protein kinase
TIGRFAM ID	[TIGR01982] 2-polyprenylphenol 6-hydroxylase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.00118244
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACGCCAG GTGAAGTACG GCGCCTATAT TTCATCATTC GCACTTTTTT AAGCTACGGA 
CTTGATGAAC TGATCCCCAA AATGCGTATC ACCCTGCCGC TACGGCTATG GCGATACTCA 
TTATTCTGGA TGCCAAATCG GCATAAAGAC AAACCTTTAG GTGAGCGACT ACGACTGGCC 
CTGCAAGAAC TGGGACCGGT ATGGATCAAG TTCGGGCAGA TGTTATCAAC CCGCCGCGAT 
CTTTTTCCGC CGCATATTGC CGATCAGCTG GCGTTATTGC AGGACAAAGT CGCTCCGTTT 
GATGGCAAGC TGGCGAAGCA GCAGATTGAA GCTGCAATGG GCGGCTTGCC GGTAGAAGCG 
TGGTTTGACG ATTTTGAAAT CAAGCCGCTG GCTTCTGCTT CTATCGCCCA GGTTCATACC 
GCGCGATTGA AATCGAATGG TAAAGAGGTG GTGATTAAAG TCATCCGCCC GGATATTTTG 
CCGGTTATTA AAGCGGATCT GAAACTTATC TACCGGCTGG CTCGCTGGGT GCCGCGTTTG 
CTGCCGGATG GTCGCCGTCT GCGCCCAACC GAAGTGGTGC GCGAGTACGA AAAGACCTTG 
ATTGATGAAC TGAATTTGCT GCGGGAATCT GCCAACGCCA TTCAGCTTCG ACGCAATTTT 
GAAGACAGCC CGATGCTCTA CATCCCGGAA GTTTACCCTG ACTATTGTAG TGAAGGGATG 
ATGGTAATGG AGCGTATTTA CGGCATTCCG GTGTCTGATG TTGCGACGCT GGAGAAAAAC 
GGCACAAACA TGAAATTGCT GGCGGAACGC GGCGTGCAGG TGTTCTTCAC TCAGGTCTTT 
CGCGACAGCT TTTTCCATGC CGATATGCAC CCTGGCAACA TCTTCGTAAG CTATGAACAC 
CCGGAAAACC CGAAATATAT CGGCATTGAT TGCGGGATTG TTGGCTCGCT AAACAAAGAA 
GATAAACGCT ATCTGGCAGA AAACTTTATC GCCTTCTTTA ATCGCGACTA TCGCAAAGTG 
GCAGAGCTAC ACGTCGATTC TGGCTGGGTG CCACCAGATA CCAACGTTGA AGAGTTCGAA 
TTTGCCATTC GTACGGTCTG TGAACCTATC TTTGAGAAAC CGCTGGCCGA AATTTCGTTT 
GGACATGTAC TGTTAAATCT GTTTAATACG GCGCGTCGCT TCAATATGGA AGTGCAGCCG 
CAACTGGTGT TACTCCAGAA AACCCTGCTC TACGTCGAAG GGGTAGGACG CCAGCTTTAT 
CCGCAACTCG ATTTATGGAA AACGGCGAAG CCTTTCCTGG AGTCGTGGAT TAAAGATCAG 
GTCGGTATTC CTGCGCTGGT GAGAGCATTT AAAGAAAAAG CGCCGTTCTG GGTCGAAAAA 
ATGCCAGAAC TGCCTGAACT GGTTTACGAC AGTTTGCGCC AGGGCAAGTA TTTACAGCAC 
AGTGTTGATA AGATTGCCCG CGAGCTTCAG TCAAATCATG TACGTCAGGG ACAATCGCGT 
TATTTTCTCG GAATTGGCGC TACGTTAGTA TTAAGTGGCA CATTCTTGTT GGTCAGCCGA 
CCTGAATGGG GGCTGATGCC CGTCTGGTTA ATGGCAGGTG GTCTGATCGC CTGGTTTGTC 
GGTTGGCGCA AAACACGCTG A

Protein sequence

MTPGEVRRLY FIIRTFLSYG LDELIPKMRI TLPLRLWRYS LFWMPNRHKD KPLGERLRLA 
LQELGPVWIK FGQMLSTRRD LFPPHIADQL ALLQDKVAPF DGKLAKQQIE AAMGGLPVEA 
WFDDFEIKPL ASASIAQVHT ARLKSNGKEV VIKVIRPDIL PVIKADLKLI YRLARWVPRL 
LPDGRRLRPT EVVREYEKTL IDELNLLRES ANAIQLRRNF EDSPMLYIPE VYPDYCSEGM 
MVMERIYGIP VSDVATLEKN GTNMKLLAER GVQVFFTQVF RDSFFHADMH PGNIFVSYEH 
PENPKYIGID CGIVGSLNKE DKRYLAENFI AFFNRDYRKV AELHVDSGWV PPDTNVEEFE 
FAIRTVCEPI FEKPLAEISF GHVLLNLFNT ARRFNMEVQP QLVLLQKTLL YVEGVGRQLY 
PQLDLWKTAK PFLESWIKDQ VGIPALVRAF KEKAPFWVEK MPELPELVYD SLRQGKYLQH 
SVDKIARELQ SNHVRQGQSR YFLGIGATLV LSGTFLLVSR PEWGLMPVWL MAGGLIAWFV 
GWRKTR