Gene EcolC_4173 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4173
Symbol	ubiB
ID	6067256
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4609793
End bp	4611433
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	50%
IMG OID	641603601
Product	putative ubiquinone biosynthesis protein UbiB
Protein accession	YP_001727097
Protein GI	170022143
COG category	[R] General function prediction only
COG ID	[COG0661] Predicted unusual protein kinase
TIGRFAM ID	[TIGR01982] 2-polyprenylphenol 6-hydroxylase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00514072
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGCCAG GTGAAGTACG GCGCCTATAT TTCATCATTC GCACTTTTTT AAGCTACGGA 
CTTGATGAAC TGATCCCCAA AATGCGTATC ACCCTGCCGC TACGGCTATG GCGATACTCA 
TTATTCTGGA TGCCAAATCG GCATAAAGAC AAACTTTTAG GTGAGCGACT ACGACTGGCC 
CTGCAAGAAC TGGGGCCGGT TTGGATCAAG TTCGGGCAAA TGTTATCAAC CCGCCGCGAT 
CTTTTTCCAC CGCATATTGC CGATCAGCTG GCGTTATTGC AGGACAAAGT TGCTCCGTTT 
GATGGCAAGC TGGCGAAGCA GCAGATTGAA GCTGCAATGG GCGGCTTGCC GGTAGAAGCG 
TGGTTTGACG ATTTTGAAAT CAAGCCGCTG GCTTCTGCTT CTATCGCCCA GGTTCATACC 
GCGCGATTGA AATCGAATGG TAAAGAGGTG GTGATTAAAG TCATCCGCCC GGATATTTTG 
CCGGTCATTA AAGCGGATCT GAAACTTATC TACCGTCTGG CTCGCTGGGT GCCGCGTTTG 
CTGCCGGATG GTCGCCGTCT GCGCCCAACC GAAGTGGTGC GCGAGTACGA AAAGACCTTG 
ATTGATGAAC TGAATTTGCT GCGGGAATCT GCCAATGCCA TTCAGCTTCG GCGCAATTTT 
GAAGACAGCC CGATGCTCTA CATCCCGGAA GTTTACCCTG ACTATTGTAG TGAAGGGATG 
ATGGTGATGG AGCGCATTTA CGGCATTCCG GTGTCTGATG TTGCGGCGCT GGAGAAAAAC 
GGCACTAACA TGAAATTGCT GGCGGAACGC GGCGTGCAGG TGTTCTTCAC TCAGGTTTTC 
CGTGACAGCT TTTTCCATGC CGATATGCAC CCTGGCAACA TCTTCGTAAG CTATGAACAC 
CCGGAAAACC CGAAATATAT CGGCATTGAT TGCGGGATTG TTGGCTCGCT AAACAAAGAA 
GATAAACGCT ATCTGGCAGA AAACTTTATC GCCTTCTTTA ATCGCGACTA TCGCAAAGTG 
GCAGAGCTAC ACGTCGATTC AGGCTGGGTG CCACCAGATA CCAACGTTGA AGAGTTCGAA 
TTTGCCATTC GTACGGTCTG TGAACCTATC TTTGAGAAAC CGCTGGCCGA AATTTCGTTT 
GGACATGTAC TGTTAAATCT GTTTAATACG GCGCGTCGCT TCAATATGGA AGTGCAGCCG 
CAACTGGTGT TACTCCAGAA AACCCTGCTC TATGTCGAAG GGGTAGGACG CCAGCTTTAT 
CCGCAGCTCG ATTTATGGAA AACAGCGAAG CCTTTCCTGG AGTCGTGGAT TAAAGATCAG 
GTCGGTATTC CTGCGCTGGT GAGAGCATTT AAAGAAAAAG CGCCGTTCTG GGTCGAAAAA 
ATGCCAGAAC TGCCTGAATT GGTTTACGAC AGTTTGCGCC AGGGCAAGTA TTTACAGCAC 
AGTGTTGATA AGATTGCCCG CGAGCTTCAG TCAAATCATG TACGTCAGGG ACAATCGCGT 
TATTTTCTCG GAATTGGCGC TACGTTAGTA TTAAGTGGCA CATTCTTGTT GGTCAGCCGA 
CCTGAATGGG GGCTGATGCC CGGCTGGTTA ATGGCAGGTG GTCTGATCGC CTGGTTTGTC 
GGTTGGCGCA AAACACGCTG A

Protein sequence

MTPGEVRRLY FIIRTFLSYG LDELIPKMRI TLPLRLWRYS LFWMPNRHKD KLLGERLRLA 
LQELGPVWIK FGQMLSTRRD LFPPHIADQL ALLQDKVAPF DGKLAKQQIE AAMGGLPVEA 
WFDDFEIKPL ASASIAQVHT ARLKSNGKEV VIKVIRPDIL PVIKADLKLI YRLARWVPRL 
LPDGRRLRPT EVVREYEKTL IDELNLLRES ANAIQLRRNF EDSPMLYIPE VYPDYCSEGM 
MVMERIYGIP VSDVAALEKN GTNMKLLAER GVQVFFTQVF RDSFFHADMH PGNIFVSYEH 
PENPKYIGID CGIVGSLNKE DKRYLAENFI AFFNRDYRKV AELHVDSGWV PPDTNVEEFE 
FAIRTVCEPI FEKPLAEISF GHVLLNLFNT ARRFNMEVQP QLVLLQKTLL YVEGVGRQLY 
PQLDLWKTAK PFLESWIKDQ VGIPALVRAF KEKAPFWVEK MPELPELVYD SLRQGKYLQH 
SVDKIARELQ SNHVRQGQSR YFLGIGATLV LSGTFLLVSR PEWGLMPGWL MAGGLIAWFV 
GWRKTR