Gene EcolC_0803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0803
Symbol
ID	6065780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	860427
End bp	861629
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	55%
IMG OID	641600208
Product	hypothetical protein
Protein accession	YP_001723802
Protein GI	170018848
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID	[TIGR01988] Ubiquinone biosynthesis hydroxylase, UbiH/UbiF/VisC/COQ6 family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0501612
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAGTG TTGATGTAGC CATTGTTGGC GGCGGCATGG TGGGGCTGGC GGTTGCCTGT 
GGCTTACAGG GGAGCGGCTT ACGCGTTGCC GTACTGGAGC AGCGCGTACA GGAACCTCTG 
GCGGCGAATG CACCACCACA ACTGCGCGTT TCGGCTATCA ATGCCGCCAG CGAAAAATTA 
CTCACCCGTC TTGGCGTCTG GCAGGACATT CTCTCTCGTA GGGCCAGCTG TTATCACGGT 
ATGGAAGTGT GGGACAAAGA CAGCTTTGGT CACATTTCGT TTGACGATCA AAGCATGGGC 
TATAGCCATC TTGGGCATAT CGTTGAAAAT TCAGTGATTC ACTACGCGCT GTGGAACAAA 
GCGCATCAGT CGTCAGATAT CACTCTGTTA GCCCCCGCAG AATTACAGCA GGTCGCCTGG 
GGAGAAAATG AAACCTTCCT GACGCTGAAA GATGGCAGCA TGTTAACGGC GCGTCTGGTG 
ATTGGCGCGG ACGGCGCTAA TTCCTGGTTG CGCAACAAAG CCGATATTCC GCTGACTTTC 
TGGGATTATC AGCATCACGC GCTGGTAGCG ACCATTCGCA CGGAAGAACC GCATGATGCG 
GTGGCGCGGC AGGTTTTCCA TGGCGAAGGC ATTCTGGCCT TTTTACCGCT TAGCGATCCG 
CATCTTTGCT CGATTGTCTG GTCACTGTCG CCAGAGGAAG CGCAGCGGAT GCAGCAGGCA 
AGTGAAGACG AATTTAATCG CGCGTTAAAT ATCGCTTTTG ATAATCGCCT GGGCTTATGC 
AAGGTTGAGA GCGCGCGTCA GGTGTTCCCA CTGACGGGGC GTTATGCGCG CCAGTTTGCC 
TCGCACCGTC TGGCGCTGGT GGGCGACGCC GCACATACCA TTCACCCGCT GGCGGGGCAG 
GGGGTAAATC TCGGCTTTAT GGATGCTGCA GAGCTGATTG CCGAACTGAA ACGGTTGCAT 
CGTCAGGGGA AAGACATCGG GCAGTACATT TATCTGCGTC GCTATGAGCG TAGCCGCAAG 
CACAGTGCGG CGTTGATGCT GGCTGGTATG CAGGGATTCC GCGATCTGTT TTCCGGTACC 
AATCCGGCGA AAAAACTGCT GCGTGATATT GGTTTGAAAC TGGCCGACAC GCTTCCTGGC 
GTTAAGCCGC AACTTATCCG CCAGGCAATG GGATTAAACG ATTTGCCTGA ATGGCTGCGT 
TAA

Protein sequence

MQSVDVAIVG GGMVGLAVAC GLQGSGLRVA VLEQRVQEPL AANAPPQLRV SAINAASEKL 
LTRLGVWQDI LSRRASCYHG MEVWDKDSFG HISFDDQSMG YSHLGHIVEN SVIHYALWNK 
AHQSSDITLL APAELQQVAW GENETFLTLK DGSMLTARLV IGADGANSWL RNKADIPLTF 
WDYQHHALVA TIRTEEPHDA VARQVFHGEG ILAFLPLSDP HLCSIVWSLS PEEAQRMQQA 
SEDEFNRALN IAFDNRLGLC KVESARQVFP LTGRYARQFA SHRLALVGDA AHTIHPLAGQ 
GVNLGFMDAA ELIAELKRLH RQGKDIGQYI YLRRYERSRK HSAALMLAGM QGFRDLFSGT 
NPAKKLLRDI GLKLADTLPG VKPQLIRQAM GLNDLPEWLR