Gene Smed_2836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2836
Symbol
ID	5323706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2960806
End bp	2961918
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	59%
IMG OID	640791781
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_001328501
Protein GI	150398034
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000134458
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCCAT TTCCACATGA CGCACCGCCG CCGGCGATCT CGGCGGACAA TCCCGCCGGA 
ACCGACGGGT TCGAGTTCGT CGAATTCGCC CATCCGGAAC CGGAGAAGCT TGCGGAACTC 
TTCGGCCGCA TGGGCTACGC ACCGGTTGCC AGGCACAGGA CGAAGGACAT CACGATATGG 
CGACAGGGCG ACATCAACTA TGTCCTGAAT GCTGAAGCCG GCTCGCATGC CATGCGCTTC 
GTCGGAGAAC ACGGGCCCTG CGCCCCGTCG ATGGCCTGGC GCGTCGTCGA CGCGAAGCAT 
GCCTTCGAGC ACGCCGTATC GAACGGCGCC GAGGCCTATA CCGGCAACGA CAAGAGCCTG 
GACGTACCGG CGATCGTCGG CATCGGCGGC TCGCTTCTCT ATTTCGTGGA AGTTTACGGC 
GAGAAAGGGT CCGCTTACGA TGCCGAGTTC GAATGGCTGC GCGAGCGTGA TCCGAAGCCG 
GCCGGCGTCG GCTTCTATTA TCTCGACCAC CTGACCCACA ATGTCTATCG CGGCAATATG 
GACAAGTGGT GGGCCTTCTA TCGCGAACTG TTCAATTTCA AACAGATCCA TTTCTTCGAC 
ATCGACGGCC GCATCACCGG CCTCGTCAGC CGGGCGATCA CCTCACCTTG CGGCAAGATT 
CGCATCCCAC TGAACGAATC GAAGGACGAC ACCAGCCAGA TCGAGGAATA TCTGACGAAG 
TACAAAGGCG AAGGCATACA GCACATCGCG GTCGGTACCG AGGCGATCTA CGATGCGACC 
GACAAACTCG CGGCAAACGG TCTGAAGTTC ATGCCGGGAC CGCCTGAAAC CTATTATGAG 
ATGTCCCACC AGCGCGTTCG CGGACACGAC GAACCGATCG ACCGGATGAA GAAACATGGC 
ATCCTGATCG ATGGAGAGGG TGTGGTGAAT GGCGGCATGA CGAAGATTCT GCTGCAGATC 
TTCTCGCGCA CCGTGATCGG ACCAATCTTC TTCGAATTCA TTCAGCGCAA GGGTGACGAA 
GGCTTCGGCG AGGGCAACTT CAGAGCATTG TTCGAATCGA TCGAGGCCGA CCAGATCCGC 
CGCGGCGTAC TTGGCCACGA GGCGGCCGAG TAG

Protein sequence

MGPFPHDAPP PAISADNPAG TDGFEFVEFA HPEPEKLAEL FGRMGYAPVA RHRTKDITIW 
RQGDINYVLN AEAGSHAMRF VGEHGPCAPS MAWRVVDAKH AFEHAVSNGA EAYTGNDKSL 
DVPAIVGIGG SLLYFVEVYG EKGSAYDAEF EWLRERDPKP AGVGFYYLDH LTHNVYRGNM 
DKWWAFYREL FNFKQIHFFD IDGRITGLVS RAITSPCGKI RIPLNESKDD TSQIEEYLTK 
YKGEGIQHIA VGTEAIYDAT DKLAANGLKF MPGPPETYYE MSHQRVRGHD EPIDRMKKHG 
ILIDGEGVVN GGMTKILLQI FSRTVIGPIF FEFIQRKGDE GFGEGNFRAL FESIEADQIR 
RGVLGHEAAE