Gene RSc3103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSc3103
Symbol
ID	1221967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ralstonia solanacearum GMI1000
Kingdom	Bacteria
Replicon accession	NC_003295
Strand	+
Start bp	3341193
End bp	3342296
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	64%
IMG OID	637239521
Product	4-hydroxyphenylpyruvate dioxygenase oxidoreductase protein
Protein accession	NP_521224
Protein GI	17547822
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATTCA CGCCTTGGGA AAACCCGATG GGCACCGCCG GCTTCGAGTT CATCGAATAC 
GCCGCGCCGG ACCCCGTCGC CATGGGCAAG CTGTTCGAGA AGATGGGCTT CAGCGCCATC 
GCGAAGCACC GCCACAAGAA CGTGACGCTG TACCGCCAGG GCGGCATCAA CTTCATCATC 
AACGCTGAAG CCGATTCGTT CGCGCAGCGC TTCGCGCGCC TGCACGGGCC GTCCATCTGC 
GCCATCGCCT TCCGCGTGCA GGACGCGGCC CTCGCCTACC AGCGCGCGCT GGAACTGGGC 
GCGTGGGGCT TCGACACCCA CAGCGGCCCG ATGGAGCTGA ACATCCCGGC GATCAAGGGC 
ATCGGCGATT CGCTGATCTA CCTGGTGGAC CGCTGGACCG GCAAGAACGG CGCCAAAGAC 
GTCGACATCG GCAACATCAG TATCTACGAC GTCGACTTCG TGCCCATTCC CGGCGCCAAC 
CCGAACCCCA TCGGGCACGG CCTGACCTAC ATCGACCACC TGACGCACAA CGTCTACCGT 
GGTCGCATGA AGGAGTGGGC CGAGTTCTAC GAACGCTTCT TCAACTTCCG CGAGATCCGC 
TATTTCGATA TCGAGGGCCA GGTCACCGGC GTGAAGAGCA AGGCCATGAC GAGCCCGTGC 
GGCAACATCC GCATTCCCAT CAACGAGGAA GGGACGGAGA AGGCCGGCCA GATCCAGGAA 
TACCTGGACA TGTACCACGG CGAGGGCATC CAGCACATCG CGCTGGGCTC GACCGACCTG 
CACCGGACGG TGGACGCGCT GCGCGGCAAC GGCATCAAGC TGCTGGACAC CATCGACACG 
TACTACGAGC TGGTCGACAA GCGGATCCCC GGCCATGGCG AGAACGTGGC GGAGCTGAAG 
AAGCGCAAGA TCCTGATCGA CGGCGCGCCG GGCGACCTGC TGCTGCAGAT CTTCTCGGAA 
AACCAGCTGG GCCCGATCTT CTTCGAGTTC ATCCAGCGCA AGGGCAACCA GGGCTTCGGC 
GAGGGCAACT TCAAGGCGCT GTTCGAGTCG ATCGAGCTCG ACCAGATGCG CCGCGGCGTG 
CTGAAGGCGG ATCAGCCGGC CTGA

Protein sequence

MSFTPWENPM GTAGFEFIEY AAPDPVAMGK LFEKMGFSAI AKHRHKNVTL YRQGGINFII 
NAEADSFAQR FARLHGPSIC AIAFRVQDAA LAYQRALELG AWGFDTHSGP MELNIPAIKG 
IGDSLIYLVD RWTGKNGAKD VDIGNISIYD VDFVPIPGAN PNPIGHGLTY IDHLTHNVYR 
GRMKEWAEFY ERFFNFREIR YFDIEGQVTG VKSKAMTSPC GNIRIPINEE GTEKAGQIQE 
YLDMYHGEGI QHIALGSTDL HRTVDALRGN GIKLLDTIDT YYELVDKRIP GHGENVAELK 
KRKILIDGAP GDLLLQIFSE NQLGPIFFEF IQRKGNQGFG EGNFKALFES IELDQMRRGV 
LKADQPA