Gene RSP_4011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_4011
Symbol	ilvB2
ID	3712050
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007488
Strand	+
Start bp	35085
End bp	36866
Gene Length	1782 bp
Protein Length	593 aa
Translation table	11
GC content	68%
IMG OID	640069327
Product	sulfoacetaldehyde acetyltransferase
Protein accession	YP_345194
Protein GI	77404620
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID	[TIGR03457] sulfoacetaldehyde acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0930701
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATGA CCACCGAAGA GGCCTTCGTG AAGGTCCTGC AGATGCACGG CATCGAACAT 
GCGTTCGGGA TCATCGGCTC GGCCATGATG CCGGTGTCGG ATCTGTTCCC GAAGGCCGGG 
ATCACCTTCT GGGATTGCGC CCACGAGACG AACGCGGGCC TGATGGCCGA TGGCTTCACC 
CGCTCGACGG GCAAGATGTC GATGGCCATC GCCCAGAACG GCCCCGGCGT CACCGGCTTC 
GTGACGCCGG TCAAGACCGC CTACTGGAAC CATACGCCGC TTCTGCTGGT GACGCCGCAG 
GCGGCCAACA AGACCATCGG GCAGGGCGGC TTCCAGGAGA TGGAGCAGAT GCGGCTCTTT 
GCCGATTGCG TCTGCTATCA GGAGGAGGTG CGCGACGCCT CGCGCATCCC CGAGGTGCTG 
AACCGGGTGA TCCTGCAGGC CTGGCGCAAC AGCGCGCCGG CGCAGATCAA CATTCCCCGG 
GACATGTGGA CCCAGGTCAT CGATGTCGAG CTGCCGCAGA TCGTGGCCTT CGAGCGGCCC 
GCGGGCGGCG AGGAGGCGGT GGCCGAGGCG GCGCGGCTTC TGTCGGGGGC GCGCTTCCCG 
GTGATCCTCT CCGGGGCGGG CGTGGTGCTC TCGGGCGCGA TCCCGGATCT CGCGCGGCTG 
GCCGAGCGGC TCGACGCGCC GGTGGCCTCG AACTACCAGC ACAACGACAG CTTCCCCGGC 
AGCCATCCGC TCGCCGTGGG CCCTCTGGGC TACAACGGCT CGAAGGCCGC GATGGAGCTG 
ATCGCCCGCG CCGACGTGGT GCTGGCGCTC GGCACGCGGC TCAATCCCTT CTCGACGCTG 
CCGGGCTACG GCATCGACTA CTGGCCGCGC GAGGCCAGGA TCATTCAGGT CGACATCAAT 
GCCGACCGGA TCGGGCTGAC GAAGAAGGTC ACCGTGGGCA TTCAGGGCGA TGCGGCCAAG 
GTGGCGCGCG CGATCCTGGC CCAGCTGGGC GAGGGCGCGG GCGATGCGGG CCGCGAGGAG 
CGGCGGCATC TCGTGGCGCA GACCAAGTCG CGGTGGGCGC AGGAGCTGTC GAGCCTCGAC 
CATGAAGAGG ACGATCCGGG CACCGAATGG AACGCGGGCG CGCGCACGCG CGATGCCGAT 
CTGATGAGCC CGCGGCAGGC CTGGCGCGCG ATCATGCAGG CGGTGCCGGC CGAGGCCATC 
GTCTCGTCCG ACATCGGCAA CAACTGCGCC ATCGGCAACG CCTATCCGAG CTTCGAGGCC 
GGGCGGAAAT ATCTGGCGCC GGGTCTCTTC GGCCCTTGCG GTTACGGCTT CCCGGCGATC 
CTCGGCGCCA AGATCGGCAA TCCCGACACG CCGGTGATCG GCTTTGCGGG CGACGGCGCC 
TTCGGCATCT CGATGAACGA GATGACCGCC TGCGGCCGCG AGGACTGGCC CGCCATCACC 
ATGGTGATCT TCCGCAACTA CCAGTGGGGC GCGGAAAAGC GCAACACGAC GCTGTGGTAC 
GACAACAACT TCGTGGGCAC CGAGCTCGAC CGCGACACGA GCTATGCGGC CATCGCCCGG 
GCCTGCGGCG CGCATGGGGT GCAGGTGCGC AGCCAGTCCG AACTGACGGC GGCCTTGCAC 
GAGGCGGTCG AGCGGCAGAT GAAGGCGCGA GAGACCACCT TCATCGAGGT GCTGCTCAAT 
CAGGAGCTGG GCGAGCCCTT CCGCCGCGAC GCGATGAAGA AGCCGGTGGT GGTGGCGGGG 
ATCGACCCGG CCGACATGCG CCCGCAGAAG GGCGCGGCCT GA

Protein sequence

MRMTTEEAFV KVLQMHGIEH AFGIIGSAMM PVSDLFPKAG ITFWDCAHET NAGLMADGFT 
RSTGKMSMAI AQNGPGVTGF VTPVKTAYWN HTPLLLVTPQ AANKTIGQGG FQEMEQMRLF 
ADCVCYQEEV RDASRIPEVL NRVILQAWRN SAPAQINIPR DMWTQVIDVE LPQIVAFERP 
AGGEEAVAEA ARLLSGARFP VILSGAGVVL SGAIPDLARL AERLDAPVAS NYQHNDSFPG 
SHPLAVGPLG YNGSKAAMEL IARADVVLAL GTRLNPFSTL PGYGIDYWPR EARIIQVDIN 
ADRIGLTKKV TVGIQGDAAK VARAILAQLG EGAGDAGREE RRHLVAQTKS RWAQELSSLD 
HEEDDPGTEW NAGARTRDAD LMSPRQAWRA IMQAVPAEAI VSSDIGNNCA IGNAYPSFEA 
GRKYLAPGLF GPCGYGFPAI LGAKIGNPDT PVIGFAGDGA FGISMNEMTA CGREDWPAIT 
MVIFRNYQWG AEKRNTTLWY DNNFVGTELD RDTSYAAIAR ACGAHGVQVR SQSELTAALH 
EAVERQMKAR ETTFIEVLLN QELGEPFRRD AMKKPVVVAG IDPADMRPQK GAA