Gene RPB_0335 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0335
Symbol
ID	3908716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	380508
End bp	381620
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	66%
IMG OID	637882221
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_483957
Protein GI	86747461
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACGC ATAAACTGCT GCTTCTTCCC GGCGACGGTA TCGGCACCGA AGTGATGGCC 
GAGGTGTCGC GGCTGATCGA CTGGCTGAAC AAAGCCGGCA TTGCCAGCTT CGAAACCGAG 
CACGGCCTGG TCGGCGGCGC CGCCTATGAT GCCGACAAGG TCGCGATCAC CGACGCCACC 
ATGGCGCTGG CGCAGGCCTC CGACGCGGTG ATCTTCGGCG CGGTCGGCGG GCCGAAATGG 
GACGCGGTGC CGTATGACGC CCGCCCCGAG GCCGGCCTGC TGCGGCTGCG CAAGGATCTG 
GCGCTGTTCG CCAATCTGCG TCCGGCGGTG TGCTATCCGG CGCTCGCCGA GGCTTCCAGC 
CTGAAGCCCG AAGTGGTCGA GGGCCTCGAC ATCATGATCG TCCGCGAACT CACCGGCGGC 
GTCTATTTCG GCGAGCCGAA GACCATCACC GATCTCGGCA ACGGCCAGAA GCGCGCGATC 
GACACGCAAG TTTACGACAC CTACGAGATC GAGCGGATCG GCCGCGTCGC CTTCGACCTC 
GCCCGCAAGC GCCGCAACAA GGTCACCTCG ATGGAGAAGC GCAACGTCAT GAAGACGGGC 
GTGCTCTGGA ACGAGGTGAT CACCCAGGTG CACGCGCGCG AATACAAGGA CGTCCAGCTC 
GAGCACCAGC TCGCCGATTC GGGCGGCATG AATCTCGTCA AATGGCCGAA GCAGTTCGAC 
GTCATCGTCA CCGACAATCT GTTCGGCGAC ATGCTGAGCG ACATCGCCGC GATGCTGACC 
GGCTCGCTCG GCATGCTGCC CTCGGCCTCG CTCGGCGCGG TCGACGACAC CACCGGCAAG 
CGCAAGGCGA TGTACGAGCC GGTGCACGGC TCGGCGCCCG ACATCGCCGG CAAGGGCCTG 
GCCAATCCGG TGGCGATGCT GGCCTCGTTC GGCATGGCGC TGCGCTATTC GCTCGACATG 
GGCGAGCTCG CCGACAAGCT CGACGAAGCC ATCGCCGTGG TGCTGGCCCG CGGCCTGCGC 
ACCGCCGACA TCAAGAGCGA AGGCTCCACC GTGGTGTCGA CCAGCCAGAT GGGCGAAGCC 
ATCGTCCAGG AGATGCAGGC GCTGCACGGC TGA

Protein sequence

MATHKLLLLP GDGIGTEVMA EVSRLIDWLN KAGIASFETE HGLVGGAAYD ADKVAITDAT 
MALAQASDAV IFGAVGGPKW DAVPYDARPE AGLLRLRKDL ALFANLRPAV CYPALAEASS 
LKPEVVEGLD IMIVRELTGG VYFGEPKTIT DLGNGQKRAI DTQVYDTYEI ERIGRVAFDL 
ARKRRNKVTS MEKRNVMKTG VLWNEVITQV HAREYKDVQL EHQLADSGGM NLVKWPKQFD 
VIVTDNLFGD MLSDIAAMLT GSLGMLPSAS LGAVDDTTGK RKAMYEPVHG SAPDIAGKGL 
ANPVAMLASF GMALRYSLDM GELADKLDEA IAVVLARGLR TADIKSEGST VVSTSQMGEA 
IVQEMQALHG