Gene RPC_2089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_2089
Symbol
ID	3971854
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	2286100
End bp	2287698
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	64%
IMG OID	637925197
Product	putative alpha-isopropylmalate/homocitrate synthase family transferase
Protein accession	YP_531962
Protein GI	90423592
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR00977] 2-isopropylmalate synthase/homocitrate synthase family protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.657625
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGCG AACGCCTCTA TCTGTTCGAT ACCACGCTGC GCGACGGCGC GCAGACCAAC 
GGCGTCGATT TCACCCTGCA CGACAAGCGG CTGATCGCCG CGATGCTCGA CGATCTCGGC 
ATCGATTACG TCGAGGGTGG CTATCCGGGC GCCAATCCGA GCGACACCGA GTTTTTCGCG 
ACCGATCCGG CCCTGAAATC CGCGACCTTC ACCGCCTTCG GCATGACGCG GCGGCCCGGC 
CGTTCGGCGT CCAACGATCC CGGCATCGCG GCGCTGCTCG AAGCCAAGGC CGACGCGATC 
TGCTTCGTGG CAAAGTCCTC GGCCTATCAG GTCCGCGTCG CGCTCGGCAC CACCAACGAG 
GAAAACCTCG CCTCGATCCG CGACAGCGTC GGCGCCGCCA AGGCCCGTGG CCGCGAGGTG 
CTGGTCGATT GCGAACACTT CTTCGATGGT TACAAAGAGG ATCCGCAATT CGCGCTGTCC 
TGCGCCAAGG CCGCCTATGA CGCCGGCGCG CGCTGGGTGG TGTTGTGCGA CACCAATGGC 
GGCACCATGC CGCACGAGAT CGAGGCGATC GTCGGCCAAG TGGTCAAACA GATCCCCGGC 
AGCCATGTCG GCATCCACGC CCATAACGAC ACCGAGCAGG CGGTGGCCTG TTCGCTGGCC 
GCGGTGCGCG CCGGCGCGCG GCAGATCCAG GGCACCTTGA ACGGGCTCGG CGAGCGCTGC 
GGCAACGCCA ATCTGTGCTC GATGATCCCG ACCTTGAAGC TGAAGCCGGA ATTCGCCGAG 
GCCTTCGACA TCGGGGTGTC GGAGGACAAA CTCGCCACGC TGGTGCAGGT GTCGCGCGCG 
CTCGACAATA TCCTCAATCG TCCGAGCAAT CCGCACGCGG CTTATGTCGG CGGCAGCGCC 
TTCGTCACCA AGACCGGGAT CCACGCCTCG GCGGTGATGA AGGATCCGCA CACTTATGAG 
CACGTTTCGC CCGAGACCGT CGGCAATCAC CGCAAGGTGC TGGTGTCCGA TCAGGCCGGC 
CGCTCCAACG TGCTGGCGGC GCTGTCGCGC ACCACCATTC CGTTCGACAA GGACGATCCG 
AAGCTGAACC GCTTGGTCGA GGAATTGAAG GAGCGCGAGG CCGCCGGCTA TGCCTATGAA 
TCCGCCAACG CCTCGTTCGA TCTGTTGGCG CGGCGCACGC TGGGCAAGGT GCCGGAGTTT 
TTCCGGGTCG AGCAGTTCGA CGTCAATGTC GAGCAGCGCT ACAATTCGCA CGGCAATCGC 
GTCACCATGG CGATGGCGGT GGTCAAGGTG AATGTCGACG GCGAGGTGCT GATCTCGGCC 
GCCGACGGCA ACGGCCCGGT CAACGCGCTC GATGTTGCGC TGCGCAAGGA CCTCGGCAAG 
TTCCAGAAGT ACATCGAGAA CCTCAAGCTG ATCGATTACC GCGTCCGTAT CCTCAATGGC 
GGAACCGAGG CGGTGACCCG GGTGCTGATC GAGAGCGAGG ACGAGCAGGG CGAACGCTGG 
ACCACCATCG GGGTGTCGCC GAATATCATC GACGCCTCGT TCCAGGCGCT GATGGATTCG 
GTGGTCTACA AGCTGGTGAA GTGCAACGCC CAGGCGTGA

Protein sequence

MSRERLYLFD TTLRDGAQTN GVDFTLHDKR LIAAMLDDLG IDYVEGGYPG ANPSDTEFFA 
TDPALKSATF TAFGMTRRPG RSASNDPGIA ALLEAKADAI CFVAKSSAYQ VRVALGTTNE 
ENLASIRDSV GAAKARGREV LVDCEHFFDG YKEDPQFALS CAKAAYDAGA RWVVLCDTNG 
GTMPHEIEAI VGQVVKQIPG SHVGIHAHND TEQAVACSLA AVRAGARQIQ GTLNGLGERC 
GNANLCSMIP TLKLKPEFAE AFDIGVSEDK LATLVQVSRA LDNILNRPSN PHAAYVGGSA 
FVTKTGIHAS AVMKDPHTYE HVSPETVGNH RKVLVSDQAG RSNVLAALSR TTIPFDKDDP 
KLNRLVEELK EREAAGYAYE SANASFDLLA RRTLGKVPEF FRVEQFDVNV EQRYNSHGNR 
VTMAMAVVKV NVDGEVLISA ADGNGPVNAL DVALRKDLGK FQKYIENLKL IDYRVRILNG 
GTEAVTRVLI ESEDEQGERW TTIGVSPNII DASFQALMDS VVYKLVKCNA QA