Gene RPD_2069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2069
Symbol
ID	4022551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2315425
End bp	2317023
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	63%
IMG OID	637962262
Product	putative alpha-isopropylmalate/homocitrate synthase family transferase
Protein accession	YP_569205
Protein GI	91976546
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR00977] 2-isopropylmalate synthase/homocitrate synthase family protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.285589
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.580851
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGGG AACGTTTGTA TCTCTACGAC ACCACGTTGC GCGACGGCGC GCAGACCAAC 
GGCGTCGATT TCACGCTGCA CGACAAGCGG CTGATCGCGG GGCTGCTCGA CGACCTCGGC 
ATCGATTATG TCGAAGGCGG CTATCCCGGC GCCAATCCGC TCGACACCGA GTTCTTCGCC 
ACCGAGCAGA AGCTCGAGCG CGCGACCTTC GCGGCGTTCG GCATGACGCG GCGGCCGGGC 
CGCTCGGCCT CGAACGATCC CGGCGTCGCG CTGCTGCTCG ACGCCAAGGC GGATGCGATC 
TGCTATGTCG CGAAATCGTC GGAGTATCAG GTCCGCGTCG CGCTCGAAAC CACCAACGAA 
GAGAACATCG CCTCGATCCG TGACAGCGTC GCGATCGCCA AGGACAGAAG CCGCGAAGTT 
CTGGTCGATT GCGAGCACTT CTTCGATGGC TACAAGGAGA ACCCGGCGTT CGCGCTGGAC 
TGCGCCAAGG CGGCCTATGA GTCCGGCGCT CGCTGGGTGG TGTTGTGCGA TACCAATGGC 
GGCACCATGC CCGACGAGGT CGAGGCGATC GTCGGCGAGG TGGTGAAACA CATCCCCGGC 
AGCCATGTCG GCATCCACGC CCACAACGAC ACCGAACAGG CCGTGGCCGT GTCGTTCGCC 
GCGGTGCGCG CCGGCGCACG ACAGATCCAG GGCACGCTGA ACGGGCTCGG CGAGCGTTGT 
GGTAACGCCA ATCTGGTGTC GATGATCCCG ACGTTGAAGC TGAAGAAGGA ATTCGCCGAC 
CGATTCGAGA TCGGCGTCTC CGACGACAAG CTGGCGACGC TGGTGCAGGT GTCGCGCGCG 
CTCGACAATA TTCTCGACCG CGCACCCAAT CCGCACGCGC CCTATGTCGG CGGCAGCGCC 
TTTGTCACGA AAACGGGGAT CCATGCCTCG GCGGTGATGA AGGACCCGCA CACCTACGAG 
CACGTCACGC CGGAATCGGT CGGAAATCAT CGCAAGGTGC TGGTATCGGA TCAGGCCGGC 
CGCTCCAACG TGGTGGCGGA ATTGTCGCGT ACTACGATCG AGTTCGACCG CAACGATCCG 
AAGCTCGGCC GCCTGATCGA GAAGATGAAG GAGCGCGAGG CGGCCGGATA CGCCTACGAA 
TCCGCCAACG CTTCGTTCGA TCTCCTGGCG CGCGGCACGC TCGGCAAGGT GCCGGAATTC 
TTCCGCGTCG AGCAGTTCGA CGTCAATGTC GAGCAGCGCT ACAACTCGCA CGGCGAACGC 
GTTACCGTGG CGATGGCGGT GGTCAAGGTC GAGGTCGACG GCGAGACGCT GATCTCGGCC 
GCGGAAGGCA ACGGCCCGGT CAATGCGCTC GACGTCGCCT TGCGCAAGGA TCTCGGCAAG 
TATCAGAAGT ACATCGAGAA CCTGAAGCTG ATCGACTATC GCGTCCGTAT CCTCAATGGC 
GGCACTGAAG CGGTGACGCG CGTGCTGATC GAGAGCGAGG ACGAACTCGG CGAGCGCTGG 
ACCACGATCG GCGTATCGCC GAATATCATC GACGCCTCGT TCCAGGCGCT GATGGATTCG 
GTGGTCTACA AGCTGGTGAA GTCGAACGCG CCGGCGTGA

Protein sequence

MSRERLYLYD TTLRDGAQTN GVDFTLHDKR LIAGLLDDLG IDYVEGGYPG ANPLDTEFFA 
TEQKLERATF AAFGMTRRPG RSASNDPGVA LLLDAKADAI CYVAKSSEYQ VRVALETTNE 
ENIASIRDSV AIAKDRSREV LVDCEHFFDG YKENPAFALD CAKAAYESGA RWVVLCDTNG 
GTMPDEVEAI VGEVVKHIPG SHVGIHAHND TEQAVAVSFA AVRAGARQIQ GTLNGLGERC 
GNANLVSMIP TLKLKKEFAD RFEIGVSDDK LATLVQVSRA LDNILDRAPN PHAPYVGGSA 
FVTKTGIHAS AVMKDPHTYE HVTPESVGNH RKVLVSDQAG RSNVVAELSR TTIEFDRNDP 
KLGRLIEKMK EREAAGYAYE SANASFDLLA RGTLGKVPEF FRVEQFDVNV EQRYNSHGER 
VTVAMAVVKV EVDGETLISA AEGNGPVNAL DVALRKDLGK YQKYIENLKL IDYRVRILNG 
GTEAVTRVLI ESEDELGERW TTIGVSPNII DASFQALMDS VVYKLVKSNA PA