Gene Rsph17029_2523 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2523
Symbol
ID	4896667
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2660984
End bp	2662411
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	68%
IMG OID	640113122
Product	isopropylmalate isomerase large subunit
Protein accession	YP_001044397
Protein GI	126463283
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.520601
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCTC CGAGAACGCT CTATGACAAG ATCTGGGACG ACCATGTCGT CCACCAGTCC 
GAAGACGGCA CCTGCCTGCT CTATATCGAC CGCCATCTCG TCCACGAGGT GACGAGCCCG 
CAGGCCTTCG AAGGCCTGCG CATGACGGGC CGCAAGGTGC GCGCCCCCGA GAAGACCATC 
GCCGTGCCGG ACCACAACGT CCCCACGACG GAAGGCCGCG ACACGAAGAT CGACAACGAG 
GAGTCGCGCA TCCAGGTCGA GGCGCTCGAC AGGAATGCCC GCGACTTCGG GATCAACTAC 
TATCCCGTGT CGGACATCCG GCAGGGGATC GTCCATATCG TCGGGCCCGA GCAGGGCTGG 
ACGCTGCCGG GCATGACGGT GGTCTGCGGC GACAGCCACA CGGCCACCCA CGGCGCCTTC 
GGCGCGCTGG CCCACGGCAT CGGCACCTCC GAGGTCGAGC ATGTGCTGGC CACGCAGACG 
CTGATCCAGA AGAAATCGAA GAACATGAAG GTGGAGATCA CCGGGAGCCT GCGCCCCGGT 
GTCACCGCCA AGGACATCAC GCTGTCGGTC ATCGGTCTCA CCGGGACGGC GGGCGGCACC 
GGCTATGTCA TCGAATATTG CGGGCAGGCG ATCCGCGAAC TGTCGATGGA AGGCCGGATG 
ACCGTCTGCA ACATGGCGAT CGAGGGCGGC GCGCGCGCGG GCCTGATCGC GCCGGACGAG 
AAGACCTTCG CCTATGTGAT GGGTCGTCCG CATGCGCCGA AGGGCGCAGC CTGGGAGGCG 
GCGCTCGCCT ACTGGAAGAC GCTCTTCACC GACAAGGGCG CGCAGTTCGA CAAGGTCGTG 
ACGATCCGCG GCGAGGACAT CGCCCCGGTC GTGACCTGGG GCACCTCGCC CGAGGATGTG 
CTGCCGATCA CCGCGACCGT CCCCGCCCCG GAGGACTTCA CCGGCGGCAA GGTCGAGGCC 
GCCCGCCGCA GCCTCGAATA CATGGGCCTG ACCCCGGGCC AGAAGCTGAC CGACATCAAG 
ATCGACACGG TCTTCATCGG CTCCTGCACC AACGGCCGGA TCGAGGATCT GCGGGCCGCG 
GCCGAGATCC TGAAGGGCAA GAAGGTGGCG CCGGGAATGC GGGCCATGGT CGTGCCGGGC 
TCGGGCCTCG TGCGCGCGCA GGCCGAGGAA GAGGGGCTGG CGCAGATCTT CATCGACGCG 
GGCTTCGAAT GGCGCCTCGC GGGCTGCTCG ATGTGCCTCG CGATGAACCC CGACCAGCTC 
TCGCCGGGGG AACGCTGCGC CTCGACCTCG AACCGGAACT TCGAGGGCCG TCAGGGCCGC 
AACGGCCGCA CCCATCTCGT CAGCCCCGGA ATGGCCGCCG CTGCGGCGAT CACCGGTCAC 
CTGACCGACG TGCGCGACCT GATGATGGCG CCGGCCGAGC CGGCGTGA

Protein sequence

MTAPRTLYDK IWDDHVVHQS EDGTCLLYID RHLVHEVTSP QAFEGLRMTG RKVRAPEKTI 
AVPDHNVPTT EGRDTKIDNE ESRIQVEALD RNARDFGINY YPVSDIRQGI VHIVGPEQGW 
TLPGMTVVCG DSHTATHGAF GALAHGIGTS EVEHVLATQT LIQKKSKNMK VEITGSLRPG 
VTAKDITLSV IGLTGTAGGT GYVIEYCGQA IRELSMEGRM TVCNMAIEGG ARAGLIAPDE 
KTFAYVMGRP HAPKGAAWEA ALAYWKTLFT DKGAQFDKVV TIRGEDIAPV VTWGTSPEDV 
LPITATVPAP EDFTGGKVEA ARRSLEYMGL TPGQKLTDIK IDTVFIGSCT NGRIEDLRAA 
AEILKGKKVA PGMRAMVVPG SGLVRAQAEE EGLAQIFIDA GFEWRLAGCS MCLAMNPDQL 
SPGERCASTS NRNFEGRQGR NGRTHLVSPG MAAAAAITGH LTDVRDLMMA PAEPA