Gene Rsph17025_2072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_2072
Symbol
ID	5082777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	2114538
End bp	2116163
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	70%
IMG OID	640483635
Product	putative alpha-isopropylmalate/homocitrate synthase family transferase
Protein accession	YP_001168268
Protein GI	146278109
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR00977] 2-isopropylmalate synthase/homocitrate synthase family protein

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.770044
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.178392
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGTAAAGG AGCGGCTCTG GATCTACGAC ACGACGCTGC GCGACGGGCA GCAGACACAG 
GGCGTGCAGT TCTCGACCTC GGACAAGCGG CAGATCGCGC TGGCGCTCGA TGCGCTGGGG 
GTGGACTACA TCGAAGGCGG CTGGCCGGGG GCAAATCCGA CCGACAGCGA CTTCTTCGCC 
CATGCGCCGC AGCTCGGGGC GCGGCTCTCG GCCTTCGGGA TGACCAAGCG CGCGGGCCGC 
TCGGCCGAGA ATGACGATGT GCTCGCGGCG GTGCTGGATG CGGGGACAGG CACGGTCTGC 
CTCGTCGGCA AGGCGCATGA GTTCCATGTG ACCACGGCGC TCGGCGTGAC GCTGGAGGAG 
AACCTCGAGT CGATCCGCGC CTCGGTCGCC CATGTGGTGG GCAAGGGGCG CGAGGCGATC 
CTCGATGCCG AGCATTTCTT CGACGGCTAC AAGGCGAACC CGAGGTATGC GCTCGACTGC 
CTGAAGGCCG CGCTGGAGGC GGGGGCGCGC TGGGTCGTGC TCTGCGACAC CAACGGCGGC 
ACGCTTCCGG CCGAGGTGGG GCGGATCGTG GCCGAGGTGA TCGCGGCGGG CGTGCCGGGG 
GACCGGCTCG GCATCCACAC CCACGACGAC ACGGGCACGG CGGTGGCGGC GACGCTGGCG 
GCGGTCGATG CGGGCGCGCG GCAGGTGCAG GGCACGCTGA ACGGGCTGGG CGAGCGGTGC 
GGCAACGCCA ACCTCACCGC GCTGATCCCG ACGTTCCTGC TCAAGGAGCC CTACGCCAGC 
CGGTTCGAGA CCGGCATCTC GCGCGAGGCG CTGGCCGGGA TGGTGCGGAT CAGCCGGATG 
CTCGACGACA TCCTGAACCG GGTGCCGCGC CGCGCCTCGG CCTATGTCGG CGCCTCGGCC 
TTTGCGCACA AGGCGGGGCT GCATGCCTCG GCGATCCTCA AGGACCCCGC GACCTACGAA 
CATATCGACC CCGCGCTGGT GGGCAACGTG CGGGTGATCC CGATGTCGAA CCAGGCGGGC 
CAGTCGAACC TGCGCGCCCG CCTCGCCGCC GCCGGGATCG AGGTTCCGGC CGGCGATCCG 
CGCCTCGGCC GCATCCTCGA GGTGATCAAG GCGCGCGAGG ATCAGGGTTA TGCCTACGAT 
TCCGCCCAGG GCAGCTTCGA GCTGGTGGCG CGGCGGGAAC TGGGGCTCAT GCCCTCGTTC 
TTCGAGGTGA AGCGGTATCG CGTGACGGTC GAGCGGCGGC GGGTCGGCGA GGGCACCATG 
ACGCTCTCGG AGGCCGTGGT GGTCGTGATC ATCGACGGGC AGCGGGTGCT GTCGGTCTCG 
GAGAGCCTGG ACGAGAACGG GACCGAACGC GGCCCCGTCA ACGCGCTGTC GAAGGCGCTG 
GCCAAGGATC TGGGGCGCTG GCAATCGGTG ATCGACGACA TGCGGCTTGT CGATTTCAAG 
GTGCGGATCA CCCAGGGCGG CACCGAGGCC GTCACGCGCG TCATCATCGA CAGCGAGGAC 
GGACAGGGGC GGCGCTGGTC CACCGTCGGC GTCTCGCCCA ACATAGTGGA TGCCTCGTTC 
GAGGCGCTGC TGGACGCGAT CAACTGGAAG CTCGTGCGCG ACGCACGGCG CGGGGAGGGA 
TCATGA

Protein sequence

MVKERLWIYD TTLRDGQQTQ GVQFSTSDKR QIALALDALG VDYIEGGWPG ANPTDSDFFA 
HAPQLGARLS AFGMTKRAGR SAENDDVLAA VLDAGTGTVC LVGKAHEFHV TTALGVTLEE 
NLESIRASVA HVVGKGREAI LDAEHFFDGY KANPRYALDC LKAALEAGAR WVVLCDTNGG 
TLPAEVGRIV AEVIAAGVPG DRLGIHTHDD TGTAVAATLA AVDAGARQVQ GTLNGLGERC 
GNANLTALIP TFLLKEPYAS RFETGISREA LAGMVRISRM LDDILNRVPR RASAYVGASA 
FAHKAGLHAS AILKDPATYE HIDPALVGNV RVIPMSNQAG QSNLRARLAA AGIEVPAGDP 
RLGRILEVIK AREDQGYAYD SAQGSFELVA RRELGLMPSF FEVKRYRVTV ERRRVGEGTM 
TLSEAVVVVI IDGQRVLSVS ESLDENGTER GPVNALSKAL AKDLGRWQSV IDDMRLVDFK 
VRITQGGTEA VTRVIIDSED GQGRRWSTVG VSPNIVDASF EALLDAINWK LVRDARRGEG 
S