Gene Rsph17029_0459 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0459
Symbol
ID	4896528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	478211
End bp	479386
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	72%
IMG OID	640111043
Product	hypothetical protein
Protein accession	YP_001042347
Protein GI	126461233
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGTCCG TTCTCAGCCG CGCCCGCAAG TCGCTGGGCC GCGCCGCTCT GGCGCTTGCC 
GCGCTGGGCG TCGCCGCCTG CGAACCCGTC GCCATGACCG GCGGGGGCCC GGCGGTGGAC 
AGCTCGAAAC CGGTGCCGGT GGCGCTTCTC GTGCCGGCGG GCTCGGGGCA GGCCAGCGAC 
GAGCTTCTGG CCCGCAGCCT GCAGAACGCG GCCCGCCTCG CTGCGGCCGA CCTGGGCAAT 
GTCCAGATCG ACCTTCGGGT CTACAATACC GCGGGCCAGC CCTCGCAGGC CGCGAGCGTG 
GCGTCGCAGG CGGTGGCCGA CGGGGCGAAG ATCATCCTCG GCCCCGTCTT CGCGCAGGAA 
GCCAATGCCG TGGGCGCGGC CGTCGCGCCG AGCGGCGTCA ATGTGCTCAG CTTCTCGAAC 
AATCCCGACA TCGCGGGCGG CAACGTCTTC GTCCTCGGGC CGACCTTCCA GAACACCGCC 
AACCGGCTCG CGGGCTATGC CGTCCGTCAG GGCAACGGCC GCATCATGGC GGTGAGCGAC 
CGCACCCCGG CGGGCCAATC GGGACGCGCC GCCATCGAGC GCGGCGTGGC CCAGTCCGGC 
GGCACGCTCG TGGCCTCGAT GGACTACGAA TTCTCGCAGA ACGGCATCGT CTCGGCCGCG 
CCGGGCATCG TCGAGCGCGC GCAGGTCACC AATGCGCAGG CGCTGTTCCT GACCGCCGAC 
ACGGCGGGCG CGCTGCCGCT CGTGACCCAG GTGCTGCGCG AGAACGGGCT GCCGCAGGAG 
ACCGCCCGCT TCATCGGCCT CACGCGCTGG GACATTCCCT CGGCCACCCT CTCGCTGCCG 
GGCGTCCAGG GCGGCTGGTT CGCCCTGCCC GATCCGGGCG TCTACGGCCA GTACGAGCAG 
CGCTACCGCG CGGCCTACGG CGAGGCGCCG CATCCGATCT CGGGGCTCGC CTACGACGGC 
GTCGCCGCCG TGGGGGCGCT TCTCAAGCGC GGCGCCTCGG ACGGGCTCAG CGGCCGCGCC 
CTCACCCAAG GCTCTGGATT CGTCGGCGTG AACGGCATAT TCCGGCTGCG CAGCGACGGC 
ACCAACGAAC GCGGATTGGC CGTCGCCCAG ATCCGCAACA ATCAGGTGGT AGTGATTGAC 
CCCGCGCCGC GAAGCTTCGG TGGCGCCGGC TTCTGA

Protein sequence

MLSVLSRARK SLGRAALALA ALGVAACEPV AMTGGGPAVD SSKPVPVALL VPAGSGQASD 
ELLARSLQNA ARLAAADLGN VQIDLRVYNT AGQPSQAASV ASQAVADGAK IILGPVFAQE 
ANAVGAAVAP SGVNVLSFSN NPDIAGGNVF VLGPTFQNTA NRLAGYAVRQ GNGRIMAVSD 
RTPAGQSGRA AIERGVAQSG GTLVASMDYE FSQNGIVSAA PGIVERAQVT NAQALFLTAD 
TAGALPLVTQ VLRENGLPQE TARFIGLTRW DIPSATLSLP GVQGGWFALP DPGVYGQYEQ 
RYRAAYGEAP HPISGLAYDG VAAVGALLKR GASDGLSGRA LTQGSGFVGV NGIFRLRSDG 
TNERGLAVAQ IRNNQVVVID PAPRSFGGAG F