Gene Rsph17029_1945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1945
Symbol
ID	4895283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2063605
End bp	2064885
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	62%
IMG OID	640112539
Product	ABC branched chain amino acid transporter, substrate binding protein
Protein accession	YP_001043821
Protein GI	126462707
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR03407] urea ABC transporter, urea binding protein

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00107842
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATGT TCCGGGCATA TCTGATCGGC ACGGCCCTCG GTCTGTCGCT CGCGGGCGGG 
GCGCTCGCGC AGGAGGACAC GATCAAGATC GGCGTGCTCC ATTCGCTCTC GGGCACGATG 
GCGATTTCCG AGACGACGCT GAAGGACACC GTCCTGATGC TCGTCGATCA GCAGAACGCC 
AAGGGCGGCC TTCTGGGCAA GAAGCTCGAG GCGGTGGTGG TGGACCCCGC CTCCGACTGG 
CCGCTCTTCG CCGAGAAGGC GCGCGAACTG CTGACCGTGA ACGATGTCGA CGTGATCTTC 
GGCTGCTGGA CCTCGGTCAG CCGCAAGTCG GTGCTGCCGG TGATCGAGGA GTTGAACGGC 
CTCCTGTTCT ACCCGGTGCA GTATGAGGGC GAGGAGAGCT CGAAGAACGT CTTCTACACC 
GGTGCCGCGC CGAACCAGCA GGCGATTCCG GCGGTGGACT ATTTCCTCGA GGAACTGGGC 
GTCGAGAAAT TCGCCTTGCT CGGCACCGAC TACGTCTATC CGCGCACGAC GAACAACATC 
CTCGAGAGCT ACCTTCAGCA GAAGGGCATC GCGAAATCCG ACATTTTCGT GAACTACACG 
CCCTTCGGCC ATTCCGACTG GTCGAAGATC GTGGCGGACG TGAAGGCGCT CGGCGCGGAC 
GGCAAGAAGG TGGGCGTGAT CTCGACCATC AACGGGGATG CGAACATCGG CTTCTACAAG 
GAACTCGCGG CCGCAGGCAT CTCGGCCGAG GACATTCCCG TCGTGGCCTT CTCGGTGGGC 
GAGGAGGAAC TCTCGGGCCT CGACACGTCG AACCTCGTGG GCCATCTCGC GGCCTGGAAC 
TACTTCCAGT CCGCCGAAAG CCCCGAGAAC GAAGCCTTCA TCAAGGAATG GAAGGCCCGC 
ATGGGTGAGA AGCGGGTGAC GAACGACCCG ATGGAGGCCA CCTACATCGG CTTCAACATG 
TGGGTGAATG CCGTAACCGC GGCGGGCACC ACTGATGTGG ATCCGGTGGC CAAGGAGATG 
ATCGGGCAGA AATTCCCGAA CCTCACCGGC TCCGAGGCCG AGATGCTGCC GAACCACCAT 
CTGACCAAGC CCGTGCTGAT CGGCGAGATC CGCGACGACG GCCAGTTCGA CATCATCTCG 
CAGACCGATC CGGTGCCGGG CGATGCCTGG ACGGACTTCC TGCCGGAATC GGCCGTGCTC 
GAGTCCGACT GGGCCAAGCT CGACTGCGGC ATGTACAACA CCGAGACCAA GAGCTGCGTG 
CAGATCAAGT CGAACTACTG A

Protein sequence

MKMFRAYLIG TALGLSLAGG ALAQEDTIKI GVLHSLSGTM AISETTLKDT VLMLVDQQNA 
KGGLLGKKLE AVVVDPASDW PLFAEKAREL LTVNDVDVIF GCWTSVSRKS VLPVIEELNG 
LLFYPVQYEG EESSKNVFYT GAAPNQQAIP AVDYFLEELG VEKFALLGTD YVYPRTTNNI 
LESYLQQKGI AKSDIFVNYT PFGHSDWSKI VADVKALGAD GKKVGVISTI NGDANIGFYK 
ELAAAGISAE DIPVVAFSVG EEELSGLDTS NLVGHLAAWN YFQSAESPEN EAFIKEWKAR 
MGEKRVTNDP MEATYIGFNM WVNAVTAAGT TDVDPVAKEM IGQKFPNLTG SEAEMLPNHH 
LTKPVLIGEI RDDGQFDIIS QTDPVPGDAW TDFLPESAVL ESDWAKLDCG MYNTETKSCV 
QIKSNY