Gene RPB_1740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1740
Symbol
ID	3909727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	1987652
End bp	1988959
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	67%
IMG OID	637883634
Product	extracellular ligand-binding receptor
Protein accession	YP_485359
Protein GI	86748863
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.398941
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.157953
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCTCG GCGCGCGATC CGGCATATAC AGGGCGGATT CCGCCGCGCC ACGCGGCCCG 
ATGCGAGACC CGATCATGCT TTCCGATGCC TTCCGGTGCA CGCGATGGAC CGCGTTGCTC 
ACCGTTCTCT TCGCCGTCGT CGCTGCGTCG CCGGCGCTTT CCCAGAAGCG CTACGATCCC 
GGCGCCAGCG ACACCGCGAT CCGGATCGGC AATCTGATGC CCTATTCCGG CCCGGCCTCG 
GCCTATGCCA TCGTCGGCCG CATCGAGCAG GCCTATTTCC GGATGATCAA CGACCAGGGC 
GGCATCAACG GCCGCCGGAT CGAGTTCATT TCCTATGACG ACGCCTACAG CCCGGCCAAG 
GCGGTGGAGC AGACGCGCAG ACTGGTCGAA AGCGACGAGG TGCTGCTGGT GTTCAGCGCG 
ATGGGCACGC CCTCGAACAC CGCGATCCAG AAATATCTCA ACGCCAAGGG CGTCCCGCAA 
CTGTTCGCCG CGAGCGGCGC GACGCGGTTC GGCGACCCGA AGGGCTTTCC CTGGACGATG 
GGCTGGCAGC CGCCCTACCA GGTCGAGGGC CGCGTCTACG CCAAATACAT CCTCGCCAGC 
AGGCCCGAGG CCCGGATCGC GGTGCTGTAT CAGAACGACG ACCTCGGACG CGACCTGCTG 
AAGGGGCTGA AGGACGGGCT CGGCGACCAC GCGACGCAGA TCGTCGCCGA GGAGAGCTAC 
GAAGTCGCCG AGCCTTCCGC CGATAACCAC ATCGCCCGGC TGAAGGCGTC GGGCGCCGAC 
GCGTTCGTCA GCATCACCAC GCCGAAATTC GCGGCGCAGA GCATCCGCAC GGCCGCCGAG 
ATGCAATGGC GTCCGCTGTA TCTGCAGGCG CTGGTGTCGG CCTCGATCGG CGCGGTGCTG 
CGGCCGGCCG GGCTCGACCA CGCGCAGGGA CTCATTTCCG CGGCCTACAA CAAGGACGCC 
GCCGATCCGC AATGGACCGA CGACCCCGGC ATGAAGCGGT TCCATGCCTT CCTCGATACC 
TACGCGCCGG ACGTCAACCG CGGCGACAAT TCGGTGATCT ACGGCTACGG TGCGGCGCAA 
TGCCTCGTCG AGGTCCTGCG CCGTGCCGGC GACACGCTGA CGCGCGCCAA TGTGATGCGC 
GAAGCGGCCA GTCTCGAAGG CTACGCGCCC GACACGCTGC TGCCGGGCAT CACCATCACC 
ACCGCGGCGA ACGACTTTCA TCCGATCGAA CAGCTGCGCT TGATGCGTTT CGAGGGCGAC 
CACTGGCGCT TGTTCAGACC GGTGATCGAC GCCGACCTGC GCAACTGA

Protein sequence

MGLGARSGIY RADSAAPRGP MRDPIMLSDA FRCTRWTALL TVLFAVVAAS PALSQKRYDP 
GASDTAIRIG NLMPYSGPAS AYAIVGRIEQ AYFRMINDQG GINGRRIEFI SYDDAYSPAK 
AVEQTRRLVE SDEVLLVFSA MGTPSNTAIQ KYLNAKGVPQ LFAASGATRF GDPKGFPWTM 
GWQPPYQVEG RVYAKYILAS RPEARIAVLY QNDDLGRDLL KGLKDGLGDH ATQIVAEESY 
EVAEPSADNH IARLKASGAD AFVSITTPKF AAQSIRTAAE MQWRPLYLQA LVSASIGAVL 
RPAGLDHAQG LISAAYNKDA ADPQWTDDPG MKRFHAFLDT YAPDVNRGDN SVIYGYGAAQ 
CLVEVLRRAG DTLTRANVMR EAASLEGYAP DTLLPGITIT TAANDFHPIE QLRLMRFEGD 
HWRLFRPVID ADLRN