Gene RPD_0357 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0357
Symbol
ID	4020822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	421620
End bp	422846
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	59%
IMG OID	637960541
Product	extracellular ligand-binding receptor
Protein accession	YP_567496
Protein GI	91974837
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.0000767142
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGTTCT ACGGCGTGAC ATCGTTGTCG GGCGCGGTGA GGCTTGCCTT TTTTGCTTCC 
GCGGTATGCG GCCCGGGCGC ATTCAATGGC GCGGCGGCTC AGGAGCCCGT GCGGATCGGT 
GTGATCACCG ATATGACCGG GCCGTATTCT TCACTCTCCG GGCCGGGCGT CGTTGTCGGC 
ATGAAAATGG CGGTCGATGA GTTTGGCGGA AAAGTCCTCG GGCAGCCGAT CGAGGTGCTC 
AGCGCCGACA GCGGGCTGAA GGCCGATATC GCGCTCTCGC GCGCGCGCGA ATGGTACGAT 
CGCCAGAATG TCCATATGAT CGTCGAATCG TCTGATTCCG GGTCGGCTGT CGCCCTTCAA 
AAGCTCGGCG CCGACAAAAA GAAGATCACG ATGTTCCACT CGGGCACCAC GGCGCTCACG 
AATCTCGAGT GCTCGCCTTA CGGGGTGCAT TATGCGTGGG ATACCTATTC CATGGCGAGC 
GGAGCCGCCC GGGCAGCCGT CCAGGCGGGT GGGAATTCCT GGTACTTCAT CACCGCGGAC 
TACGTCTTCG GGAAATCCCT CGAGGCCGAC GCATCCAAGA TCATACGCCA GCTCGGCGGC 
GACATCATTG GCGGCGTTCG ACACCCGCTG AATGTGCCCG ACTTCGCGTC GTTTCTGCTG 
TCCGCTCAAC AGTCCAAAGC CAAGGTCGTC GGACTGGCTA ATGCCGGGAG CGACACTCAG 
AATGCCGTCA AGCAGGCCGC AGAGTTTGGG TTGGGCGGCG GACAGAAGGT CGTTCCGCTG 
CTGATGTTCG ACACCGATGT GAAGGGGCTT GGACTAAAAG TCGCGCAAGG GATGGAATTC 
GCGACGGCGT TCTATTGGGA CTACGACGAT AAATCGCGCG AATTCGCCAA CAAGTTCTTC 
GCAATCCATA AGAGCATGCC GACGATGAAC CATGCAGGGT CCTATTCGGC AACCCTGCAG 
TATCTGAAGG CTGTCCAGGC GACCGGCTCG CTGGATGCCG ACAAGGTGAT GAAGTACCTC 
AAATCCGCAA AAATCGAAGA CGCTTTCGCC CGCAACGGCC GAATCCGCGT TGATGGACGG 
ATGGTTCACG ACATCTATCA GGTGCGGGTC AAGACGCCGG AAGAATCCAC GGGCCCGTCA 
GATATCCTGA AGGTCATTCT GACCATCAAG GGTGATGATG CCTTCATGCC CCTTGCGGAT 
AGCACATGTC CGCTCGTCAA GAAGTAG

Protein sequence

MKFYGVTSLS GAVRLAFFAS AVCGPGAFNG AAAQEPVRIG VITDMTGPYS SLSGPGVVVG 
MKMAVDEFGG KVLGQPIEVL SADSGLKADI ALSRAREWYD RQNVHMIVES SDSGSAVALQ 
KLGADKKKIT MFHSGTTALT NLECSPYGVH YAWDTYSMAS GAARAAVQAG GNSWYFITAD 
YVFGKSLEAD ASKIIRQLGG DIIGGVRHPL NVPDFASFLL SAQQSKAKVV GLANAGSDTQ 
NAVKQAAEFG LGGGQKVVPL LMFDTDVKGL GLKVAQGMEF ATAFYWDYDD KSREFANKFF 
AIHKSMPTMN HAGSYSATLQ YLKAVQATGS LDADKVMKYL KSAKIEDAFA RNGRIRVDGR 
MVHDIYQVRV KTPEESTGPS DILKVILTIK GDDAFMPLAD STCPLVKK