Gene RPB_3685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3685
Symbol
ID	3911487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4224793
End bp	4225908
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	63%
IMG OID	637885587
Product	extracellular ligand-binding receptor
Protein accession	YP_487291
Protein GI	86750795
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.28436
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCA AGCTTCTCGG TTTGGCATTC GGCGCGTCGC TGGCGCTGTC GACCACGGCG 
CTGGCACAGG ACATCAAGGT CGCGGTCTCG GGGCCGATGA CCGGCAGCGA ATCCGCGTTC 
GGACGGCAGT TGAAGAACGG CGCCGATCAG GCGGTCGCCG ATCTCAACGC CGGCGGCGGC 
GTGCTCGGCA AGAAGCTGGC GCTGCAGATC GGCGACGACG CCTGCGATCC CAAGCAGGCA 
CGCTCTATCG CCGAGAAACT GGCAGGCGAA GGCATCCCGT TCGTCGCCGG GCATTTCTGT 
TCGTCGTCGT CGATCCCGGC GTCGGAAGCC TATGCGGACG GCAACGTGCT GCAGATCACG 
CCCGCCTCGA CCAACCCGCT GTTCACCGAG CGCAAGCTGT GGAACGTGCT GCGCGTCTGC 
GGCCGCGACG ATCAGCAGGG CCTGATCGCC GCCGAGTACA TCACCAAGAA TTTCAAGGGC 
AAGAACGTCG CCATCCTCAA CGACAAGACC ACCTACGGCA AGGGTCTCGC CGATGAAACC 
AAGAAGGCGC TGAACAAGGC CGGCTTCCAG GAGAAGATGT TCGAGTCCTA CAACAAGGGC 
GACAAGGACT TCAATTCGAT CGTCTCGCGG CTGAAGCGCG ACTCGATCGA TCTCGTCTAT 
ATCGGCGGCT ACCATCAGGA AGCCGGGCTG ATCCTGCGGC AGATGCGCGA CCAGGGCCTG 
AAGACCGCGA TGATGGCCGG CGACGCGATG AACGACAAGG AATTCGCCTC GATCACCGGC 
CCGCTCGCCG AGGGCACGCT GTTCACCTTC GGCCCCGACC CGCGCAACAA GCCGACCGCC 
AAGGCGATCG TCGAGAAGTT CAAGGCCAAG GGCATCGATC CGGAAGGCTA CACGCTCTAC 
ACCTACGCCG CGTTCCAGGT CTGGTCGCAG GCCGTCGCCA AGGCCAAGAC CACCGATCCG 
AAGAAGGTGA TCGACACCAT CAAGGCCGGC GAATGGGACA CCGTGCTCGG CAAGATGGCG 
TTCGACGCCA AGGGCGACAT CAAGGCGATC GACTACGTCG TCTACAAATG GGACGCCAAG 
GGCAACTACG CGGAAATCCC CGGCAAGGCG ATGTGA

Protein sequence

MKLKLLGLAF GASLALSTTA LAQDIKVAVS GPMTGSESAF GRQLKNGADQ AVADLNAGGG 
VLGKKLALQI GDDACDPKQA RSIAEKLAGE GIPFVAGHFC SSSSIPASEA YADGNVLQIT 
PASTNPLFTE RKLWNVLRVC GRDDQQGLIA AEYITKNFKG KNVAILNDKT TYGKGLADET 
KKALNKAGFQ EKMFESYNKG DKDFNSIVSR LKRDSIDLVY IGGYHQEAGL ILRQMRDQGL 
KTAMMAGDAM NDKEFASITG PLAEGTLFTF GPDPRNKPTA KAIVEKFKAK GIDPEGYTLY 
TYAAFQVWSQ AVAKAKTTDP KKVIDTIKAG EWDTVLGKMA FDAKGDIKAI DYVVYKWDAK 
GNYAEIPGKA M