Gene RPB_4331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4331
Symbol
ID	3912144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4915232
End bp	4916179
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	64%
IMG OID	637886235
Product	TRAP transporter solute receptor TAXI family protein
Protein accession	YP_487929
Protein GI	86751433
COG category	[R] General function prediction only
COG ID	[COG2358] TRAP-type uncharacterized transport system, periplasmic component
TIGRFAM ID	[TIGR02122] TRAP transporter solute receptor, TAXI family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0888724
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCCA GATTTTTGGG TTTCGCCGCG GCTGCGGCCG TGCTCGTTTC GGCGCCGCAG 
GCTCACGCCC AGCAGTTCGT CAACGTGCTG ACCGGCGGCA CGTCCGGCGT GTATTATCCG 
CTCGGCGTCG CGATCGCGAA GATCTACGGC GACAAGATTC CGAACGTGAA GTCGCAGGTG 
CAGGCCACCA AGGCGTCGGT CGAGAACCTC AATTTGCTGC AGCAGGGCCG CGGCGAGATC 
GCCTTCACGC TCGGCGACTC GCTGAAAGCG GCGTGGGACG GCGATCCTGA GGCCGGCTTC 
AAGGCCAAGC TCGACAAGCT GCGCGTGATC GGCGCGATCT ATCCGAACTA CATCCAGATC 
GTCGCCACCG CGGAGTCGGG GATCAAGACG CTCGCCGACC TCAAGGGCAA GAGCCTGTCG 
GTCGGCGCGC CGAAATCCGG CACCGAGCTG AATTCCCGCG CCATCCTCAA GGCCGCCGGG 
ATGGATTACA AGGACATGGG CAAGATCGAA TATCTGCCGT TCGCCGAATC CGTCGACCTG 
ATGAAGAACC GCCAGCTCGC CGCCACGCTG CAATCCGCAG GCCTCGGCGT CGCCTCGCTC 
AAGGATCTCA GCAACTCCTC CGAGATCAAC GTGGTCTCGG TGCCGAAGGA CGTGGTCGAC 
AAGATCGGCC CGCCGTTCGT CGCCGAAACG ATCCCGGCCG GCACCTACAA GGGCCAGGAC 
AAGGACGTTC CGACCGCGGC GGTGATCAAC TATCTCGTCA CTTCGACCGC GGTGTCCGAC 
GATCTCGCCT ATCAGATGAC CAAGCTGGTG TTCGACTCGC TGCCGGACCT CGCCAGCGCC 
CACGCCGCCG GCAAGGGCAT CAAGCTCGAG ACCGCCGCGG CCGGCAGCCC GGTTCCGCTG 
CACCCCGGCG CGATCAAGTA CTTCAAGGAA AAGGGCGTGC TGAAGTAA

Protein sequence

MKARFLGFAA AAAVLVSAPQ AHAQQFVNVL TGGTSGVYYP LGVAIAKIYG DKIPNVKSQV 
QATKASVENL NLLQQGRGEI AFTLGDSLKA AWDGDPEAGF KAKLDKLRVI GAIYPNYIQI 
VATAESGIKT LADLKGKSLS VGAPKSGTEL NSRAILKAAG MDYKDMGKIE YLPFAESVDL 
MKNRQLAATL QSAGLGVASL KDLSNSSEIN VVSVPKDVVD KIGPPFVAET IPAGTYKGQD 
KDVPTAAVIN YLVTSTAVSD DLAYQMTKLV FDSLPDLASA HAAGKGIKLE TAAAGSPVPL 
HPGAIKYFKE KGVLK