Gene RPD_2999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2999
Symbol
ID	4023502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3340256
End bp	3341482
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	63%
IMG OID	637963198
Product	putative urea/short-chain binding protein of ABC transporter
Protein accession	YP_570126
Protein GI	91977467
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0873398
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.403324
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGTAG TCTTCTCGCG TCGTCATGCC GTGGCTATCG CGCTGGCAAG CGCCGCGTTT 
ACCTCGCCGG TACTCGCTCA GGACAAGACC GCAAAAATCG GCGTGCTCAA CGACATGTCG 
AGCCTCTACG CCGATATCGG CGGACCGAAC TCGGTCGTCT CCGCCAAGCT GGCGATCGCT 
GACTCCGGTC TTGAGGCGAA GGGCTGGAAG ATCGAGCTGC TCGCCGGCGA TCATCAGAAC 
AAGCCGGACA TCGGCGTCAA CGTCGCCCGT CAGTGGATTG ACGTCGACAA GGTTGACTTG 
ATCACTGACA CGCCGAACTC GGGCGTGGCG CTCGCGATCA GCAATCTGGT CAAGGAAAAG 
AACAGCATCC TGATGAATTC AGGCGGCGCC AGCGCCGACC TGACGGGCAA GCAGTGCACC 
CCCAACACCA TCTCGATGAC TTACGACACC TACATGCTGG CGCACGGCAC CGGTCAGGCG 
CTGACCAAGG CCGGCGGCAA TAGCTGGTTC TTCCTGACCG CGGATTACGC GTTCGGAGCG 
GCGCTCGAGC GCGATACGAC GGCGGTGGTC AAAGCCAATG GCGGCCAGGT GCTCGGCGGC 
GTCAAACACC CGCTCAACAC CGCCGACTTC TCGTCGTTCC TGCTGCAGGC GCAGGCGTCC 
AAGGCCAAGG TCATCGGCCT CGCCAATGCC GGCGGCGACA CCACCAACTC GATCAAGCAG 
GCTTCGGAGT TCGGCATCAC CGCCGGCGGG CAGAAGCTCG CGGCGCTGCT GCTGTTCGTC 
AACGACGTCC ACTCGCTCGG CCTCAAGGTC GCGCAGGGAC TGACCTTCAC CGAGTCCTAC 
TACTGGGATC TCAACGATAA TACCCGCGCC TTCGCCAAGC GCTTCTCGGA GCAGTCCAAG 
AACAACGCCA AGCCGTCGAT GACCCAGGCT GGCGTCTATG CCGCCGTGCT GCATTATCTC 
AAGACGCTCG ACGCGATGGG CGGCAACCCA CACGACGGCG CCAAGGTTGT AGCCAAGATG 
AAGGAGATCC CGGCCGACGA CGTGCCGTTC GGTAAGTCGG TTATCCGCGC CGACGGCCGC 
CGCCTGGTTC CGGCCTATCT GTTCGAGGTG AAGTCGCCCG CCGAGTCAAA GGGGCCGTGG 
GACTACTACA AGAAGATCGC GGACATCTCC GCCGAGGATG CGGCCCGTCC GTTGTCCGAG 
AGCGAATGCC CGCTGGTGAA GAAATAA

Protein sequence

MRVVFSRRHA VAIALASAAF TSPVLAQDKT AKIGVLNDMS SLYADIGGPN SVVSAKLAIA 
DSGLEAKGWK IELLAGDHQN KPDIGVNVAR QWIDVDKVDL ITDTPNSGVA LAISNLVKEK 
NSILMNSGGA SADLTGKQCT PNTISMTYDT YMLAHGTGQA LTKAGGNSWF FLTADYAFGA 
ALERDTTAVV KANGGQVLGG VKHPLNTADF SSFLLQAQAS KAKVIGLANA GGDTTNSIKQ 
ASEFGITAGG QKLAALLLFV NDVHSLGLKV AQGLTFTESY YWDLNDNTRA FAKRFSEQSK 
NNAKPSMTQA GVYAAVLHYL KTLDAMGGNP HDGAKVVAKM KEIPADDVPF GKSVIRADGR 
RLVPAYLFEV KSPAESKGPW DYYKKIADIS AEDAARPLSE SECPLVKK