Gene RPD_1473 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1473
Symbol
ID	4021952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1641660
End bp	1642880
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	63%
IMG OID	637961667
Product	putative urea/short-chain binding protein of ABC transporter
Protein accession	YP_568611
Protein GI	91975952
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.267716
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGCCA AGCCTCTCGC GGCGGCGATG ATGACGGCTG CGCTTATGTC ATCCTCGACC 
GCATTCGCCC AGGTATCCGA CGACATTGTC AAGATCGGTG TACTGACCGA TATGAACGGT 
CCCGCGTCGA CGCCGACCGG CCAGGGTTCG ATGACGGCCG CGCAAATGGC GATCGACGAT 
TTCGGCGGCC AGGTGCTGGG CAAGCCGATC AGCGTCATCG TCGGCGACCA CCAGCTCAAG 
CCCGACATCG GCGGCGCTCT GGCGCGGCGC TGGTACGACG TCGAACAGGT CGACCTGATC 
GTCGACGTGC CGGTCTCCGC GGTCGGTCTC GCGGTTCAGA ACATCGCCAA CGAAAAGAAG 
CGGATGTTCA TCACGCAATC GACCGGCGCC GCCGATTTTC ACGGCAAGTT CTGCAGCCCC 
TACACGATGC AATGGGTGTT CGACACCCGG GCGCTGGCGG TCGGCACCGC GCAGGAGGTC 
GTGAAACGCG GCGGCGACAC CTGGTTCTTC ATCACCGACG ACTACGCCTT CGGCCTGTCG 
CTGGAGCGCG ACGCCGCGGC GGTGGTGACC AAGGCCGGCG GCAAGGTGAT CGGCTCGGTG 
CGTCCGCCGT TCGCGACGCC GGACCTGTCG TCCTTCGTAC TTCAGGCGCA AGCCTCGAAG 
GCCAAGATCA TCGGCATCGC CGGCGGCCCG CCGAACAACA TCAATGAAAT AAAGACCGGC 
GCCGAGTTCG GCGTCTTCAA GGGCGGACAA CAGATGGCGG CGCTGCTGGC GTTGATCACC 
GACATCCATT CGCTCGGCCT GCCCGCCGCG CAGGGCCTGT TACTGACGAC GTCGTTCTAT 
TGGGACATGG ACGACAGGAC CCGCGAATGG TCGAAGCGCT ACTTCGCCAA GATGAACCGG 
ATGCCGACGA TGTGGCAGGC CGGCGTGTAT TCCGCGGTGA CACACTATCT GCAAGGCATC 
AAGGAGGCCG GCACCGACGA GCCGCTCAAG GTCGCCGCCA AGATGCGCGA GAAGCCGATC 
GAGGATTTCT TCTCGCGCAA TGGCAAACTG CGCGAGGACG GTCTGATGGT GCATGACTTG 
ATGCTGGTTC AGGTCAAGAG CCCGGAGGAG TCGAAATATC CGTGGGACTA TTACAAGATC 
CTCGCGCATA TCTCCGGTGA AGAAGCGTTC GGCCCGCCCG ACCCGGCCTG CCCGTTGATC 
AAGAAACAGG CGGCGAATTG A

Protein sequence

MFAKPLAAAM MTAALMSSST AFAQVSDDIV KIGVLTDMNG PASTPTGQGS MTAAQMAIDD 
FGGQVLGKPI SVIVGDHQLK PDIGGALARR WYDVEQVDLI VDVPVSAVGL AVQNIANEKK 
RMFITQSTGA ADFHGKFCSP YTMQWVFDTR ALAVGTAQEV VKRGGDTWFF ITDDYAFGLS 
LERDAAAVVT KAGGKVIGSV RPPFATPDLS SFVLQAQASK AKIIGIAGGP PNNINEIKTG 
AEFGVFKGGQ QMAALLALIT DIHSLGLPAA QGLLLTTSFY WDMDDRTREW SKRYFAKMNR 
MPTMWQAGVY SAVTHYLQGI KEAGTDEPLK VAAKMREKPI EDFFSRNGKL REDGLMVHDL 
MLVQVKSPEE SKYPWDYYKI LAHISGEEAF GPPDPACPLI KKQAAN