Gene Rpal_1752 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1752
Symbol
ID	6409409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	1880342
End bp	1881658
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	62%
IMG OID	642711640
Product	putative UreA/short-chain amide transport system substrate-binding protein
Protein accession	YP_001990755
Protein GI	192290150
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.225612
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGTTTG ACCGTCGGCA GCTTTTGCTC GGAGGAGTCG GCGCCGCAGC CGGGCTCGCG 
CTTCCTGGAA GTGCATTTGC GCAATCGCCG GCGGCGATCG GAACCTTTCC GGCAGGTGTT 
TCGGCCGACT CGGTGTTCGT AGGCCTGACC ATTCCGCTCA CCGGGGTTTT CTCGGGCGAT 
GGCGGCGACC TCAAGCTCGG CTATGAGCTG GCGATCGCGC AGATCAACGC CGGTAGCGAG 
ATCGCGCAGC AATGGGGACT CAAGGGCAAG GGAGTGCTGG GCCGGCAAAT TCGCCACAAG 
GTCTCGGACA CCGAGGGCAA GCCGAACCTC GATGTGCAGA GCGCCACGCA GTTCATCCAG 
CGCGACAAGG CCATCATGGT GTCGGGCTCG GTGTCGAGCT CCAGCGCGAT CGCGCTCGAA 
GAGCTCGGGT CGCGCGAGAA AGTGCTGTAC ATGGTCGGCA TCGCCGGCTC CAACGACATC 
ACCGGAAAGA ATTGCCAGCG CTACGGATTC CGCTCTCAGC AGAACGCCTA TATGGCGGCC 
AAGGGCCTCG CTCCGGTGGT GGCGAAGGCG CTCGGCAAGA ACGTCAAGAT GGCCTTCCTG 
GTGCCCGACT ACACCTACGG CCACAGCGTG TATGACAGCT TTTCCAAGTT CGCGACCGAG 
CAGGGCTGGA AGCAGGTTGC CAAGGAAGTG GTGCCGCTCG GGACCACCGA TTACTCCTCG 
GCGTTGCTCA ATATCGCCAA CAGCGGCGCC GATGTGTTCG TCAACATCGC CTTCGGTGCC 
GACTCCGTCG CCTCGACTAA GCAGGCCGAG CAGTTCGGTG TGCTGAAGCG GATGAAGCTC 
GTCGTGCCCA ATCTGTCGTC GTTCCAGGAC AAGGAGCTCG GCGCCGAGTT GATGCAGGGG 
GTCTACGGAA GCTGTGATTT CTGGTTCGGT CTGCAGGACA AGTTCCCGCT CGCCAAGGCG 
TTCGTCGACA GCTTCGTCGC GCAGAACAAT TACCATCCGC GCTGGGGTGC CCATATCGGC 
TACATGCAGA CCTATCTGTG GGCCATGTCG GTCGAGCGCG CCAACACCTT CAATCCGGTG 
GACGTGATCA AGGTGATGGA GAATTCCAAG GCGCAGCCAT ACGTCACGAC GATCGGCAAA 
GTGTATTTCC GCGCCGAGGA CCATCAGATG GTGCGCCCGA TCCCGATTCT GCGCGGCAAG 
AAGCCGGCGG AGATGAAGCA CAAGGAAGAC TTCTACGACA TCATCGACCT CGTCGACGGC 
GAGGCCGTGA TGAATCCGCC GGACCTGTTC GGTTGCAAGC TCGGCCCCTA CACCTGA

Protein sequence

MQFDRRQLLL GGVGAAAGLA LPGSAFAQSP AAIGTFPAGV SADSVFVGLT IPLTGVFSGD 
GGDLKLGYEL AIAQINAGSE IAQQWGLKGK GVLGRQIRHK VSDTEGKPNL DVQSATQFIQ 
RDKAIMVSGS VSSSSAIALE ELGSREKVLY MVGIAGSNDI TGKNCQRYGF RSQQNAYMAA 
KGLAPVVAKA LGKNVKMAFL VPDYTYGHSV YDSFSKFATE QGWKQVAKEV VPLGTTDYSS 
ALLNIANSGA DVFVNIAFGA DSVASTKQAE QFGVLKRMKL VVPNLSSFQD KELGAELMQG 
VYGSCDFWFG LQDKFPLAKA FVDSFVAQNN YHPRWGAHIG YMQTYLWAMS VERANTFNPV 
DVIKVMENSK AQPYVTTIGK VYFRAEDHQM VRPIPILRGK KPAEMKHKED FYDIIDLVDG 
EAVMNPPDLF GCKLGPYT