Gene Rpal_3503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3503
Symbol
ID	6411177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	3751039
End bp	3752265
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	63%
IMG OID	642713382
Product	putative ABC transporter, substrate binding protein
Protein accession	YP_001992479
Protein GI	192291874
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.10294
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGGAG TGTTCTCGCA CGCCATCGCT GCCGCGTTGG TGAGTGCGGC GTTGATCCTG 
CCGGCGTCGG CCCAGTCCGG CGACAAGACC GCCAAGATCG GCGTACTTAA CGACATGTCG 
AGCCTGTACG CCGACATCGG CGGACCGAAC TCGGTCGTCG CCGCCAAGAT GGCGATCGCC 
GATTCCGGGC TCGAAGCAAA AGGCTGGAAG ATCGAACTGG TCTCCGGCGA TCACCAGAAC 
AAACCGGACA TCGGCGTCAA TCTGGCGCGG CAGTGGATCG ATGTCGACAA GGTCGACCTG 
ATCACCGACA CGCCGAACTC CGGCGTCGCG CTGGCGATCA GCAATCTGGT CAAAGAGAAG 
AACAGCATCC TGATGAATTC AGGAGGCGCC AGCGCCGATC TGACCGGCAA GGCGTGCAAC 
GCCAACACCA TCTCGATGAC TTACGACACC TACATGCTGG CGCACGGCAC TGGTCAGGCC 
CTGACCAAGG CCGGCGGTGA TACTTGGTTC TTCCTCACCG CCGACTACGC GTTCGGCGCC 
GCGCTCGAGC GCGACACCAC CGCGGTCGTC AAGGCCAATG GCGGCAAGGT CATCGGCAGC 
GTCAAGCATC CGCTGAATAC ACCGGACTTC TCGTCGTTCC TGCTGCAGGC GCAGGCGTCG 
AAGGCCAAGG TGATCGGCCT CGCCAATGCC GGCGGCGACA CCACCAACTC GATCAAGCAG 
GCCGCCGAGT TCGGCATCAC CGCGGGCGGC CAGAAGCTGG CCGCGCTGCT GCTGTTCATC 
AACGACGTGC ACTCGCTCGG GCTGAAGACG GCTCAAGGCC TGACCTTTAC CGAATCCTAC 
TATTGGGACC TCAACGACAA CACGCGCGCG TTCGCGGACC GCTTCCAGAA GCAGGCTAAG 
AACAACGCCA AGCCGTCGAT GACCCAGGCC GGCGTGTACG CCGCGGTGCT GCACTATCTG 
AAGACTCTTG AAGCGATGGG CGGCAATCCG CATGACGGCG CCAAGGTCGT CGCCAAGATG 
AAGGAGATCC CGGCGGACGA TCTGCCGTTC GGCAAGTCGG TGATCCGCGC CGATGGACGT 
CGCTTGGTGC CGGCGTTCCT GTTCGAAGTG AAGTCGCCGG CCGAATCCAA GGGCCCGTGG 
GACTACTACA AGAAGATCGC CGACATCTCC GCCGAAGACG CTGCGCGTCC GCTGGCGGAC 
AGCGAGTGCC CGCTGATCAA GAAGTAA

Protein sequence

MRGVFSHAIA AALVSAALIL PASAQSGDKT AKIGVLNDMS SLYADIGGPN SVVAAKMAIA 
DSGLEAKGWK IELVSGDHQN KPDIGVNLAR QWIDVDKVDL ITDTPNSGVA LAISNLVKEK 
NSILMNSGGA SADLTGKACN ANTISMTYDT YMLAHGTGQA LTKAGGDTWF FLTADYAFGA 
ALERDTTAVV KANGGKVIGS VKHPLNTPDF SSFLLQAQAS KAKVIGLANA GGDTTNSIKQ 
AAEFGITAGG QKLAALLLFI NDVHSLGLKT AQGLTFTESY YWDLNDNTRA FADRFQKQAK 
NNAKPSMTQA GVYAAVLHYL KTLEAMGGNP HDGAKVVAKM KEIPADDLPF GKSVIRADGR 
RLVPAFLFEV KSPAESKGPW DYYKKIADIS AEDAARPLAD SECPLIKK