Gene Rpal_4559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4559
Symbol
ID	6412243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4910990
End bp	4912168
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	64%
IMG OID	642714439
Product	Extracellular ligand-binding receptor
Protein accession	YP_001993528
Protein GI	192292923
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.61677
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGATTG GCAGACGAAC GCTGCTGCAC GCCGCCTGCA TCGCTTTGGC CGGCGCAACG 
ACGAGCACGG TGGCGCATGC CGAGGACACC GTGAAGATCG GCCTGATCGT GCCGATGACC 
AGCGGCCAAG CCTCGACCGG CAAGCAGATC GACAACGCCG TCAAGCTGTA CATGAAGCAG 
AACGGCTCCA CCGTCGCCGG CAAGAAGATC GAAGTGATCC TGAAGGACGA CGCCGCGGTG 
CCGGACAACA CCAAGCGGCT CGCGCAGGAA CTGATCGTCA ATGACAAGGT CAACGTGATC 
GCCGGCTTCG GCATCACGCC CGCCGCGCTC GCAGCGGCGC CGCTCGCCAC CCAGGCGAAA 
GTGCCCGAAG TGGTGATGGC GGCCGGCACC TCGATCATCA CCGAGCGCTC GCCCTATATC 
GTCCGCACCT CGTTCACGCT GCCGCAGTCC TCGACCGTGA TCGGCGATTG GGCGGTAAAG 
AACGGCATCA AGAAGGTGGT GACGCTGACC TCCGACTACG CGCCGGGCAA TGACGCGCTG 
GCGGCGTTCA AGGAGCGCTT CACCGCCGGC GGCGGTCAGA TCGTCGAAGA GGTCAAGGTG 
CCGCTCGCCA ATCCGGACTT CGCGCCGTTC CTGCAGCGCG CCAAGGACTC CAAGCCGGAC 
GCGATGTTCG TGTTCGTTCC GGCCGGTCAG GGCGGCAACT TCATGAAGCA GTTTGCCGAG 
CGCGGCCTCG ACAAGTCGGG CATCAAGGTG ATCGGCCCCG GCGACGTGAT GGACGACGAC 
CTCTTGAACA GCATGGGCGA CGCCGCGATC GGCGTGGTCA CTGCGCACAT CTATTCGGCG 
GCGCATCCGT CGGAGAAGAA CAAGGCGTTC GTCGCCGCCT ACAAGAAGGA ATTCGGCCAG 
CGGCCCGGCT TCATGGCGGT CGGCGGCTAC GACGGCATCC ACCTGATTTA CGAGGCGCTG 
AAGAAGACCG GCGGCAAGGC CGACGGCGAT TCGCTGATCG CCGCGATGAA GGGCATGGCT 
TGGGAAAGCC CGCGCGGCCC GATCTCGATC GACCCCGAAA CCCGCGACAT CGTCCAGAAC 
GTCTATATCC GCAAGGTCGA GAAGGTCGAT GGCGAGCTCT ACAACGTCGA GTTCGACAAG 
GTCGACGCGG TGAAGGATCC GGGCAAGACG AAGAAGTAA

Protein sequence

MLIGRRTLLH AACIALAGAT TSTVAHAEDT VKIGLIVPMT SGQASTGKQI DNAVKLYMKQ 
NGSTVAGKKI EVILKDDAAV PDNTKRLAQE LIVNDKVNVI AGFGITPAAL AAAPLATQAK 
VPEVVMAAGT SIITERSPYI VRTSFTLPQS STVIGDWAVK NGIKKVVTLT SDYAPGNDAL 
AAFKERFTAG GGQIVEEVKV PLANPDFAPF LQRAKDSKPD AMFVFVPAGQ GGNFMKQFAE 
RGLDKSGIKV IGPGDVMDDD LLNSMGDAAI GVVTAHIYSA AHPSEKNKAF VAAYKKEFGQ 
RPGFMAVGGY DGIHLIYEAL KKTGGKADGD SLIAAMKGMA WESPRGPISI DPETRDIVQN 
VYIRKVEKVD GELYNVEFDK VDAVKDPGKT KK