Gene Rpal_4000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4000
Symbol
ID	6411682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4286872
End bp	4288083
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	63%
IMG OID	642713882
Product	Extracellular ligand-binding receptor
Protein accession	YP_001992971
Protein GI	192292366
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATTGT TTCGGCATAC AACGATCGTC GCCGCGGCTG CGCTGCTTGC AGTGCTCAGC 
GCCGGCCCAG CGCTCGCCGG CGGCAGCTAT GACCCCGGCG CCAGCGACAG CCTGATCAAG 
CTCGGCCAGA CCATGCCGTA TTCGGGACCG GCGTCGGCCT ATTCGACGAT TGGGCGCGCC 
GAGGCCGCTT ACTTCAAGAT GCTGAACGAC AAGGGCGGCA TCAACGGCCG CAAGGTCGAG 
TTGCTGAGCC TCGACGATGC CTACTCGCCG TCGAAGACGG TGGAGCAGGT CCGCCGGCTG 
GTCGAAAGCG ACGAAGTGCT GGCGATGTTC TCGATCCTCG GCACCGGGCC GAACATCGCG 
GTGCAGAAGT ATCTCAATAT CAAGAAGGTC CCGCAGCTAT TGCCGTTCAG CGGCGCCACG 
CGCTGGAACG ACGCCAAGCA CTTCCCGTGG ACCACCGGCT CGCAGCCGAC CTACAAGACC 
GAGGGCAGGA TCTACGCGAA GTGGATTCTC GCCAACAAGC CGAATGCTAA AATTGCGGTG 
ATCACGCCGG CCGAAGAAGC CGGCCGCGAT TATCTCGCCG GCTTCAAGGA AGGACTCGGC 
GACCATGTGA ACCAGATCGT GTCTGAGGCG GTGTATGAAA CCACCGATCC GACCGTCGAC 
TCCCAGATCG TCAAGTTCAA GGCCGCCGGC GCCGACGTGC TGTTCAACGA ATGCACGCCG 
AAATTCGCCG CGCAGGTGAT CAAGAAGGCC GCCGAGCTCG GCTGGAAGCC GCAGATCATT 
CTGCCCGCGG TTTCGAATTC GGTCGGCTCG GTACTCAAGC CGGCGGGGCT GGAGAATGCG 
GTCGGCATCG TCACCGGCGC TTACGTGAAG GATCCGGGCG ATCCGCGCTG GGCCAATGAT 
CCCGGCATGC AGCAATGGCA CGCCTGGATG AAGACCTACA ATGCGGGTGC CGATCCGGCC 
GATATCTTCA ACGTCTACGG TTACACGATC ACGCAGATCA TGGAGCTGGT GCTGCGTCGC 
GCCGGCGACG ATCTCACCAG GGCAAATCTG ATGAAGCAGA TCGAGTCGCT CGATGGCGTC 
GAGCTGCCGA TGCTGCTGCC TGGCATCAAG CTGCAGATGT CGCCCGACCA GCGCACGCCG 
ATCCGGCAGT TGCAGATGGC GCGCTTCAAC GGCACCTCCT GGGAGCTGTT CGGCGACGTA 
CTGAGCGAGT AG

Protein sequence

MQLFRHTTIV AAAALLAVLS AGPALAGGSY DPGASDSLIK LGQTMPYSGP ASAYSTIGRA 
EAAYFKMLND KGGINGRKVE LLSLDDAYSP SKTVEQVRRL VESDEVLAMF SILGTGPNIA 
VQKYLNIKKV PQLLPFSGAT RWNDAKHFPW TTGSQPTYKT EGRIYAKWIL ANKPNAKIAV 
ITPAEEAGRD YLAGFKEGLG DHVNQIVSEA VYETTDPTVD SQIVKFKAAG ADVLFNECTP 
KFAAQVIKKA AELGWKPQII LPAVSNSVGS VLKPAGLENA VGIVTGAYVK DPGDPRWAND 
PGMQQWHAWM KTYNAGADPA DIFNVYGYTI TQIMELVLRR AGDDLTRANL MKQIESLDGV 
ELPMLLPGIK LQMSPDQRTP IRQLQMARFN GTSWELFGDV LSE