Gene Rpal_4334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4334
Symbol
ID	6412018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	4660787
End bp	4661893
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	63%
IMG OID	642714216
Product	Extracellular ligand-binding receptor
Protein accession	YP_001993305
Protein GI	192292700
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0248694
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACTCA AGCTTCTCGG TTTGGCATTC GGCGTCTCGC TGGCGCTCTC GACTACGGCG 
CTGGCGCAGG ACATCAAGGT CTCGGTCGCC GGTCCGATGA CCGGCGGCGA ATCCGCGTTT 
GGCCGGCAGC TCAAGAACGG CGCTGAACAG GCGGTGGTCG ACCTCAACGC CAAGGGTGGC 
CTGCTCGGCA AGAAGCTGGT GCTCGACGTC GAGGACGATG CCTGCGATCC GAAGCAGGCG 
CGCTCGGTCG CCGAGAAGAT CGCGGGCGAC GGCATCCCGT TCGTCGCCGG TCACTTCTGC 
TCGTCATCGT CGATCCCGGC GTCGGAAGCC TACGCCGACG GCAACGTGCT GCAGATCACG 
CCGGCCTCGA CCAACCCGCT GTTCACCGAG CGCAAGCTGT GGAACGTGCT GCGCGTCTGC 
GGCCGCGACG ATCAGCAGGG CCTGGTCGCC GCCGAGTACA TCCTTAAGAA CTACAAGGGC 
AAGAACGTCG CCATCCTCAA CGACAAGACC ACTTACGGCA AGGGTCTGGC CGACGAGACC 
AAGAAGGCGC TGAACAAGGC CGGCTTCCAG GAGAAGATGT TCGAGTCCTA CAACAAGGGC 
GACAACGACT TTAACTCGAT CGTGTCGCGG CTGAAGCGCG ACGCCATCGA TCTGGTGTAC 
ATCGGCGGTT ATCACCGCGA GGCCGGCCTG ATCCTGCGCC AGATGCGCGA CCAGGGCCTC 
AGCACCGTGA TGATGGCTGG CGACGCGATG AACGACAAGG AATTCGCCTC GATCACCGGT 
CCGCTGGCCG CAGGCACGCT GTTCACCTTC GGCCCCGACC CGCGCAACAA GCCGACCGCC 
AAGCAGATCG TCGAAACCTT CAAGGGCAAG GGCATCGATC CGGAAGGCTA CACCCTCTAC 
ACCTACGCGG CGTTCCAAGT GTGGTCGCAG GCGGTCGAGA AGGCGAAGTC GACCGACCCG 
AAGAAGGTGA TCGAGACCAT CAAGGCCGGC GACTGGGACA CCGTGCTCGG CAAGATGGCG 
TTCGACGCCA AGGGCGACAT CAAGGCGATC GACTACGTCG TCTACAAATG GGACGCCAAG 
GGCGGCTACG CCGAGATCAA TCCTTAA

Protein sequence

MTLKLLGLAF GVSLALSTTA LAQDIKVSVA GPMTGGESAF GRQLKNGAEQ AVVDLNAKGG 
LLGKKLVLDV EDDACDPKQA RSVAEKIAGD GIPFVAGHFC SSSSIPASEA YADGNVLQIT 
PASTNPLFTE RKLWNVLRVC GRDDQQGLVA AEYILKNYKG KNVAILNDKT TYGKGLADET 
KKALNKAGFQ EKMFESYNKG DNDFNSIVSR LKRDAIDLVY IGGYHREAGL ILRQMRDQGL 
STVMMAGDAM NDKEFASITG PLAAGTLFTF GPDPRNKPTA KQIVETFKGK GIDPEGYTLY 
TYAAFQVWSQ AVEKAKSTDP KKVIETIKAG DWDTVLGKMA FDAKGDIKAI DYVVYKWDAK 
GGYAEINP