Gene Rpal_1411 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1411
Symbol
ID	6409068
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	1489200
End bp	1490813
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	65%
IMG OID	642711310
Product	extracellular solute-binding protein family 5
Protein accession	YP_001990426
Protein GI	192289821
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.114372
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCCATC CACCGCGTTG GATGCGCTCG GTCGTCGCGT CGAAAATCGC TGTGCCGGCG 
TTCGCGCTCG CGGCATCGTT GACGCTGCCG GCGGCCGTCG ATGCCAAGAC GATCCGCGCC 
GTCATGCATT CCGACCTGCG TATCATCGAT CCCGGCCTGA CCACCGCCTA CATTACCCGC 
GACCACGGCT ATATGGTGTA CGACACGCTG CTGGCGATGG ACTCCAAGTT CAAGGTCCAG 
CCGCAGATGG CGGACTACAA AGTCTCAGAC GACAAGCTGA CCTACACGTT CACGTTGCGC 
GACGGACTGA AGTGGCACGA CGGCACCCCG GTCACCGCGG AGGATTGCGT CGCCTCGCTG 
AAACGCTGGG GCCAGAAGGA CGGCATGGGC CAGAAGCTGA TGCAGTTCAC CGCCAGCCTC 
GAAGCCACCG ATCCCAAGAC CATCACGCTG AAGCTGAAGG AGCCCTACGC GCTGGTGCTG 
GAATCGATCG GCAAGCCGTC GTCGCTGGTG CCGTTCATGA TGCCGAAGCG GATCGCCGAG 
ACGCCGGCCG ACAAGCCGAT CCCAGAGCAG ATCGGCTCCG GCCCGTTCAA GTTCGTGGCC 
TCGGAATTCC AGCCCGGCGT CAAGGCGGTG TACGTGAAGA ACCCCGACTA CATCCCGCGC 
AAAGAGGCGC CGGACTGGAC CTCGGGCGGC AAGGTCGTGA AGGTCGACCG CGTCGAGTGG 
ATCACCATGC CGGACGCGCA GACGGCGGTG AACGCCCTGC AGTCGGGTGA CATCGACTTC 
ATCGAGAACC CGTCGTTCGA CTTGCTGCCG GTGCTGGCGC AGGACAAGGA GCTGACGATT 
GACACGCTGA GCCCGCTCGG CTTCCAGACT CTCGGCCGGA TGAACTTCCT GCACCCGCCG 
TTCGATAATC CCAAGGTTCG CCGCGCCGCC TTCCTGGCGA TGAGCCAGAA GCCGGTGCTC 
GACGCGCTGG TCGGCAATCC GAAGTACTAC AAGATCTGTG GCGCCGTGTT CGGCTGCGGC 
ACGCCGCTCG AGACCGACGT CGGCTCCGAG ACGCTGGTCA AGGGCAACGG CATGGCCGAG 
GCCAAGAAGC TGCTCGCCGA ATCCGGCTAC GACGGCACGC CGATCGCGCT GATGGCGCCC 
GGCGACGTGG TGACGCTGAA GGCGCAGCCG ATCGTCGCTG CTCAGTTGCT GCGTGACGCC 
GGCTTCAAGG TCGACGTCCA GGCCACCGAC TGGCAGACCG TGGTGTCGCG CCGCGCCAGC 
CAGAAGCCGC CGAGCGAAGG CGGCTGGAAT ATGTTCTTCA CCAACTGGGC CGGCCCCGAC 
ATTCTCAATC CGGTCGCCAA CGTTTCGGTC GGTGGTCAGG GCAAGAAGGG CGGCTGGTTC 
GGCTGGGCGG AGGACGCCAA GGTCGAGGAG CTGCGCGACA AGTTCGTCCG CGCCAACTCG 
CCGGACGAGC AAAAGAAGAT CGCCGAAGAG ATCCAGAAGG AAGTCTATGA GCAGGTGATC 
TACATTCCGC TCGGCCAGTA CACCGCGCCG AGCGTGTGGC GCAAGGAGCT CTCCGGCATC 
GTTCACGGCC CGGCGACCCC GGTGTTCTGG AACATCGACA AGCAGGGCGA CTGA

Protein sequence

MFHPPRWMRS VVASKIAVPA FALAASLTLP AAVDAKTIRA VMHSDLRIID PGLTTAYITR 
DHGYMVYDTL LAMDSKFKVQ PQMADYKVSD DKLTYTFTLR DGLKWHDGTP VTAEDCVASL 
KRWGQKDGMG QKLMQFTASL EATDPKTITL KLKEPYALVL ESIGKPSSLV PFMMPKRIAE 
TPADKPIPEQ IGSGPFKFVA SEFQPGVKAV YVKNPDYIPR KEAPDWTSGG KVVKVDRVEW 
ITMPDAQTAV NALQSGDIDF IENPSFDLLP VLAQDKELTI DTLSPLGFQT LGRMNFLHPP 
FDNPKVRRAA FLAMSQKPVL DALVGNPKYY KICGAVFGCG TPLETDVGSE TLVKGNGMAE 
AKKLLAESGY DGTPIALMAP GDVVTLKAQP IVAAQLLRDA GFKVDVQATD WQTVVSRRAS 
QKPPSEGGWN MFFTNWAGPD ILNPVANVSV GGQGKKGGWF GWAEDAKVEE LRDKFVRANS 
PDEQKKIAEE IQKEVYEQVI YIPLGQYTAP SVWRKELSGI VHGPATPVFW NIDKQGD