Gene RPD_1814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1814
Symbol
ID	4022296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2031157
End bp	2032137
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	65%
IMG OID	637962008
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_568951
Protein GI	91976292
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.443976
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGCAT TCACGCTCCG CCGGATGTTG CAGGCGATCG GGGTCATGAT CGTCGTCTGC 
GCGCTGTCCT TCGCGATGTT CCGCTTCGCC GGCGATCCGG TCAGCCAGAT CGTCTCGATC 
GACACCTCGA CGGCCGAGCG CGCCGAAATC CGCAAGTCGC TCGGGCTCGA CGACCCAGTG 
CTGCTGCAGT TCGGCCGCTA CTTCGTCAAC GCAGCGCAGT TCGACTTCGG CATGTCGTAT 
CGCTTCCGCG AGCCGGTCGC CAAGCTGCTG CTGGAGCGAA TGCCGGCGAC GCTGGAGCTC 
GCGACCTGCG CGACGGTGCT GGCGATGACG CTCGGCATTC TGCTCGGGGT CTACACCGCG 
CTCCGGCGCA ACTCCTGGCT GGCCACGCTG ATGCAGGCGG TCTCGCTGAT CGGCATCTCG 
CTGCCGACCT TCCTGATCGG CATCCTGCTG ATCTATCTGT TCGCGGTGGT GCTGGGCTGG 
CTGCCGTCCT ACGGCCGCGG CGAGACGGTT CGGTTCGGCT GGTGGACCAC CGGCCTGCTC 
ACCACATCCG GCCTCAAATC GCTGATCATG CCGTCGATCA CGCTCGGCCT GTTCCAGATG 
ACGCTGATCA TGCGGCTGGT GCGCGCCGAG ATGCTCGAAG TGCTGCGCAC CGACTACATC 
CGCTTCGCCC GCGCCCGCGG ACTGACCACC CGCGCCATCC ATTTCGGCCA TGCGCTGAAG 
AACACGCTGG TGCCGGTGAT CACCGTCGCC GGCCTGCAAT TCGGCTCGGT GATCGCCTTC 
GCGATCATCA CCGAGACGGT GTTCCAGTGG CCGGGCATGG GGCTGCTGTT CGTGCAGGCG 
GTGCAGAACG TCGATATTCC GATCATGGCG GCGTATCTGC TGGTGGTGTC GCTGATCTTC 
GTCACCATCA ATCTGGTGGT CGACATTCTC TACACGCTGG TCGATCCGCG GCTGCGCGCC 
AGCGCCGCAC GACGGACATA G

Protein sequence

MLAFTLRRML QAIGVMIVVC ALSFAMFRFA GDPVSQIVSI DTSTAERAEI RKSLGLDDPV 
LLQFGRYFVN AAQFDFGMSY RFREPVAKLL LERMPATLEL ATCATVLAMT LGILLGVYTA 
LRRNSWLATL MQAVSLIGIS LPTFLIGILL IYLFAVVLGW LPSYGRGETV RFGWWTTGLL 
TTSGLKSLIM PSITLGLFQM TLIMRLVRAE MLEVLRTDYI RFARARGLTT RAIHFGHALK 
NTLVPVITVA GLQFGSVIAF AIITETVFQW PGMGLLFVQA VQNVDIPIMA AYLLVVSLIF 
VTINLVVDIL YTLVDPRLRA SAARRT