Gene RPD_1120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1120
Symbol
ID	4021596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1274606
End bp	1275697
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	66%
IMG OID	637961312
Product	inner-membrane translocator
Protein accession	YP_568259
Protein GI	91975600
COG category	[R] General function prediction only
COG ID	[COG4603] ABC-type uncharacterized transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.016502
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATTCC TGCTTGAACG GCGCGCCGAG CGTTCGACGG CCATCGCGGC GCTGTCGCCG 
CTGATCGCGG TCGTGCTGAC GATCGTGACC ATGGCCGCCT TGTTCGCGGC GCTCGGCAAG 
GATCCGCTGG CGGCGCTGCA TGTGTACTTC GTTGCGCCCT GGACCGACGC CTATTCGCTG 
CAGGAGATTG CGGTCAAGGC GTCGCCGCTG GTGATGATCG CGGTCGGGCT TGCGCTGTGC 
TATCGCGCCA ATGTCTGGAA CATCGGCGCG GAAGGACAGC TCCTGATCGG CGCGGTGGCG 
GGAAGCTGGC TCGCGGTGAA AACGCACGGC GTCGAGACCG GGCCATGGCT GCTGCCCGCG 
ATGCTGCTGA TCGGCGCGGC CGCGGGCGCG CTCTATGCGC TGATTCCGGC GCTGTGCAAG 
GTGCGGTTCG GCGCCAGCGA AATCCTGATC AGCCTGATGC TGGTCTATAT CGCCGATTTC 
GCGCTCGACT ATCTGGTGCG CGGACCGTGG CGCGATCCGG CCGGCTTCAA CTTCCCGACC 
ACCGCCGAAT TCGACGCCGC CGCGACCATG CCGCTGCTGA TCGCGGGCAG CCGTCTGCAT 
GTCGGCGTGA TCCTCACCGT CCTGTTCGTG ATCGGCGCGG CGATCCTGCT CGGCAAGACG 
CTGAAGGGCT TCGAGATCCG CGTCGTCGGC GCGACGCCGC GCGCCGCGCG GTTCGGCGGC 
TTCAATGCCG ACCGGCTGGT TCTGTTCACC TTCGCAATCT CCGGGGCGCT GGCGGGGCTT 
GCCGGCATCA TCGAGGTCGC CGGCCCGATC GGCCATCTGC AGCCCGGGAT CTCGCCGGGT 
TACGGCTTCA CCGCGATCAT CGTGGCGTTT CTCGGCCGGC TCAATCCGAT CGCGATTCTC 
GCCGCGGGAT TGTTTCTGGC GCTGACGTTC ATCGGCGGCG AGCAGGCCCA GATCGCGATG 
AAGATCCCGC AGGACATGAC ACGGGTGATC CAGGGCATCC TGCTGTTCTA CGTGCTCGCC 
TGCGACTCGC TGATCCTGTA TCGGGTCCGG CTGATCGCGA CGCATCGAAA GGCCGGCGAT 
GGACATGTTT GA

Protein sequence

MQFLLERRAE RSTAIAALSP LIAVVLTIVT MAALFAALGK DPLAALHVYF VAPWTDAYSL 
QEIAVKASPL VMIAVGLALC YRANVWNIGA EGQLLIGAVA GSWLAVKTHG VETGPWLLPA 
MLLIGAAAGA LYALIPALCK VRFGASEILI SLMLVYIADF ALDYLVRGPW RDPAGFNFPT 
TAEFDAAATM PLLIAGSRLH VGVILTVLFV IGAAILLGKT LKGFEIRVVG ATPRAARFGG 
FNADRLVLFT FAISGALAGL AGIIEVAGPI GHLQPGISPG YGFTAIIVAF LGRLNPIAIL 
AAGLFLALTF IGGEQAQIAM KIPQDMTRVI QGILLFYVLA CDSLILYRVR LIATHRKAGD 
GHV