Gene RPD_1353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1353
Symbol
ID	4021830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1524114
End bp	1525250
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	64%
IMG OID	637961546
Product	hypothetical protein
Protein accession	YP_568492
Protein GI	91975833
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0767] ABC-type transport system involved in resistance to organic solvents, permease component
TIGRFAM ID	[TIGR00056] conserved hypothetical integral membrane protein

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATTTCTG CGCCAGTTCT GACTGTAGTG ACCGACGGCG ACGTGCTGGA ACTGCATCCC 
GGCGGCGCGT GGATCGCCAG CCAATCGGCC GCGCTGGAAC GGCTGTTCGA GGGCGTCGCG 
CCGCAGGTCG CCGCTGCAAA ATCACTCAAG ATCGACATGA CCGAGGTGAT CGAGATCGAC 
ACCATCGGCG CTTGGCTGCT GGAGAAGGCG TCACGCGAGG CCGCGCAGGC TGGTCGCACC 
GCGCATTTCG TCGGGGTCGG CGAACGCTAC GCCGGGTTGA TCGAAGAGGT CCGGCAAGTC 
AACCGCCACA GACCGACGCC GAAACCCAAG GTCAATCCGA TCATCGCGCG ACTCGATCAG 
GTCGGTCGCT CAGCCTGGAG CGCCACGCAG GACATCGCGG TATTCCTCGA CATGTTCGGT 
GCGCTCGGCG TCGCGTTGCT CGGCGTGCTG CGGCGGCCGC GTTCGCTGCG GCTGACCTCG 
TTGACCTACC AGATCTATCG CGTCGGCTGG CGGGCGATCC CGATCGTCGT GCTGATCACC 
TTCTTGATCG GCGCGATCAT CGCGCAGCAG GGCATTTTCC ACTTCCGCAA ATTTGGTGCG 
GAATCCTACG TGGTCGACAT GGTCGGCATC CTGGTGTTGC GCGAGATCGG CGTTCTGATC 
GTCGCCATCA TGGTCGCCGG CCGCTCGGGC AGCGCCTACA CGGCCGAACT CGGCTCGATG 
AAAATGCGCG AGGAGATCGA CGCGCTATCG ACCATGGGGC TCGACCCGGT CGAGGTGCTG 
ATCCTGCCAC GCATCATCGC GCTGGTGATC GCGCTGCCGA TCCTGACCTT CATTGGATCG 
ATGTCGGCGC TGTACGGCGG ATTGCTGACC GCGTGGTTCT ACGGCGGCAT GCAGCCCGCG 
GTATACATCG CGCGGTTGCA CGAGGCGGTG TCGCTCAACA GTTTCGAGGT CGGGATCTGG 
AAGGCGCCGT TCATGGCGCT GGTGATCGGC ATCGTCGCCT GCAGCGAGGG CCTGCGGGTC 
AAGGGCAGCG CCGAGTCGCT CGGCCTGCAG ACCACCACTT CGGTGGTGAA GTCGATCTTT 
CTGGTGATCG TGCTCGATGG CCTGTTCGCT GTATTCTTCG CCTCGATCGG GTTGTAG

Protein sequence

MISAPVLTVV TDGDVLELHP GGAWIASQSA ALERLFEGVA PQVAAAKSLK IDMTEVIEID 
TIGAWLLEKA SREAAQAGRT AHFVGVGERY AGLIEEVRQV NRHRPTPKPK VNPIIARLDQ 
VGRSAWSATQ DIAVFLDMFG ALGVALLGVL RRPRSLRLTS LTYQIYRVGW RAIPIVVLIT 
FLIGAIIAQQ GIFHFRKFGA ESYVVDMVGI LVLREIGVLI VAIMVAGRSG SAYTAELGSM 
KMREEIDALS TMGLDPVEVL ILPRIIALVI ALPILTFIGS MSALYGGLLT AWFYGGMQPA 
VYIARLHEAV SLNSFEVGIW KAPFMALVIG IVACSEGLRV KGSAESLGLQ TTTSVVKSIF 
LVIVLDGLFA VFFASIGL