Gene RPD_3357 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3357
Symbol
ID	4023868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3721295
End bp	3722809
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	64%
IMG OID	637963562
Product	hypothetical protein
Protein accession	YP_570482
Protein GI	91977823
COG category	[S] Function unknown
COG ID	[COG3333] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0972974
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00431658
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTTGATC TGTTCTCCAA TCTCGCGCTC GGCTTCCAGG TCGCCGCCTC GCCGATGAAT 
CTGGGACTGT GCCTGGTCGG CGCGCTGGTC GGCACGCTGG TCGGGGTGCT GCCGGGGATC 
GGCACCATCG CCACTGTGGC GATGCTGTTG CCGATCACCT TCGGTCTGCC GCCGATCGGC 
GCGCTGATCA TGCTCGCCGG TATCTACTAC GGCGCGCAGT ATGGCGGCTC GACGACCTCC 
ATCCTCGTCA ATATTCCGGG CGAGGCGACG TCGGTGGTGA CTACGCTCGA CGGTTTTCAG 
ATGGCGAAGC AGGGACGCGC GGGGCCGGCG TTGGCGATCG CGGCGATCGG CTCGTTTGTA 
GCCGGTTGTT TCGCGACCGT GCTGATCGCG ATCCTCGGCG CGCCGCTGAC CAAGGTCGCG 
CTGGCGTTCG GTCCTGCCGA ATATTTCTCG CTGATGGTGC TCGGCCTGAT CTTCGCGGTC 
GTGCTGGCGA AAGGCTCGGT GCTGAAGGCG ATCATCATGA TCGTGTTCGG CTTGCTGCTG 
TCGATGGTCG GTTCCGACCT CGAAACCGGC GCATCGCGGA TGACCTTCGG CATTCCCGAA 
CTCGCCGATG GGCTCGGCTT CGCGACCGTG GCGATGGGCG TGTTCGGCTT CGCCGAGATC 
ATTCGCAACC TCGATGCAGG TTCGGAGTCC GACCGCCAAC TGGTGCAGCA GAAGATCACC 
GGTCTGATGC CGACCAAAAA GGATCTGGTC GACTCGGCGC CCGCCATCGC GCGCGGGACG 
ATGCTCGGTT CGATCCTCGG CATCCTGCCG GGCGGTGGCG CGGTGATCGC CTCCTTCGCG 
GCCTATACGC TGGAGAAGAA GATCTCGCGG ACGCCGGAAC GCTTCGGCCG CGGCGCGATC 
GAAGGCGTCG CGGCGCCGGA AAGCGCCAAC AATGCTGCTG CGCAGACCTC GTTCATCCCG 
TTGCTCACGC TCGGCATTCC GCCGAATGCG GTGATGGCGC TGATGGTCGG CGCGATGACC 
ATCCACGGCA TCGTCCCGGG CCCGCAGGTG ATGCAGAAAC AGCCCGAACT CGTGTGGGGC 
ATGATCGCCT CGATGTGGAT CGGAAATTTG ATGCTGCTGA TCATCAATCT ACCGATGGTC 
GGGATCTGGG TCCGGTTGTT GCGCGTGCCT TATCGGCTGA TGTTTCCGGC AATTGTGGTG 
TTTTGCGCGA TCGGGATCTA CTCGGTGAAC AACGCCCCCA CCGACGTTGT CCTCGCCGGC 
ATCTTCGGGT TGATCGGCTA TTGGCTGGTC AAACACGATT TCGAACCGGC GCCGCTGCTG 
CTCGGCATGG TGCTGGGTCC GTTGATGGAA GAGAATCTCC GCCGCGCACT GCTGATTTCG 
CGCGGCGACG CTTCGGTGTT TGTTAGCCGG CCGCTGTCGG CGACGCTGCT CGCCATCGCG 
GCGGGGCTAT TGATACTCGC GGTGCTTCCG TCCCTCCGGC GAAAGCGCGA GGAGGTTTTC 
GTCGAATCCG ATTGA

Protein sequence

MLDLFSNLAL GFQVAASPMN LGLCLVGALV GTLVGVLPGI GTIATVAMLL PITFGLPPIG 
ALIMLAGIYY GAQYGGSTTS ILVNIPGEAT SVVTTLDGFQ MAKQGRAGPA LAIAAIGSFV 
AGCFATVLIA ILGAPLTKVA LAFGPAEYFS LMVLGLIFAV VLAKGSVLKA IIMIVFGLLL 
SMVGSDLETG ASRMTFGIPE LADGLGFATV AMGVFGFAEI IRNLDAGSES DRQLVQQKIT 
GLMPTKKDLV DSAPAIARGT MLGSILGILP GGGAVIASFA AYTLEKKISR TPERFGRGAI 
EGVAAPESAN NAAAQTSFIP LLTLGIPPNA VMALMVGAMT IHGIVPGPQV MQKQPELVWG 
MIASMWIGNL MLLIINLPMV GIWVRLLRVP YRLMFPAIVV FCAIGIYSVN NAPTDVVLAG 
IFGLIGYWLV KHDFEPAPLL LGMVLGPLME ENLRRALLIS RGDASVFVSR PLSATLLAIA 
AGLLILAVLP SLRRKREEVF VESD