Gene RPD_3684 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3684
Symbol
ID	4024200
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4111844
End bp	4113310
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	62%
IMG OID	637963889
Product	hypothetical protein
Protein accession	YP_570807
Protein GI	91978148
COG category	[S] Function unknown
COG ID	[COG5361] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0446196
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATGT TCGCGTCGAT GAAGGCGTTG GCACCAGCGG CAATAGCCGC GATGGCGGTC 
GGAACGCTCG GTCTGGAAAG CGCCACCGCC AAGGACAGAC TCGCAGCAGG CGAGGTCAAG 
GTGATCGCAG AGGAAGCGTT CGTCTACGGC TTTCCAATGG TGATGAGCTA CGCCATTTAT 
TACGAATCGT TCGTCGATAC CAAGTCCTCG CAATACAAGG CGCCGTTCAA TCAGCTGTAC 
AACACCGCGC GCGTTTATAC GCCGGCCGAT ACCGCGGTGG TGACGCCGAA CAGCGACACG 
CCGTATTCCT TCATCGGCAT GGACCTGCGC GCCGAACCGG TGGTCATCTG CAATCCGGAA 
ATCGAGAAAT CGCGCTACTT CTCCCTTCAA CTGATTGACA TGTACACTTT CAACTACGGT 
TACATGGGCA CCCGGACCAG CGGCAACGCC GCGCAATGCG CGCTCATCGC CGGGCCGCGC 
TGGAAGGGCA AGGCGCCGGA CGGCATTGCC AAGGTGTTTC GCAGCGAGAC CGAGTTTTCG 
CTCGGCTTGA TCCGGACCCA GTTGTTCAAC GGCGCGGATC TCGACAACGT TAAGAAAATT 
CAGGCCGGAT ACCGAGCGGT ACCACTGTCG AAATTCCTCG GGCGCGCCGC GCCCGCGGCC 
GCGCCGGCGG TCCAGTGGCC GATGATTGAC AAAGAGCTCG CGGCCAGGGA CCCGTTCACC 
TATCTGAATT TCCTGCTCAC CTTCACGCCG GCGACCGGGC CTGCGGCCGT CGAGGCGCCA 
ATGCGCGCGC GTTTTGCGAA GATCGGAATC CTGCCGGGCA AGCCGTTCAA CGTCAGGGCA 
TTGAGCGCTG CGCAGAAGGA AGAACTCGAG GCGGGGGTCA AGAGCGGGCT GGAGAAGATC 
AAGGCGACCA TCGACACGCT CGGCCGGGTC GAGAATGGTT GGCGCGTCGC CACCAGCGCA 
TTCGGCGATC GGGCGATGTA TGGCGCAGAT TTTGCGCGCC GCGCGGCGGC GGCGATGGCC 
GGCATTTACG GCAACGACGC CAGCGAGGCG CTTTATCCGA TGCTCGCCGC GGATAGCGAG 
GGTAAGAAGC CGGACACGGG CGTTGCCAAC TACGCTCTGA CGTTCCCGGC GGGATCGCTG 
CCGCCCACAA AGGCGTTCTG GTCGGTGACG ATGTATGACG GCAAGACGCA ACTCCTGATC 
GACAATCCGA TCAATCGATA TCTGATCAAC TCGCCGATGC TGCCCGACCT CAAGAAGAAC 
CCGGACGGCT CTCTGACGCT GTTACTGCAG AAAGAGTCCC CGGGGCCGGA CAAGACCTCG 
AACTGGCTGC CGGCGCCGAA CGGACCGGCT TACATCGTGA TGCGGATCTA TTGGCCGGAG 
CCGACAGCAT TGAATGGCGC GTGGAAACCG CCTGTGGTCC AGCCCGTCAA GCTGGAATCG 
AGCGCGAATC CTGCGAAGCC GGAATAG

Protein sequence

MKMFASMKAL APAAIAAMAV GTLGLESATA KDRLAAGEVK VIAEEAFVYG FPMVMSYAIY 
YESFVDTKSS QYKAPFNQLY NTARVYTPAD TAVVTPNSDT PYSFIGMDLR AEPVVICNPE 
IEKSRYFSLQ LIDMYTFNYG YMGTRTSGNA AQCALIAGPR WKGKAPDGIA KVFRSETEFS 
LGLIRTQLFN GADLDNVKKI QAGYRAVPLS KFLGRAAPAA APAVQWPMID KELAARDPFT 
YLNFLLTFTP ATGPAAVEAP MRARFAKIGI LPGKPFNVRA LSAAQKEELE AGVKSGLEKI 
KATIDTLGRV ENGWRVATSA FGDRAMYGAD FARRAAAAMA GIYGNDASEA LYPMLAADSE 
GKKPDTGVAN YALTFPAGSL PPTKAFWSVT MYDGKTQLLI DNPINRYLIN SPMLPDLKKN 
PDGSLTLLLQ KESPGPDKTS NWLPAPNGPA YIVMRIYWPE PTALNGAWKP PVVQPVKLES 
SANPAKPE