Gene RPD_1669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1669
Symbol
ID	4022149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1884126
End bp	1885733
Gene Length	1608 bp
Protein Length	535 aa
Translation table	11
GC content	66%
IMG OID	637961864
Product	hypothetical protein
Protein accession	YP_568807
Protein GI	91976148
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.118231
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATCG ATGGCGTAAG TGGGCGTACT TCCTACATCG GCTCCGGAAT TCTCAATCTC 
CGCAGTCAAC TCGACAACCT GAGCCAGCAG CTTTCGAGCG GGCGGATCTC GTCGACCTAT 
GCCGGCGACG GCACTGGCCG CACGTTGGCG ATCGGGATGC GCGAGCAGTT GGCGAACATC 
TCCAGCTATT CCGACACGAT GGTCAACATC AACACCCGTA TCGGCGTCGC CAATCTGTCG 
CTGCAGCGGC TGAACGCCAT CGGCAGCGAG GTCAAGGGCG CGGCTGCGAG CGCCGGCTCG 
ACGCTCGACA ACACCGGGCA GACGCCGGGC CAAAAGACGG CCGGGCTCGA CTTTTTCGAT 
TCCGTGGACA TGCTGAATGC GCAGACCGGG GACCGCTATC TGTTCTCCGG GCGCGCCACC 
GACACCGCGC CGGTGACGGC TGCCGACCAG ATCATGAACG GCAACGGCGC CGGCATCGCC 
GGGCTGAAGC AGGTCGTCAG CGAGCGCCAC GATGCCGATG TCGGCACTAA CGGCATGGGA 
CGCACGATCA TCTCCGCCGG CGCGACGCCG ACCTCGGTGC AGATCGGCGA GGATTTCGCC 
GCCAATCCCT TTGCGCTGCC GACGCCGATC GGCGCTTCGC CGTTCGGACT GAAGATCGCA 
TCGATTGCCA CCACGATCGT CGGCGCCACG GTGACCCAGC CGATCGAGAC GCCGCCGACC 
ACGCCGCCGG CCGCGCCCAA TCCGGTGGCG ATGGGGATCG ATCTCGGCGC CACCATTCCG 
AAGAATGGCG ACACCGTCTC GTTCACGTTC AACATGCCGG ACGGAACCCA GGAGACACTC 
AAGCTGACCG CGTCGTCGCA GACGCCGTTG CCCGCGAATA GCTTCGCGAT CGATCCGGGC 
GACCCGTTGG CGGTGCCGCC GGTGCCGGCC TCGCCGTCGA TCACCGCCGC GAACATGCAA 
TCCGCGCTGA CGGACGCGGT GAAGAAATTG TCAGGCAGCG CGCTGTCGGC CGCGTCGGCG 
ATCAAGGCCG GCGACGACTT CTTCAACAAG ACGCCGCCTC TGCGCGTCGC CGGCACAGCG 
CCGTTCGGCA ACGCTACCGC GCAGGTCGTC GCAACCAAAG CCGACACCGT GTTCTGGTAC 
AATGGCGAGC CGGACTCGCC GAGCGATCCG GCGCGCGGCA CCGCGATCGG CCGGGTCGAC 
GATTCGATCA CTGTCCAGTA TGGCGCCCGC GCCGACGAGC AGGCGCTGCG CAAGCAGTTG 
CAGACCGTCG CGGTGTTCGC GGCGGTCACC ACCTCGGCGA CCGATCCTTA CGGCTCCGAC 
AAGATGGCCG CGCTCAACCA GAGGGTGGCG GCGAATCTCG CGACCGAGCC GGGCCAGCAA 
TCGATCCAGA ACATCCAGGC CGACCTTGCC GGCTCGCAGG CGGCGATGAA GGCCACCAAA 
GATCGCCAGA CCCAGACCAA GGCGCTGGCG CAGACGATGC TCGACTCGAT CGAGGGCGTG 
AACAACGACG AGGTCGCGAC CAAGCTTCTG GCGCTGCAGA CCAGTCTGCA GGCGTCGTAT 
CAGGTGACTT CGCAGCTCTA CCAAATGAGC CTCGTCAAGT TTCTTTAG

Protein sequence

MAIDGVSGRT SYIGSGILNL RSQLDNLSQQ LSSGRISSTY AGDGTGRTLA IGMREQLANI 
SSYSDTMVNI NTRIGVANLS LQRLNAIGSE VKGAAASAGS TLDNTGQTPG QKTAGLDFFD 
SVDMLNAQTG DRYLFSGRAT DTAPVTAADQ IMNGNGAGIA GLKQVVSERH DADVGTNGMG 
RTIISAGATP TSVQIGEDFA ANPFALPTPI GASPFGLKIA SIATTIVGAT VTQPIETPPT 
TPPAAPNPVA MGIDLGATIP KNGDTVSFTF NMPDGTQETL KLTASSQTPL PANSFAIDPG 
DPLAVPPVPA SPSITAANMQ SALTDAVKKL SGSALSAASA IKAGDDFFNK TPPLRVAGTA 
PFGNATAQVV ATKADTVFWY NGEPDSPSDP ARGTAIGRVD DSITVQYGAR ADEQALRKQL 
QTVAVFAAVT TSATDPYGSD KMAALNQRVA ANLATEPGQQ SIQNIQADLA GSQAAMKATK 
DRQTQTKALA QTMLDSIEGV NNDEVATKLL ALQTSLQASY QVTSQLYQMS LVKFL