Gene RPD_4143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4143
Symbol
ID	4024665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4613007
End bp	4614044
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	69%
IMG OID	637964351
Product	hypothetical protein
Protein accession	YP_571263
Protein GI	91978604
COG category	[S] Function unknown
COG ID	[COG1729] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR02795] tol-pal system protein YbgF

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCAG TCACCGCCGC CTCTGCGCGT AGCCTCGCGG TCTTCGCGAT GCTCGCTCTC 
GCCGCCCCCG CGCTGGCCCA GCAATATGGC GGCGAGGTCG ATCCGGAGAT CCGGGTCCAG 
CAGCTCGAAG AGCGGCTGCG CGCGCTTACC GGTCAGAACG AGGAGCTGCA ATTCCGCAAT 
CGCCGGCTCG AAGATCAGCT TCGGCAATTG CAGGGCAATG CCGGGGGGCA AAGCGCGCCC 
GGCAATGCGG CCGCCGCTCC GCCGCCAGCC GCTTCGCAGC AGCAGCCAGT CTACAACCAG 
TCGCCGCAAC AGTCGCCGGG TTATGGCCAG CAGCCGCCAG GCCAGGTCTA CGGTCAGCAA 
CCGCAGCCGC AGGCGCCGAT CGTGCAGGAC CAGGCCGCCG CGCCGCCGCC CTCGGGCCGC 
CGTCGCGGCG ATGCCTTCGA TCCGAGCCAG AATCCGCAGG CCCCTGGCGT CCCGCGCGCG 
CTGGGCGGCG GTCAGCTCCC GATCCCGTCC GAGCAGGGCG GCAATCTGCC CGGCCGTGAC 
CCCGGCGCGC CGATCGACCT CTCCAACGCC AATTCCGGGC GCTATCCCGA CGCCGGCGCG 
CAGCAGGCGC CGCGTGGTCC GGCCGGCGGA GGGCTCGCCA CGTTGCCGCC GTCGGCAACG 
CCGCGCGACG AGTTCGACCT CGGTATCGGC TACATGCAGC GTCGCGACTA CGCGCTCGCC 
GAAGAGACGA TGCGCAACTT CGCGACGAAA TACCCGAATG ACGCGCTGAC GCCGGATTCG 
CAATATTGGC TCGGCGAGAG CTACTTCCAG CGCCAGATGT ATCGCGACTC TGCGGAAGCC 
TTCCTTGCGG TGACCAGCAA ATACGACAAG TCGGCCAAGG CGCCTGATGC GCTGTTAAGG 
CTCGGCCAGT CGCTGTCGGC GCTGAAGGAG AAGGAAGCCG CCTGCGCCGC GCTCGGCGAG 
ATCGGCCGCA AATATCCGAA GGCTTCGGCC GGCGTGAAGA AGGCGGTCGA CACCGAGCAG 
AAGAAGCTGA AATGCTAG

Protein sequence

MSSVTAASAR SLAVFAMLAL AAPALAQQYG GEVDPEIRVQ QLEERLRALT GQNEELQFRN 
RRLEDQLRQL QGNAGGQSAP GNAAAAPPPA ASQQQPVYNQ SPQQSPGYGQ QPPGQVYGQQ 
PQPQAPIVQD QAAAPPPSGR RRGDAFDPSQ NPQAPGVPRA LGGGQLPIPS EQGGNLPGRD 
PGAPIDLSNA NSGRYPDAGA QQAPRGPAGG GLATLPPSAT PRDEFDLGIG YMQRRDYALA 
EETMRNFATK YPNDALTPDS QYWLGESYFQ RQMYRDSAEA FLAVTSKYDK SAKAPDALLR 
LGQSLSALKE KEAACAALGE IGRKYPKASA GVKKAVDTEQ KKLKC