Gene RPD_1116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1116
Symbol
ID	4021592
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1270021
End bp	1271262
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	64%
IMG OID	637961308
Product	hypothetical protein
Protein accession	YP_568255
Protein GI	91975596
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.048386
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACT TTGCCATCGC GGCCGCTCCC TCTTCCGTGA CGGCGCCGCG GCTGAGAGCG 
CTGCAGCTTG CCCTGCTGTG GTTCGTCGGC GCCAGCGGCG CGATCGTCTT CATCGAGCCC 
AGCCCTTATG AATTCGCGAT CCTGCTGTCT ATCATCGTGT TCCTGGCCTC CGGATTGCGG 
ATCACGCCCG TCCTGATCGT GCCGATCGGG CTGCTGATCG GCGTCGAGCT GGGCTACACC 
ATCGGCGCCG CCGATCTGCT CGGCGACACC ATCATCCTGA ACTGGCTGTT GACGTCGTGG 
TACATGGCGA TCACCGCGAT ATTCTTCGCG CTGGTTTCGT TGCAAGACAC CGGCGAGCGG 
ATCGAGGCGA TCGCCAAGGG CTATCTGGTC GGCGGCATCA TCGCATCGCT CGCGGGGATC 
GCCGGCTATT TCAACCTGAT CCCCGGCGCG GGAGATCTGC TGACCTACGC CGGACGCGCG 
CGCGGCACCT TCAAGGACCC CAACGTGCTC GGCGCGTTCC TGATCTTTCC GGCGATCTAC 
GCGCTGCAGC GGGTGATCGA AGGATCGTTC TGGAGCGCGG TGCGCAATGC GATCGCCTTC 
GGCATCATCG CGCTCGCGAT CTTCCTGGCC TTTTCGCGCG CGGCCTGGGG CACGCTGGCC 
GGCGCGTCGG TGCTGATGAT CGCGCTGACC TTCATCACCG CACCGACCCA GCAGAGACGA 
CTGCGGATCG TGGTGCTCGC TGCGCTCGCC GCGGCGATGC TGGTCGCGGC GATCGCCGTG 
TTGCTGTCGA TCGACCAGAT CGACGAGCTG TTCAGGCAAC GCGCCAGCCT GTCGCAGCCT 
TATGACAGCG GCAGGTTCGG CCGCTTCGGC CGGCATCTGC TCGGCGCCGG CATGGCGCTG 
GACTATCCGA CCGGGATCGG ACCGCTGCAA TTCCGCCGAT TCTTTCCCGA GGACACCCAC 
AATTCGTTCC TCAACGCCTT CATGTCAGGC GGCTGGATCA GCGGCATTCT GTATCCTGCT 
CTGGTGTTCA TCACCGCGGC CTACGGCCTC CGCAACGTCT TCGTCCGCAC GCCCTGGCAG 
CGGACCTATA TCGCGATCGT CGCGACGCTG ATCGTGACGC TGCTCGAGAG CTTCATTATC 
GATACCGATC ATTGGCGGCA CTATTTTATG CTGATCGGCT TGACCTGGGG CGCGGCAATT 
GCGAGCAGTC GAATCCGGTT TCAGAGCAAC GCAGCGCCCT GA

Protein sequence

MTDFAIAAAP SSVTAPRLRA LQLALLWFVG ASGAIVFIEP SPYEFAILLS IIVFLASGLR 
ITPVLIVPIG LLIGVELGYT IGAADLLGDT IILNWLLTSW YMAITAIFFA LVSLQDTGER 
IEAIAKGYLV GGIIASLAGI AGYFNLIPGA GDLLTYAGRA RGTFKDPNVL GAFLIFPAIY 
ALQRVIEGSF WSAVRNAIAF GIIALAIFLA FSRAAWGTLA GASVLMIALT FITAPTQQRR 
LRIVVLAALA AAMLVAAIAV LLSIDQIDEL FRQRASLSQP YDSGRFGRFG RHLLGAGMAL 
DYPTGIGPLQ FRRFFPEDTH NSFLNAFMSG GWISGILYPA LVFITAAYGL RNVFVRTPWQ 
RTYIAIVATL IVTLLESFII DTDHWRHYFM LIGLTWGAAI ASSRIRFQSN AAP