Gene RPC_3236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3236
Symbol
ID	3971902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	3582921
End bp	3583991
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	64%
IMG OID	637926347
Product	biotin synthase
Protein accession	YP_533097
Protein GI	90424727
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.267885
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAATACCA TCGATCTGCC GTCGCTGGCA CAAGCCACCC CGACCATCCG CCACGACTGG 
ACCCGCGAAG AAGCCGCCGC GATCTATTAC GCGCCGTTCA TGGATCTGAT GTTCCGGGCG 
GCGACTATCC ATCGCCAGAG CTTCGATCCC AACAAAGTGC AGTGCAATCA GCTGTTGAAC 
GTCAAGACCG GCGGCTGTGC CGAGGATTGC GGCTATTGCG GCCAATCTGC GCATCACCAC 
ACTGACCTGC CGGCCTCGAA GCTGATGGCC CCGGCCGACG TGATCGAAAG CGCCAAGGCG 
GCGAAGGCCG GCGGTGCGAC GCGCTACTGC ATGGGCGCGG CCTGGCGCTC GCCGAAGGAT 
CGCGACATGG CGCCGGTGAT CGAGATGGTC AAAGGCGTGA AAGCGCTCGG CATGGAAGCC 
TGCGTGACGC TCGGCATGCT GAGCGACGAC CAGGCCAAGC AACTCGCCGA CGCCGGGCTC 
GACTACTACA ACCACAACCT CGACACCTCG GAAGAATTCT ATCCTTCGGT GGTGAAAACG 
CGGACCTACG GCGATCGGCT GAATACCCTG CACAAGGTGC AGGACGCCGG CATCAAGGTG 
TGCTGCGGCG GCATCCTCGG CCTCGGCGAG AAGCCGACCG ATCGCGTCGA AATGCTGCGC 
ACGCTGGCCA ATTTGGCCAA ACATCCGGAG AGCGTGCCGA TCAACTTGCT GATCCCGATC 
GAAGGCACGC CGATTTCTCT GACCGCGACG CCGGTCGACC CGATCGCCTT CGTGCGCACC 
ATCGCGCTGG CACGGATCAT GATGCCATTG TCCGACGTCC GGCTCGCCGC CGGCCGCACC 
GCGATGTCCG ACGAGATGCA GACGCTGTGC TTCCTCGCCG GCGCCAATTC GATCTTCATC 
GGCGACACGC TGTTGACCAC GCCGAACCCC GGCGACAACA AAGATCGTAG CCTGTTCGAT 
CGGCTCGGCC TCGAGCCGCG CGACGATCAC GGCGTGCACG AGCACAGCTC GCACAGCCAC 
ACCCACGATC AGGGCCACGA TCACGGCCCG CACGGGCACA GCCACGGCTG A

Protein sequence

MNTIDLPSLA QATPTIRHDW TREEAAAIYY APFMDLMFRA ATIHRQSFDP NKVQCNQLLN 
VKTGGCAEDC GYCGQSAHHH TDLPASKLMA PADVIESAKA AKAGGATRYC MGAAWRSPKD 
RDMAPVIEMV KGVKALGMEA CVTLGMLSDD QAKQLADAGL DYYNHNLDTS EEFYPSVVKT 
RTYGDRLNTL HKVQDAGIKV CCGGILGLGE KPTDRVEMLR TLANLAKHPE SVPINLLIPI 
EGTPISLTAT PVDPIAFVRT IALARIMMPL SDVRLAAGRT AMSDEMQTLC FLAGANSIFI 
GDTLLTTPNP GDNKDRSLFD RLGLEPRDDH GVHEHSSHSH THDQGHDHGP HGHSHG