Gene RPD_2111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2111
Symbol
ID	4022593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2362055
End bp	2363083
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	66%
IMG OID	637962304
Product	biotin synthase
Protein accession	YP_569247
Protein GI	91976588
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAATTCGA TCGATCTGCC GTCTTTGGCC CAAGCTCTCG CCGATTCCAC CCCGACCATC 
CGCCACAACT GGACGCGCGA GGAAGCCGCC GCGATCTATC ACGCGCCGTT CGCGGATTTG 
ATCTTCCGGG CGCAGACCAT CCACCGCCAG AGCTTCGACG CCAATGCGGT GCAGTGCAAT 
CAGCTGCTCA ACGTCAAGAC CGGCGGCTGC GCCGAGGACT GCGGCTATTG CAGCCAGTCG 
TCGCATCACG ACACCGCCCT ACCCGCCTCC AAGCTGATGG ACCCGGCCAA GGTGATCGAG 
GGCGCCAAAG CGGCGCGCGA CGCCGGCGCA ACGCGCTATT GCATGGGCGC GGCGTGGCGC 
TCGCCGAAGG ACCGCGACAT GGCGCCGGTG ATCGAGATGG TGAAGGGCGT CAAGGCGCTC 
GGGATGGAAG CCTGCATGAC GCTCGGGATG CTGACCGATG ATCAGGCAAA GCAACTCGCC 
GACGCCGGCC TCGACTACTA CAACCACAAC ATCGACACGT CCGAGGAGTT CTACTCGTCG 
GTGGTCAAGA CCCGCAGCTT CGGCGACCGA CTCGAGACGC TGGAGAAGGT GCAGGACGCC 
GGCATCAAAG TGTGCTGCGG CGGCATTCTC GGCCTCGGCG AAAAGCCGAC CGACCGCGTC 
GAGATGCTGC GCACCCTCGC CAACCTGCCG CAGCATCCGG AGAGCGTGCC GATCAACATG 
CTGATCCCGA TCGAAGGCAC GCCGATCGCG GCGACCGCCA CGCCGGTCGA TCCGTTCGAA 
TTCGTCCGCA CCATCGCGTT GGCGCGGATC ATGATGCCGA AGTCCGATGT CCGCCTCGCC 
GCCGGCCGCA CCGCGATGAG CGACGAGATG CAGGCGCTGT GCTTCCTCGC CGGCGCCAAT 
TCGATCTTCA TCGGCGACAC CCTGCTGACC ACGCCGAACC CCGGCGACAG CAAGGACCGT 
GCGCTGTTCG CCAGACTCGG CATCACCCCG CGCGACGACC TCGGCGTTCA CGCCCACGGT 
AACGCGTAG

Protein sequence

MNSIDLPSLA QALADSTPTI RHNWTREEAA AIYHAPFADL IFRAQTIHRQ SFDANAVQCN 
QLLNVKTGGC AEDCGYCSQS SHHDTALPAS KLMDPAKVIE GAKAARDAGA TRYCMGAAWR 
SPKDRDMAPV IEMVKGVKAL GMEACMTLGM LTDDQAKQLA DAGLDYYNHN IDTSEEFYSS 
VVKTRSFGDR LETLEKVQDA GIKVCCGGIL GLGEKPTDRV EMLRTLANLP QHPESVPINM 
LIPIEGTPIA ATATPVDPFE FVRTIALARI MMPKSDVRLA AGRTAMSDEM QALCFLAGAN 
SIFIGDTLLT TPNPGDSKDR ALFARLGITP RDDLGVHAHG NA