Gene RPD_0035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0035
Symbol
ID	4020489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	40554
End bp	41921
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	66%
IMG OID	637960211
Product	UBA/THIF-type NAD/FAD binding fold
Protein accession	YP_567176
Protein GI	91974517
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0476] Dinucleotide-utilizing enzymes involved in molybdopterin and thiamine biosynthesis family 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.292167
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAGG CCACGCAGCA GAATGCCATG ATGCTCGCTT CCCTGCTCGG CGTCGGCGAG 
GCGGAAGCCG GCGAACGCCT GGCGCGAACC GTACTGATCA CGGCGGCCCC GGGATGGAAA 
TCTGGCTGGG CCGTTGAGGT CGGCGAGCTT ATCGGTCGCA CCGTCCAGGT GTCGCACCAG 
CAGGAACCCA CCGATCCGGA CCTGGAGTTG GTGATCGGCG ATGTGACCCC GCGAACGTCG 
GCTCGGCGCG TGTATGCTGA CCTCGGCTCC GAAGGCGCGG CCGCTTCCCT CGAACCTGTC 
GCGAAGCTGG CCGGAGAGCC CCACGGTCTC TATGCGGCGG CCGCCGCTTG TGCGGTATCT 
GCCGTTGTAG TCCATGCCGT GATCGACGCG GCCGATCTGC CGCAGGCCCG ACTACCCATG 
CGGCTGGATT ACGCGCAGCT TGGCGTCCCG AATGGCGCCC TCGACCTACG GGTCGACGTA 
GGCCACGCCG TGATGGCGGG CGCCGGGGCC GTCGCCCATG CTTTTCTCAA GGCGGCCCGT 
CACATCGATA TTCACGGCGA TCTCGCGATT GTCGACCCCA AGGTGGTGCA AGGTGGCATC 
CTGAACCGCT GTCTCTACCT TGAGGACAAC GACGTCGACC GTCAGAAGGC CGAGGTCTTG 
GCGGAGCGCG CGCAACGCGA TTTCCCGCAT TTGCGGCTGC TGCCGTTCGT AACCGATTTC 
AAAGCGTACG TCCGTCAGCT TGGGCATCCC CCCGAGACCG TGTTCGTGAC GGTGGATAGC 
CGGCTCGTCC GGCGCTCGAT CCAACTCGAG GTGCCCCGGC GCATCATCGA CGCGTCGACG 
ACCGACGCCA GCGGCGTGAT CGTCCATTCG AACGTTCTTC CCACGCAGCA CGCCTGCCTC 
GCATGCATCT ATCGGCACGT TCCGGAGGAG CACGCCCGCG AACGATCGAT CGCGGAGGGG 
CTCGGCGTCG ATTTGGCCGA CGTTCAAGCC GGCCTGATCA CCGCCGAGGT GGCCCGACGG 
ATCGTGCGGA CGCACAAATC GATTGATGGC GATGCGATCG TCGGTCTGGC CTTCGACAGC 
CTGTTCCGGC AGCTGTGCTC TGAACAGGCG CTCGCCACGC CGGAAGGGCG GCAGGTCCTG 
GCACCATTTG CGTTCGTCTC CGCTTGGGCG GGCGTGATGA TGGCAGTGGA GATGCTGAGG 
TCGTTCGCCG GCGCCGCGAA GACCAACTAT TGGTCCGTCG ACCCTTGGAA TACGCCGAAG 
GCGCGGGGGC GGATGCTCCG CCAGCGACAC CCGGAGTGCC AATTCTGCTC GAAGCCCGAG 
TACGAACCGA TCATTCAGTC CCTGTGGGGA GAGCTCGCCG AGGCGTGA

Protein sequence

MNKATQQNAM MLASLLGVGE AEAGERLART VLITAAPGWK SGWAVEVGEL IGRTVQVSHQ 
QEPTDPDLEL VIGDVTPRTS ARRVYADLGS EGAAASLEPV AKLAGEPHGL YAAAAACAVS 
AVVVHAVIDA ADLPQARLPM RLDYAQLGVP NGALDLRVDV GHAVMAGAGA VAHAFLKAAR 
HIDIHGDLAI VDPKVVQGGI LNRCLYLEDN DVDRQKAEVL AERAQRDFPH LRLLPFVTDF 
KAYVRQLGHP PETVFVTVDS RLVRRSIQLE VPRRIIDAST TDASGVIVHS NVLPTQHACL 
ACIYRHVPEE HARERSIAEG LGVDLADVQA GLITAEVARR IVRTHKSIDG DAIVGLAFDS 
LFRQLCSEQA LATPEGRQVL APFAFVSAWA GVMMAVEMLR SFAGAAKTNY WSVDPWNTPK 
ARGRMLRQRH PECQFCSKPE YEPIIQSLWG ELAEA