Gene Rsph17029_2250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2250
Symbol
ID	4896738
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2383628
End bp	2384674
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	74%
IMG OID	640112844
Product	UBA/THIF-type NAD/FAD binding protein
Protein accession	YP_001044125
Protein GI	126463011
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0476] Dinucleotide-utilizing enzymes involved in molybdopterin and thiamine biosynthesis family 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0655249
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.413698
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGCGC TGGTTCTTCT GGCCGTGGTG CTCTGGGGGC TGGGCTGGGC CTTCGGCGTG 
CCGGGACGTC TCCGGCTGCT GATGCTGGCC TGTCTCTGGT TCGCGGTGGT GCTGGCCCAT 
CTGCTGCTGC CCGAGGCCCA TCCCTTGCGG GCGGCCACCG GCGGCCGCGC CGAGCCCTGG 
CTGGTGCTGG GCGGGGTTGC GGTGCTGGGG CTGGGCTACC GGCTGGCGCT CGGGGCCCTG 
CGGCGGCGCG CGGCACCCGT TCGGCCGGCC GCGGCGCCGG GCGCCTTCCG GCCGGCCGAG 
CTCGAGCGCT ATGCGCGCCA TATCCTGCTG CGCGAGGTGG GGGGGCCGGG ACAGAAGCGG 
CTGAAGCAGG CGCGCGTGCT GGTGGTGGGC GCCGGGGGGC TGGGCTCGCC CGCCCTGCTC 
TATCTCGCGG CGTCGGGAGT GGGGACGGTG GGGGTGATCG ATGCCGACCA GGTCGAGGCC 
TCGAACCTGC AGCGGCAGGT GATCCATACC GATGCGCGGA TCGGCTGGCC CAAGGTCCAT 
TCCGCGGCCG AGGCGATGCG GGCGCTCAAC CCCTTCATCG AGGTGCGGCC CTACGAGCGT 
CGGCTGACCG AGGAGAATGC GGCGGCACTG CTGGCCGACT ATGACCTGAT CCTCGACGGG 
ACCGACAATT TCGACACGCG CTATCTCGTC AACCGGGTGG CGGTGGCGGC GGGCAAGCCG 
CTCATCGCGG GCGCCATCGC GCAGTGGGAA GGGCAGGTGA GCCTCTACCA TCCGGCGGCG 
GGCGGGCCCT GCTTCCAGTG CACCTTCCCC GAGCGGCCGG CGCCGGGCCT CGTGCCCACC 
TGCGCCGAGG CGGGTGTGAT CGCGCCGCTG CCGGGCGTGG TGGGCTCGAT CATGGCGGTC 
GAGGCGGTGA AGCATCTGAC CGGCGCGGGA GCCACGCTGC GCGGTGCGCT GCTGATCTAC 
GATGCACTCT GGGGCGAGAC GCGGCGGATC GGGCTGAAGC CGCGCCCCGG CTGCTCGGTC 
TGCGGCGGCG CGGGCAAGGC CGGCTGA

Protein sequence

MLALVLLAVV LWGLGWAFGV PGRLRLLMLA CLWFAVVLAH LLLPEAHPLR AATGGRAEPW 
LVLGGVAVLG LGYRLALGAL RRRAAPVRPA AAPGAFRPAE LERYARHILL REVGGPGQKR 
LKQARVLVVG AGGLGSPALL YLAASGVGTV GVIDADQVEA SNLQRQVIHT DARIGWPKVH 
SAAEAMRALN PFIEVRPYER RLTEENAAAL LADYDLILDG TDNFDTRYLV NRVAVAAGKP 
LIAGAIAQWE GQVSLYHPAA GGPCFQCTFP ERPAPGLVPT CAEAGVIAPL PGVVGSIMAV 
EAVKHLTGAG ATLRGALLIY DALWGETRRI GLKPRPGCSV CGGAGKAG