Gene Rru_A2981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A2981
Symbol
ID	3836426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	3432473
End bp	3433426
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	66%
IMG OID	637827095
Product	2-desacetyl-2-hydroxyethyl bacteriochlorophyllide
Protein accession	YP_428063
Protein GI	83594311
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.383171
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACACCC TCGCCGTCGT CATCCAAGAA CCCGAGCGTC TGACGCTCAG CCGGCTGGAT 
CTCACCGATC CGGCGCCTGG CGACGTGGTC GTGGATGTCG AATGGAGCGG GATCAGCACC 
GGAACCGAAC GGTTGCTGTG GTCGGGGCGG ATGCCGCCCT TCCCGGGGAT GGGATATCCG 
TTGGTGCCTG GATACGAGTC GGTCGGTCGG GTGATCGCCG TTGGGTCGCA GGCGCGGGCC 
AAGGTGGGGA CGCAGGTCGG TGATCGGGTG TTCGTTCCCG GTGCGCGGTG TTATGGCGCG 
GTGAACGGCC TGTTCGGTGG CGCCGCGTCG CGGGTGGTTG TGCCCGCCGA TCGGGTGGTC 
GCCCTTCCCG AGGGGTTGGA CGACAAGGGT GTGTTGTTGG CGCTGACGGC CACGGCCTAC 
CACGCCATGG TCATCGCCGG GGATCTCCGG CCCGAGTTGA TCGTCGGTCA CGGCGTCCTC 
GGTCGGTTGC TCGCCCGGCT GGTGGTCGGG GTCGGCGGTA CGGCGCCGAC GGTTTGGGAG 
CGTAATCCGC AGCGTCGGAG CGGGGCGATC GGTTATGCGG TCGTCGATCC GGCGGAGGAT 
CCGCGTAAGG ATTATCGCTG CATTTGTGAT GTCAGCGGCG ACGCGACGAT CCTTGATACC 
CTGGTGGCGC GCTTGGCGCG TGGCGGTGAG ATCGTTCTGG CGGGGTTCTA TGAATCGGCC 
CTGTCGTTCA CTTTCCCGCC GGCTTTCATG CGCGAAGCCA GGATCCGTGT GGCGGCCGAA 
TGGCGGCCCG AAGATTTGGC GGCGGTGATC GACATGATCG TTGATGGGCG GATGTCGCTC 
GATGGTCTGA TCACCCACCG CGAGGAGGCC CCGCAGGCCG CCTCGGCTTA TCGGACGGCG 
TTCACCGACC CGTCTTGTCT GAAGATGGTT TTGGATTGGA GAGCTTGCTC ATGA

Protein sequence

MDTLAVVIQE PERLTLSRLD LTDPAPGDVV VDVEWSGIST GTERLLWSGR MPPFPGMGYP 
LVPGYESVGR VIAVGSQARA KVGTQVGDRV FVPGARCYGA VNGLFGGAAS RVVVPADRVV 
ALPEGLDDKG VLLALTATAY HAMVIAGDLR PELIVGHGVL GRLLARLVVG VGGTAPTVWE 
RNPQRRSGAI GYAVVDPAED PRKDYRCICD VSGDATILDT LVARLARGGE IVLAGFYESA 
LSFTFPPAFM REARIRVAAE WRPEDLAAVI DMIVDGRMSL DGLITHREEA PQAASAYRTA 
FTDPSCLKMV LDWRACS