Gene RPC_2166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_2166
Symbol
ID	3971987
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	2358072
End bp	2359112
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	66%
IMG OID	637925274
Product	glycine oxidase ThiO
Protein accession	YP_532039
Protein GI	90423669
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID	[TIGR02352] glycine oxidase ThiO

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.402403
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACCAGA CCACGCAGTC TAAACGCGGG CCGTTGCCCG TTGATCTCCG CACAAATGCG 
CCGATTTCGG TGATCGGCGC CGGCATTGCC GGGGCCTGGC AGGCCTTGAT GCTGGCCCGC 
GCCGGACGCG ACGTGACGCT CTACGAGAGC GGCGATTCCG AAATGACCCA GGCCACCAGC 
CATTGGGCCG GCGGCATGCT GGCGCCGTGG TGCGAGGCCG AATCGGCCGA GCCGGTGATC 
AGCCGGATCG GCATGCGCTC GCTCGATATC TGGCGCGAGG AATTCCCCGA GACGCCGTTC 
AACGGCTCCT TGGTGGTGTC GCATCCGCGC GACCGCGCCG ACTACGAGCG CTTCGCCAAA 
TTGACCACCG GGCATCAGCG GCTCGACGCC AAGGGCGTCG CCGAACTGGA GCCGGCGCTG 
GAAGGCCGCT TCCGCGAAGG CCTGTTCTTC GCCGACGAAG GCCATGTCGA GCCGCGCGTG 
GTGCTCGCCA AATTGCACGA ACGGCTGATC GAGGCCGGCG GAACTATTCA CTTCATGTCG 
GCGCAGAATC CCGACGAGCT CGACGGCGTG GTGATCGATT GCCGCGGACT GTCCGCGCGC 
GATGCCGCCC CCGAACTGCG CGGCGTCAAG GGCGAGATGA TCGTTATCGA GTCCAAGGAC 
GTGCAATTGT CGCGCCCGGT GCGGCTGATG CATCCGCGCT GGCCGGTCTA TGTGATTCCG 
CGCCCCGACA ACGTGTTCAT GGTCGGCGCC ACCACCATCG AGAGCGAGGA CGAGGGCGTC 
AGCGTCCGCT CGGCGCTGGA ACTGTTGACC GCGGCCTACG CGCTGCATCC GGCGTTCGGT 
GAGGCGCGGA TTCTGGAATT CGGTTCCGGT CTGCGCCCGG CGTTCCCGGA CAATCTGCCG 
CGGATCTCGC TCGGCAACGG CCGCATCGCG GTCAATGGCC TGTATCGCCA CGGCTTCCTG 
CTGTCGCCGG CGCTCGCCGA GATGACGCTG GCCTATGTGC AGCGCGGGGT CATCAACAAC 
GAGGTGATGC AATGCGTGTG A

Protein sequence

MYQTTQSKRG PLPVDLRTNA PISVIGAGIA GAWQALMLAR AGRDVTLYES GDSEMTQATS 
HWAGGMLAPW CEAESAEPVI SRIGMRSLDI WREEFPETPF NGSLVVSHPR DRADYERFAK 
LTTGHQRLDA KGVAELEPAL EGRFREGLFF ADEGHVEPRV VLAKLHERLI EAGGTIHFMS 
AQNPDELDGV VIDCRGLSAR DAAPELRGVK GEMIVIESKD VQLSRPVRLM HPRWPVYVIP 
RPDNVFMVGA TTIESEDEGV SVRSALELLT AAYALHPAFG EARILEFGSG LRPAFPDNLP 
RISLGNGRIA VNGLYRHGFL LSPALAEMTL AYVQRGVINN EVMQCV