Gene Pnap_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_0020
Symbol
ID	4687095
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	+
Start bp	18854
End bp	19921
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	70%
IMG OID	639833014
Product	glycine oxidase ThiO
Protein accession	YP_980267
Protein GI	121602938
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID	[TIGR02352] glycine oxidase ThiO

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.504997
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTCAC CCATGAACTC CCTTCACATC GGCATTGCCG GCGCCGGCCT GGCCGGCCGC 
ACGCTGGCCT GGCGGCTGCT GCGCGCGGGC TGCCGCGTCA CTTTGTTCGA TTCGCGCCAG 
CGCGCCGAAC TGGACACCGC TTCGATGACC GCAGCGGCCA TGCTGTCGCC GCTGGCCGAA 
CTGTCGGTAT CAGACGAAGT GGTGTTTCAG TTGGGCCGGC GCTCGATGGA GTTATGGCCG 
CGCTGGGTCG CCGAACTGGC CGAGGGCGGC GGCGAGCCAG TGTATTTCCG CCAGAAAGGC 
ACGCTGGTCG TGGCGCACGC GCCTGACCAG AGTTCGCTCG ACCACTTCAG CGGCCTGTTG 
CACCACCGGC TGCCCGAGGC CTGCCGCGCC GAGGTGCACA CGCTGGACGC GGCCGCGCTG 
GCGCAGCGCG AGCCGGCGCT GGCCGGGCGC TTTGGCGGCG GCCTGTTCCT GGAGAGCGAA 
GGCCAGCTGG CCAATGACCA GTGGATGGCC GTGCTGGGCC GGGAGATCGA CCGGCTCGGC 
GTGACCTGGC ATGAAGGCCA GGCGGTTGAC CGGGTGGAAG AGGGGCGCAT CATTTGCGCC 
AGCGGCGAAT ACGCAGTGGA TGTGGCGGTC GATGCGCGCG GCGTGGGCAG CAAGGCGCAG 
TGGCCGCAGC TACGCGGCGT GCGCGGCGAG GTGCTGCGCG TCGAATGCCA CGGCGTGACT 
TTGCAGCGCC CGGTGCGGCT GATGCATCCG CGCTACGCGC TCTACGTCGC GCCCCGGCCC 
GACCACCAGT TCGTCGTCGG CGCGACCGAA CTCGAATCGG AAGACACCGG CCCGGTCACG 
CTGCGTTCAA CGCTGGAGCT GGGCAGCGCG CTGTACAGCC TGCACCCGGC CTTTGGCGAG 
GCGCGCGTGC TGCGGCTGTC GGCCGCGCTG CGTCCGGCGC TGGACGACCA CCGGCCGGCC 
GTGGCGCTGC GCGATGGCGT GTGGCACATC AACGGCCTGT ACCGGCATGG CTATTTGTGC 
GCGCCGGCGG TGGTCGATGA ACTGGCCCAT AAACTGTTGG CAACATGA

Protein sequence

MHSPMNSLHI GIAGAGLAGR TLAWRLLRAG CRVTLFDSRQ RAELDTASMT AAAMLSPLAE 
LSVSDEVVFQ LGRRSMELWP RWVAELAEGG GEPVYFRQKG TLVVAHAPDQ SSLDHFSGLL 
HHRLPEACRA EVHTLDAAAL AQREPALAGR FGGGLFLESE GQLANDQWMA VLGREIDRLG 
VTWHEGQAVD RVEEGRIICA SGEYAVDVAV DARGVGSKAQ WPQLRGVRGE VLRVECHGVT 
LQRPVRLMHP RYALYVAPRP DHQFVVGATE LESEDTGPVT LRSTLELGSA LYSLHPAFGE 
ARVLRLSAAL RPALDDHRPA VALRDGVWHI NGLYRHGYLC APAVVDELAH KLLAT