Gene Pnap_4868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_4868
Symbol
ID	4685679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008759
Strand	-
Start bp	43431
End bp	44705
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	67%
IMG OID	639826510
Product	di-haem cytochrome c peroxidase
Protein accession	YP_973674
Protein GI	121583238
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAGC GCGTCATCGC GTTGGCGGTC GCGGCGGCCG CTCTTGCCGT TACCGCCCTG 
GCCGCGCAGG ATTTGAAGAA GGCGCCGCTG CGGGACAGGT GGTCAGTTCA GGAAGTCACT 
GCCCTCGCCT CGATGCGTTT GAAAGAGGCT GGCCAGCGGC CCGCTGATGC GTCGAACGCC 
TACGAGCAGC GCGCCGAGGC GGCCGCGCTT GGGCGTGCAC TGTTCAATGA CACCCGGCTC 
AGCAAGAACG GCCAGGTCGC CTGCGCCAGC TGCCACGCGG CCGACAAGCA GTTCGAGGAC 
GGGCGTCAGT TCGGCCAGGG AATTGCCACC GGCAAGCGCC GGACCATGCC GGTCATGGGC 
GCTGCGCACG CCCCCTTCCT GTTCTGGGAC GGGCGCAAGG ACAGTGCCTG GTCGCAGGCA 
CTGGGGCCAC TCGAAGACGC GGCAGAGCAC GGCGGCAACC GCGTCCGCTT GGTCCGACTG 
GTGCTGGCGC AGTACAAGGA CCCGTATGGC AAGGTGTTCG GCGCGGTGCC CGAAGTCGGC 
GAACTGCCCG GCGATGCGTC TCCCAACGGA ACGCAGGCCG AACGCGCCGC CTGGGCCGCG 
CTTGCGCCGG CGACCCGGAA CAGCGTCAAC CGCGTCTTTG CGAACATGGG CAAGGCCATC 
GCGGCCTATG AACGACTCGT TTCCTATGGT GAATCGCGTT TCGACCGGTA CGCCCAGGCT 
ACTGTCGCTG GCGATGGGCC AGGCCAGGAT GCGCTCACCG GGCAGGAAGT GCGGGGATTG 
CGCCTGTTCC TGACCAAGGG GCAGTGTGTG ACCTGCCACA ACGGGCCGCT GCTCACGGAC 
CATGCCTTTC ACAACACAGG CGTTCCACCG CTGGAGCCGG CCAACCCGGA CCGCGGTCGC 
GCCGAAGGGC TCAAAAAGCT CCTGGCCGAC GAATTCAATT GCCTGGGCCG CTACAGTGAC 
GCCAAACCGG AGCAATGCGG TGAACTGCAG TTCCTGTCAG CGAACGACAC GGCTCAGCTC 
GGCGCGTTCC GCACACCAAG CCTGCGCAAC GTGGCGGTCC GGCCGCCCTA CATGCATGCC 
GGCCAGTTCT CGACCCTCGA TGCGGTGGTG CAGCACTACG CCGCTTCGCC CCAAGCGGCC 
ATCGGCCACA GCGAACTGGC GCAGCCCGGT GAAAACCACG CGCAGCGGCA AAGCATCCGG 
CTTTCCGCCG ACGACATCAA GGACCTGGCC GCGTTCCTGG GCACGCTCAC CGGCCCGGTC 
CATCAGCCCA GGTGA

Protein sequence

MNQRVIALAV AAAALAVTAL AAQDLKKAPL RDRWSVQEVT ALASMRLKEA GQRPADASNA 
YEQRAEAAAL GRALFNDTRL SKNGQVACAS CHAADKQFED GRQFGQGIAT GKRRTMPVMG 
AAHAPFLFWD GRKDSAWSQA LGPLEDAAEH GGNRVRLVRL VLAQYKDPYG KVFGAVPEVG 
ELPGDASPNG TQAERAAWAA LAPATRNSVN RVFANMGKAI AAYERLVSYG ESRFDRYAQA 
TVAGDGPGQD ALTGQEVRGL RLFLTKGQCV TCHNGPLLTD HAFHNTGVPP LEPANPDRGR 
AEGLKKLLAD EFNCLGRYSD AKPEQCGELQ FLSANDTAQL GAFRTPSLRN VAVRPPYMHA 
GQFSTLDAVV QHYAASPQAA IGHSELAQPG ENHAQRQSIR LSADDIKDLA AFLGTLTGPV 
HQPR