Gene Gdia_0285 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0285
Symbol
ID	6973677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	314367
End bp	315788
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	66%
IMG OID	643389816
Product	Cytochrome-c peroxidase
Protein accession	YP_002274697
Protein GI	209542468
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.906916
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.908563
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGGTGC GCAAGCTCGT ACTATCAGTG GCGGCCCTGG GCTGCGTCGC CTATGGCGGA 
ACAGTGGGGT ATCTGACCCA TTTCGACCAT GACACCGCGC CGACATTGGG CACGAATTCT 
CCAACACTGG CCGATCCGGT CGCCTCGGCG GCCTTCGCCG CGATTCGCGA ATCCCGGTGC 
GACTACTGCC ATGCCCGCAA TACCGACCTG CCGTTCTATT TCCATGTGCC GGTGGCGAAC 
CAGTTGATGC AGCGCGACGT GGACCAGGGC CTGCGTCATT TCCGGATCGA GCCCGTGCTG 
GCCGCGTTCC AGAGCGGCGC CGTTCCGTCC GAGGAACAAC TGGCGCGGAT CGAGGAAGTG 
GTGCGCCAGA ACCGCATGCC GCCGACCCTG TACCTGCTGC TGCACTGGCA CGCCCATCTG 
TCGCAGGCGC AGCGTGACGC GCTGCTGACC TGGATCGCGG CGGAACGGCG CGCGCATTAC 
GCGACCCCGG GGGTCGCCCC ACGCTTCGCG GCCGAACCGG TGCAGCCGGT GCCCGAGACG 
CTGCCGGTGG ATGCGGCCAA GGTCGCGCTG GGCCAGCGCC TGTTCTTCGA CAAGCAATTG 
TCGGGGGACG GCACCCTCAA TTGCGCCAGT TGCCATGCGC TGGACCATGG CGGCGTGGAC 
GGCCGGGTCA CGGCGCTGGG CATCGACAAC CGCCACGGCC CGATCAACGT GCCCACCGTC 
TATGACGCCG CGTTCAATCA GAGCCAGTTC TGGAACGGCC GCGCCGCGAC CCTGGCCGAC 
CAGGCGGCGG GACCGGTGAT GAACCCGCTG GAAATGGGAT CGCACGACTG GACCGGCGTG 
GCCGACAAGC TGAAGCAGGA CCCCACCTAC CTCACCGCGT TCCAGGGCGT CTTCGGCTCG 
GACGAGATCA CCAGGGACCG GATCACGGAT GCGATCGCGG AATATGAAAA GACCCTGATC 
ACCCCCGACA GCCGCTTCGA CCGCTACCTG AAGGGCGACG ACCAGGCCCT GAACGCGCAG 
GAAAAGAACG GCTACGCGCT GTTCAAGAGC GTGGGATGCT CGGGCTGCCA CACCGGCGTC 
TCGCTGGGCG GGCAGGCGTT CGAGGCGATG GGCCTGGAGG GCGATTACTT CGCCGCGCGC 
GGCGGCACGC TGACCGATGC CGACAAGGGA CGCTATATGG TGACCCATTC GGACGCCGAC 
ATGGAACGCT TCAAGGTGCC GAACCTGCGC AACATCGCCC TGACCGCGCC GTATTTCCAT 
GACGGCAGCG TCAAGACGCT GGACCAGGCA GTGCGGGAAA TGGCGCGCTA CCAGACGCCC 
GATCACGACC TGTCGGACCA CGACGTGGCC GATATCGTGG CCTTCCTCCA GACCCTGACC 
GGCACCTACC AGGGCCACCA ACTGGCTGAA ACCACGCACT GA

Protein sequence

MSVRKLVLSV AALGCVAYGG TVGYLTHFDH DTAPTLGTNS PTLADPVASA AFAAIRESRC 
DYCHARNTDL PFYFHVPVAN QLMQRDVDQG LRHFRIEPVL AAFQSGAVPS EEQLARIEEV 
VRQNRMPPTL YLLLHWHAHL SQAQRDALLT WIAAERRAHY ATPGVAPRFA AEPVQPVPET 
LPVDAAKVAL GQRLFFDKQL SGDGTLNCAS CHALDHGGVD GRVTALGIDN RHGPINVPTV 
YDAAFNQSQF WNGRAATLAD QAAGPVMNPL EMGSHDWTGV ADKLKQDPTY LTAFQGVFGS 
DEITRDRITD AIAEYEKTLI TPDSRFDRYL KGDDQALNAQ EKNGYALFKS VGCSGCHTGV 
SLGGQAFEAM GLEGDYFAAR GGTLTDADKG RYMVTHSDAD MERFKVPNLR NIALTAPYFH 
DGSVKTLDQA VREMARYQTP DHDLSDHDVA DIVAFLQTLT GTYQGHQLAE TTH