Gene Avin_10230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_10230
Symbol
ID	7759968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	971161
End bp	972555
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	63%
IMG OID	643803928
Product	Di-heme cytochrome c peroxidase, CCP_MauG family
Protein accession	YP_002798230
Protein GI	226943157
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAAAGC TACCCCTCGT CATTGGAGCC TGCGTCGCCG GCTACTTGGC AACCGTCTTC 
ATCGTAGACC GTTTCGACGT GCGTCTCAGC GAACAGCATC TGGCCAGTGC CCAACTGAAC 
GGCATGGACA AGCTCACGAG CGAAGCCTTC AAGGTGCTGA ACAGCAATGG TTGCCAGTAT 
TGCCATACCC GCAACAGCGA GCTGCCGTTC TACGCCAACA TGCCGATCGC CAAGCAACTG 
ATGAACAAGG ACATCGAGCT GGCCCAGCGC CAGTTCAACA TCGAGTCGCT GCTGGCCAGC 
GCGCAACAGG GCAAGGCGGT CTCGGAAGTG GACCTGGCCA AGATCGAGTC GGTGATGCAG 
GACAACGCCA TGCCGCCGAA CCTCTACCTG GGCATGCACT GGCGGTCCCG GCTGTCCGAC 
GAGGAGAAGG GCGTGCTGCT CGACTGGGTG AAGGCCGAGC GCCTGAAGCA GAGTTCGGCC 
GATGCGGTCG CCGACGCCTA CAAGTACGAG CCGGTGCAGC CGATCACCAC CAGCTTTCCG 
GTGAACCCGG CCAAGGTCGC GCTGGGCGAG AAGCTCTACC ACGATACCCG CCTGTCCAGC 
GACGACACCG TCTCCTGCGC CAGTTGCCAT GCCCTGGACA AGGGCGGGGT GGACCGCCTG 
GATGTTTCCG TCGGGGTCGG CGGCTCGAAG GGGCCGATCA ACGCACCGAC GGTGTACAAC 
GCCGCCTTCA ACGTCCTGCA GTTCTGGGAC GGCCGCGCGG CCGACCTGCA GAAGCAGGCC 
GGCGGCCCGC CGATGAACCC GCTGGAGATG GCTTCCACCT CCTGGGAGCA GATCGTCGGC 
AAGCTGACGC AGGACGCCCA GTTGAGCGCC GAGTTCGCCG CCCTCTATCC GGAAGGCATC 
ACCGAGAACA GCATCACCGA CGCCATCGCC GAGTTCGAGA AGACCCTGGT CACGCCGAAC 
AGCCGCTTCG ACCTGTTCCT GAAAGGGCAG GGCGACGCTC TCAGCAGCGT GGAGAAGGAA 
GGCTACGAAC TGTTCAAGAC CGCCAAGTGC GCGACCTGCC ACGTGGGCGA GGCGATGGGC 
GGCCAGTCCT TCGAACTGAT GGGCATCAAG AAGGATTATT TCGCCGACCG CGGCAATGTC 
AGCGAAGTGG ACCACGGGCG TTACAACGTG ACCAAGGACC CGCACGACAT GTACCGCTTC 
AAGGTGCCGA CCCTGCGCAA CGTCGCGCTG ACCGCGCCCT ATTTCCACGA CGCCAGCGCC 
AAGACCCTGG AGGACGCGGT CGACAAGATG GCGGAGTACC AGGTCGGCAT GAAACTGTCG 
AAGGACGAGA TCGGCAAGAT CGTCGCCTTC CTGCAGACCC TCAACGGCGA GTACCAGGGC 
AAGACCCTGC AGTGA

Protein sequence

MKKLPLVIGA CVAGYLATVF IVDRFDVRLS EQHLASAQLN GMDKLTSEAF KVLNSNGCQY 
CHTRNSELPF YANMPIAKQL MNKDIELAQR QFNIESLLAS AQQGKAVSEV DLAKIESVMQ 
DNAMPPNLYL GMHWRSRLSD EEKGVLLDWV KAERLKQSSA DAVADAYKYE PVQPITTSFP 
VNPAKVALGE KLYHDTRLSS DDTVSCASCH ALDKGGVDRL DVSVGVGGSK GPINAPTVYN 
AAFNVLQFWD GRAADLQKQA GGPPMNPLEM ASTSWEQIVG KLTQDAQLSA EFAALYPEGI 
TENSITDAIA EFEKTLVTPN SRFDLFLKGQ GDALSSVEKE GYELFKTAKC ATCHVGEAMG 
GQSFELMGIK KDYFADRGNV SEVDHGRYNV TKDPHDMYRF KVPTLRNVAL TAPYFHDASA 
KTLEDAVDKM AEYQVGMKLS KDEIGKIVAF LQTLNGEYQG KTLQ