Gene Avin_01020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_01020
Symbol
ID	7759069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	103098
End bp	104255
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	68%
IMG OID	643803028
Product	cytochrome c oxidase, subunit II
Protein accession	YP_002797344
Protein GI	226942271
COG category	[C] Energy production and conversion
COG ID	[COG1622] Heme/copper-type cytochrome/quinol oxidases, subunit 2
TIGRFAM ID	[TIGR02866] cytochrome c oxidase, subunit II

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.24737
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCGAC ATCCACGACT CTGGATGGGT CTTCTGTCGT GCTCGGCCCT GTCCCAGGCG 
CAGGCCGCCT GGGATGTGAA CATGCGGCCG GGGGTCACGG AAGTCAGCCG TTCCGTCTTC 
GATCTGCACA TGACCATCTT CTGGATCTGC GTGGCCATCG GCGTGCTGGT GTTCGGCGCG 
ATGTTCTGGT CGATGTTCGC CCACCGCCGT TCGCGTCGCC CGCAGCCCGC CCACTTCCAC 
GAGAACACCC GGGTCGAGGT GCTGTGGACG GTGATCCCGC TGTTGATCCT GATCGCCATG 
GCGGTGCCGG CGACCCGCAC CCTGCTGCAC ATCTACGACC CGTCCGAGCC CGACCTGGAC 
ATCCAGGTCA CCGGCTACCA GTGGAAGTGG CACTACAAGT ACCTGGGCGA GGACGTGGAG 
TTCTTCAGCA ACCTGGCCAC CGACCGCAAC GCCATCGGCA ACCAGGCGCC GAAGAACGAC 
CACTACCTGC TGGAGGTGGA CGAACCGCTG GTGATCCCGG CCGGCGCCAA GGTGCGCTTC 
CTGGTCACCG CGGCGGACGT CATCCACTCC TGGTGGGTAC CGGAACTGGC GGTGAAGAAG 
GACGCCATCC CCGGCTTCAT CAACGAGACC TGGACCCGCG TCGCCGAGCC GGGCCTCTAC 
CGCGGCCAGT GCACCGAACT GTGCGGCAAG GATCACGGCT TCATGCCGGT GGTGGTGGAG 
GTCAAGGCTC CGGCCGACTA CGCCGCCTGG CTGGCCGGCA AAAAGGCCGC CGCCGCCGAG 
GCCACGGCGC AGGCCGGCAA GGCCTGGACC CTGGAGGAAC TGGTCGCCCA GGGCGAGCGG 
GTCTACCGGA CCGCCTGCGT CGCCTGCCAC CAGCCGACCG GCGAGGGCCT GCCGCCGGCA 
TTCCCGGCGC TCAAGGGTTC GAAGATCGCC ACCGGACCGA AGGAAGGCCA CATGAACATC 
GTCATCGACG GCAAGCCGGG CACTGCCATG GCCGCCTTCG GCAAGCAGCT CTCGGACGTC 
GACCTGGCGG CGGTGATCAC CTACGAGCGC AACGCCTTCG GCAACGCGCT CGGCGACAGC 
GTCACCCCGC AGGACATCCA CGCCTTCCGG CAGGCCCGGG AAACCGGCCA GGGCATGCAG 
CCCGCCCAAC CCCAATAG

Protein sequence

MMRHPRLWMG LLSCSALSQA QAAWDVNMRP GVTEVSRSVF DLHMTIFWIC VAIGVLVFGA 
MFWSMFAHRR SRRPQPAHFH ENTRVEVLWT VIPLLILIAM AVPATRTLLH IYDPSEPDLD 
IQVTGYQWKW HYKYLGEDVE FFSNLATDRN AIGNQAPKND HYLLEVDEPL VIPAGAKVRF 
LVTAADVIHS WWVPELAVKK DAIPGFINET WTRVAEPGLY RGQCTELCGK DHGFMPVVVE 
VKAPADYAAW LAGKKAAAAE ATAQAGKAWT LEELVAQGER VYRTACVACH QPTGEGLPPA 
FPALKGSKIA TGPKEGHMNI VIDGKPGTAM AAFGKQLSDV DLAAVITYER NAFGNALGDS 
VTPQDIHAFR QARETGQGMQ PAQPQ