Gene Mvan_3704 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3704
Symbol
ID	4643756
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	3938593
End bp	3940338
Gene Length	1746 bp
Protein Length	581 aa
Translation table	11
GC content	63%
IMG OID	639807171
Product	cytochrome-c oxidase
Protein accession	YP_954495
Protein GI	120404666
COG category	[C] Energy production and conversion
COG ID	[COG0843] Heme/copper-type cytochrome/quinol oxidases, subunit 1
TIGRFAM ID	[TIGR02891] cytochrome c oxidase, subunit I

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.574025
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGCCG ATGCGCCATC GGTCGGGGAA CTTGAGGCAC GCCGTCCTTT TCCGGCCCGG 
ATGGGCCCCA AAGGCAACCT GATCTACCGG TTGATCACGA CCACCGATCA CAAGTTGATC 
GGGATGATGT ATTGCGTTGC GTGTTTCGCG TTCTTCCTCA TCGGTGGGTT GATGGCGCTG 
TTCATCCGCA CCGAATTGGC GGTGCCGGGG CTGCAGTTCC TGTCCAATGA GCAGTACAAC 
CAGCTGTTCA CCATGCACGG CACGGTGATG CTGCTGTTCT ACGCGACGCC GATCGTGTTC 
GGCTTCGCGA ACCTGGTGCT GCCGCTGCAG ATCGGCGCGC CCGATGTCGC GTTCCCGCGA 
CTGAACGCAT TCTCGTTCTG GCTGTTCCTG TTCGGTGCAC TGATCGCCAC CGCCGGTTTC 
ATCACCCCGG GCGGTGCCGC GGATTTCGGC TGGACCGCCT ACACACCCTT GTCTAGTGCG 
ATCAATTCAC CAGGCGCCGG CGCCGACCTC TGGATTCTCG GCCTGATCGT CGGCGGGCTG 
GGCACGATTC TAGGCGCGGT CAACATGATC ACCACCGTGG TGTGTATGCG TGCGCCGGGC 
ATGACGATGT TCCGGATGCC GATCTTCACC TGGAACATCC TGGTGACGTC GATCCTGGTG 
CTGCTGGCGT TTCCGCTGCT GACCGCGGCG CTGTTCGCGT TGGCCGCCGA CCGCCACCTC 
GGCGCACACG TGTACGACCC GGCGAACGGC GGTGTGTTGC TGTGGCAGCA CCTGTTCTGG 
TTCTTCGGCC ACCCCGAGGT GTACATCATC GCGTTGCCGT TCTTCGGCAT CGTCAGCGAG 
ATCTTCCCGG TGTTCAGCCG CAAGCCGATC TTCGGCTACA CCACGCTGAT CTACGCGACG 
CTGGGCATCG CGGCGCTGTC GGTGGCGGTC TGGGCCCACC ACATGTACGC CACCGGTGCG 
GTCCTGCTGC CGTTCTTCTC GTTCATGACG TTCCTGATCG CGGTCCCGAC GGGCATCAAG 
TTCTTCAACT GGATCGGCAC GATGTGGAAG GGCCAGTTGA CGTTCGAGAC ACCGATGCTG 
TTCTCCGTCG GGTTCATCGT CACGTTCCTG CTCGGTGGGC TCTCAGGTGT GCTGCTGGCC 
AGCCCGCCGA TCGACTTCCA GGTCACCGAC AGCTACTTCG TCATCGCGCA CTTCCACTAC 
GTGCTGTTCG GCACCATCGT GTTCGCCACC TACGCGGGCA TCTATTTCTG GTTCCCGAAG 
ATGACGGGCC GACTGCTCGA CGAGCGGCTG GGCAAGCTGC ACTTCTGGCT GACGTTCATC 
GGCTTCCACA CGACGTTCCT GGTGCAGCAC TGGCTGGGCA ACGAGGGCAT GCCGCGCCGC 
TACGCCGACT ACCTGCCCAG CGACGGCTTC ACCACGCTCA ACATCGTGTC CACCATCGGT 
GCATTCATTC TCGGTGCCTC GACGCTGCCG TTCCTGTGGA ACATCTTCAA GAGCTGGCGT 
TACGGCGAGG TCGTCACCGT CGACGATCCG TGGGGGTACG GCAACTCGCT GGAGTGGGCG 
ACCAGTTGCC CGCCGCCACG GCACAACTTC ACCGAGCTGC CCCGGATCCG TTCGGAGCGT 
CCGGCGTTCG AGCTGCACTA CCCGCACATG GTGGAACGGA TGCGCCGCGA AGCCCACGTG 
GGGCGCGCCC GCGGCCCCGA AGACGGCGAC GTCACGCGCC TCGACGACGC TCAAGTGCGC 
ACCTAA

Protein sequence

MVADAPSVGE LEARRPFPAR MGPKGNLIYR LITTTDHKLI GMMYCVACFA FFLIGGLMAL 
FIRTELAVPG LQFLSNEQYN QLFTMHGTVM LLFYATPIVF GFANLVLPLQ IGAPDVAFPR 
LNAFSFWLFL FGALIATAGF ITPGGAADFG WTAYTPLSSA INSPGAGADL WILGLIVGGL 
GTILGAVNMI TTVVCMRAPG MTMFRMPIFT WNILVTSILV LLAFPLLTAA LFALAADRHL 
GAHVYDPANG GVLLWQHLFW FFGHPEVYII ALPFFGIVSE IFPVFSRKPI FGYTTLIYAT 
LGIAALSVAV WAHHMYATGA VLLPFFSFMT FLIAVPTGIK FFNWIGTMWK GQLTFETPML 
FSVGFIVTFL LGGLSGVLLA SPPIDFQVTD SYFVIAHFHY VLFGTIVFAT YAGIYFWFPK 
MTGRLLDERL GKLHFWLTFI GFHTTFLVQH WLGNEGMPRR YADYLPSDGF TTLNIVSTIG 
AFILGASTLP FLWNIFKSWR YGEVVTVDDP WGYGNSLEWA TSCPPPRHNF TELPRIRSER 
PAFELHYPHM VERMRREAHV GRARGPEDGD VTRLDDAQVR T