Gene Ndas_3149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3149
Symbol
ID	9247005
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3767144
End bp	3768820
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	65%
IMG OID
Product	cytochrome c oxidase, subunit I
Protein accession	YP_003681064
Protein GI	297562090
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCA CCACGTCAAG CCCCACTCTC GCGGGCGGTC AGGCACCGTC GCGCAAGGGG 
TCGATGATCG TCAAATGGAT GACGTCCACC GACCACAAGG TCATTGGGTA CATGTACCTG 
ATCACCTCCT TCGTGTTCTT CCTCTTCGGT GGTCTGCTCG CGGTGCTCAT GCGCATCGAG 
CTGTTCTTCC CGGGCATGCA GGCCATGTCC AACGAGCAGT TCAACCAGCT GTTCACCATG 
CACGGCACGA TCATGCTGCT GATGTTCGCG ACCCCGCTGT TCGTCGGGTT CTCGAACGTG 
ATCATGCCGT TGCAGATCGG TTCGCCCGAC GTGGCGTTCC CGAGGATGAA CCTGTTCAGC 
TACTACCTGT TCCTGTTCGG CAGCCTCATC GCCATCAGCG GGTTCCTGAC CCCGGGCGGC 
GCGGCCAGCT TCGGCTGGTT CGCCTACACG CCGCTGTCGG ACGCGGTGCG TTCGCCGGGT 
CTGGGCGGTG ACCTGTGGAT CCTGGGCCTG GTGGTCTCGG GTCTGGGCAC CATCCTGGGC 
GCGGTCAACT TCATCACGAC CGGCCTGTGC ATGCGCGCGC CCGGCATGAC GATGTTCCGC 
ATGCCGATCT TCACCTGGAA CACCCTGCTC ACCAGCGTGC TGGTGCTCAT CGCGTTCCCG 
GTCCTGACCG CGGCCCTGAT CGCGCTGGGC GCGGACCGCA TCGTCGGCAC CCAGGTGTTC 
AACGCCGAGC ACGGCGGGGC CATCCTGTGG CAGCACCTGT TCTGGTTCTT CGGCCACCCC 
GAGGTGTACA TCATCGCGCT GCCGTTCTTC GGCATCGTGA CCGAGATCAT CCCGGTGTTC 
AGCCGCAAGC CGATCTTCGG CTACAAGAGC CTGGTCGCGG CGACCATCGC CATCACCGGC 
CTGTCGGTCA CCGTGTGGGC CCACCACATG TTCCCGACCG GCGCGGTCCT GCTGCCGTTC 
TTCTCGTTCA TGAGCTTCCT CATCGCGGTC CCGACCGGCG TGAAGTTCTT CAACTGGATC 
GGCACCATGT GGCGGGGCCA GATCACCTTC GAGACGCCGA TGCTGTTCGT CATCGGCTTC 
CTGGTGACCT TCCTGTTCGG TGGTCTGACC GGTGTGCTGC TGGCCTCCCC GCCGATCGAC 
TTCCACGTCA CCGACTCCTA CTTCGTGGTG GCCCACTTCC ACTACGTGGT GTTCGGCACC 
GTGGTGTTCG CGATGTTCGC GGGCTTCTAC TTCTGGTGGC CCAAGTTCAC CGGCAAGATG 
CTCAACGAGA AGCTGGGCAA GTTCCACTTC TGGCTGCTGT TCCTGGGCTT CCACGGCACG 
TTCCTGGTGC AGCACTGGCT GGGCGCCGCC GGCTTCCCGC GCCGCTACGC CGACTACCTG 
CCCAGTGACG GCTTCACCGA GCTCAACCAG ATCTCCTCGG TCTCCTCGTT CGTGCTGGCG 
GCCTCGACGC TGATCTTCTT CTGGAACATG TACATCACCT CCAAGAAGGC GCCGCTGGTC 
ACCGTGGACG ACCCGTGGGG TTACGGCTGC TCGCTGGAGT GGGCCACGTC CTGCCCGCCG 
CCGCGGCACA ACTTCACGTC GCTGCCGCGG ATCCGCTCCG AGCGTCCCGC GTTCGACCTG 
AACCACCCGC ACGCCGCCGC CCCGGGCGCC GTCCCGGTGG GCGCCACGAA GGAGTAG

Protein sequence

MSTTTSSPTL AGGQAPSRKG SMIVKWMTST DHKVIGYMYL ITSFVFFLFG GLLAVLMRIE 
LFFPGMQAMS NEQFNQLFTM HGTIMLLMFA TPLFVGFSNV IMPLQIGSPD VAFPRMNLFS 
YYLFLFGSLI AISGFLTPGG AASFGWFAYT PLSDAVRSPG LGGDLWILGL VVSGLGTILG 
AVNFITTGLC MRAPGMTMFR MPIFTWNTLL TSVLVLIAFP VLTAALIALG ADRIVGTQVF 
NAEHGGAILW QHLFWFFGHP EVYIIALPFF GIVTEIIPVF SRKPIFGYKS LVAATIAITG 
LSVTVWAHHM FPTGAVLLPF FSFMSFLIAV PTGVKFFNWI GTMWRGQITF ETPMLFVIGF 
LVTFLFGGLT GVLLASPPID FHVTDSYFVV AHFHYVVFGT VVFAMFAGFY FWWPKFTGKM 
LNEKLGKFHF WLLFLGFHGT FLVQHWLGAA GFPRRYADYL PSDGFTELNQ ISSVSSFVLA 
ASTLIFFWNM YITSKKAPLV TVDDPWGYGC SLEWATSCPP PRHNFTSLPR IRSERPAFDL 
NHPHAAAPGA VPVGATKE