Gene Ndas_1931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1931
Symbol
ID	9245781
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2352452
End bp	2354134
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	65%
IMG OID
Product	cytochrome c oxidase, subunit I
Protein accession	YP_003679864
Protein GI	297560890
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.768884
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.452055
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCACCAG CGAAAACCGA GGCAGAGGAG TCCTCCTCCG TGAAGGCCCC CAAGGGGTCG 
ATCATCGTGA GCTGGCTGAC CTCGACCGAC CACAAGGTCA TCGGGTACAT GTACATCATC 
ACCGCCTTCG CCTTCTTCGT CTTCGGCGGA ATCCTGGCGG TGCTCATCCG CGCCGAACTG 
TTCTTTCCGG GCATGCAGAT CATGTCCAAC GAGGAGTACA ACCAGCTGTT CACCATGCAC 
GGCACGATCA TGCTGCTGCT CTTCGCGACC CCGCTGTTCG TCGGGTTCGG CAACGTGATC 
ATGCCGTTGC AGATCGGCGC GCCCGACGTG GCGTTCCCGA GGATGAACCT GTTCGGCTAC 
TACCTGTTCC TGTTCGGCGG GCTGATCGTC TCGGCCGGGT TCCTGACCCC GGGCGGCGCG 
GCCAGCTTCG GCTGGTTCGC CTACACGCCC CTGTCGAACG AGGTCCACTC ACCGGGGGTG 
GGGGGCAACC TGTGGATCAT GGGGTTGGTG GTGTCGGGTC TGGGCACGAT CCTGGGCGCG 
GTCAACTTCA TCACCACCGC CCTGTGCATG CGCGCGCCGG GCATGACGAT GTTCCGCATG 
CCGATCTTCA CCTGGAACAT CATCCTGACC AGCGTGCTGG TGCTCATCGC GTTCCCCGTG 
CTGACGGCGG CCCTGATCGC GCTGGGCGCG GACCGCATCG TCGGCACGCA GGTGTTCAAC 
GCCGAGCACG GCGGGGCCAT CCTGTGGCAG CACCTGTTCT GGTTCTTCGG CCACCCCGAG 
GTGTACATCA TCGCGCTGCC GTTCTTCGGC ATCGTGACCG AGATCCTGCC GGTGTTCAGC 
CGCAAGCCGA TCTTCGGCTA CAAGGGGCTG GTGGCGGCGA CCATCGCCAT CACGGGCCTG 
TCGGTGACGG TGTGGGCGCA CCACATGTTC CCGACGGGTG CGGTGCTTCT GCCGTTCTTC 
TCGTTCATGA GCTTCCTCAT CGCGGTGCCG ACCGGGGTGA AGTTCTTCAA CTGGATCGGT 
ACGATGTGGC GGGGCCAGAT CAGCTTCGAG ACGCCGATGC TGTTCTCGAT CGGGTTCCTA 
GTGACCTTCC TGTTCGGCGG TCTGACCGGT GTGCTGCTGG CCTCCCCGCC GATCGACTTC 
CACGTCACCG ACTCCTACTT CGTGGTGGCC CACTTCCACT ACGTGGTGTT CGGCACGGTG 
GTGTTCGCGA TGTTCGCGGG CTTCTACTTC TGGTGGCCCA AGTTCACCGG GACGATGCTC 
AACGAGAAGT TGGGCAAGTT CCACTTCTGG CTGCTGTTCC TGGGCTTCCA CGGCACGTTC 
CTGGTGCAGC ACTGGCTGGG CGCCGCCGGC TTCCCGCGCC GCTACGCCGA CTACCTGCCC 
GGTGACGGCT TCACCGAGCT CAACCAGATC TCCTCGGTCT CCTCGTTCGT GCTGGCGGCC 
TCGACGCTGA TCTTCTTCTG GAACGTCTTC GTGACCGCGC GCAACGCTCC CCAGGTGGGG 
ATGGACGACC CGTGGGGCTA CGGCTGCTCG CTGGAGTGGG CCACGTCCTG CCCGCCGCCG 
CGGCACAACT TCACGTCGCT GCCGCGGATC CGTTCCGAGC GTCCCGCGTT CGACCTGAAC 
CACCCGCATG TGGCGTCGCG GGCCCTGGAC TCCGGGCGCG AGGAGAGCGC CCCGAGGAGC 
TGA

Protein sequence

MAPAKTEAEE SSSVKAPKGS IIVSWLTSTD HKVIGYMYII TAFAFFVFGG ILAVLIRAEL 
FFPGMQIMSN EEYNQLFTMH GTIMLLLFAT PLFVGFGNVI MPLQIGAPDV AFPRMNLFGY 
YLFLFGGLIV SAGFLTPGGA ASFGWFAYTP LSNEVHSPGV GGNLWIMGLV VSGLGTILGA 
VNFITTALCM RAPGMTMFRM PIFTWNIILT SVLVLIAFPV LTAALIALGA DRIVGTQVFN 
AEHGGAILWQ HLFWFFGHPE VYIIALPFFG IVTEILPVFS RKPIFGYKGL VAATIAITGL 
SVTVWAHHMF PTGAVLLPFF SFMSFLIAVP TGVKFFNWIG TMWRGQISFE TPMLFSIGFL 
VTFLFGGLTG VLLASPPIDF HVTDSYFVVA HFHYVVFGTV VFAMFAGFYF WWPKFTGTML 
NEKLGKFHFW LLFLGFHGTF LVQHWLGAAG FPRRYADYLP GDGFTELNQI SSVSSFVLAA 
STLIFFWNVF VTARNAPQVG MDDPWGYGCS LEWATSCPPP RHNFTSLPRI RSERPAFDLN 
HPHVASRALD SGREESAPRS