Gene Ndas_3602 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3602
Symbol
ID	9247471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4315807
End bp	4317075
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	72%
IMG OID
Product	cytochrome bd ubiquinol oxidase subunit I
Protein accession	YP_003681508
Protein GI	297562534
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.852555
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGAAG ACCCCCTCCT GCTGGCGCGG CTCCAGTTCG CGCTGACCGC CGCCACCCAC 
TACATGTTCG TGGCCCTGAC CCTCGGGCTG GCCCCCTACC TCCTCGCCAC CCAGCTGGTC 
GCCGCCCTGC GCGGCGACCG CTCCCGGACG ACCGCCGTGC GGTTCTGGGG CGGCCTGTAC 
CTGGTCAACT ACGGGATGGG CGTCCTGTCC GGGCTGGTGA TGGAACTCCA GCTCGCGCTG 
AACTGGAGCG GCCTGCACGG GATGTTCGGC TACACCTTCG CCGCTCCGCT GGCGCTGGAG 
ACGATGACCG CGTTCTTCGT CGAGTCCACG TTCCTGGGTT TGTGGATCTT TGGGTGGGAC 
CGCATGGGCC GGTGGGCGCA CCTGGCCTGC TTCGCCGTGG TCACCGCGAC GGCGTACGCC 
TCGGCGTGGT GGGTGCTGGT CTCCAACGGC TTCCTGCGCA ACCCCGTGGG CTTCGAGATG 
GTCGACGGGG TGGCGCACCT GACCGACCCC GTCGCGCTGA TGACCAACCC GGCGGCCGTG 
CTGGCCTTCG GTCACATCGT CACCGGTTCC CTGCTGGTCG GCGCCCTGGT CGTCGCGGCG 
ACCAGCGCCT ACCACCTCGT CCGTCGCGAC GACGCGCACG GCGTCTTCCG GCGCGGTATC 
CGCCACGCGA CGCTGGTCCT GTGCGTCGTG CCGATACCCG TGGCGGCCTT CGGCGGGGTG 
CAGTTCGGGC TGTTCGGCCA GGACCCGCCC ACGAGCGGGC TGACCTACAC CGCCGAGGAG 
ATCGCGGCGA TCGAGGCGGC GCACCCGGGC GGCCCCCTCC TGGAGGCGGC CAACACGGCC 
GGCGACCTGG TGATGATGAC GTCGTGGGCG CTGGTGTTCC TCCTGGGCCC CCTCATGCTG 
CTGGCCTGGC CCCTCGGCGG TCTCGACCGC TGGAGGTGGT TCCTCGCCCC GCTGGTGGTG 
ACGCCGTTCC TGCCCTACCT GGCCAGCGTC GGCGGCTGGG TGTTCCGGGA GACCAACCGC 
CAGCCGTGGA CGGTCGTGCA CCACCTGACC ACGGCCGACG CGGTGACCCC CCTGTCCCCG 
GTCGCGGCCG TGGCCTCCTT CGGTTTCTTC ACAGCCGCCT TCGCGGCCCT GGCCGCCGTC 
ACCTACTGGC TCCTGGTGCG CTACGCGCGG CGCGGCCCCG AGGGCGGGCC GCTGGCGGAG 
CAGCGCACGC AGCCGCCCGA GGGCCCCGCG GAGCCCGGTG GGTCCGCCGT CCCCGTCCAC 
ACGTACTGA

Protein sequence

MLEDPLLLAR LQFALTAATH YMFVALTLGL APYLLATQLV AALRGDRSRT TAVRFWGGLY 
LVNYGMGVLS GLVMELQLAL NWSGLHGMFG YTFAAPLALE TMTAFFVEST FLGLWIFGWD 
RMGRWAHLAC FAVVTATAYA SAWWVLVSNG FLRNPVGFEM VDGVAHLTDP VALMTNPAAV 
LAFGHIVTGS LLVGALVVAA TSAYHLVRRD DAHGVFRRGI RHATLVLCVV PIPVAAFGGV 
QFGLFGQDPP TSGLTYTAEE IAAIEAAHPG GPLLEAANTA GDLVMMTSWA LVFLLGPLML 
LAWPLGGLDR WRWFLAPLVV TPFLPYLASV GGWVFRETNR QPWTVVHHLT TADAVTPLSP 
VAAVASFGFF TAAFAALAAV TYWLLVRYAR RGPEGGPLAE QRTQPPEGPA EPGGSAVPVH 
TY