Gene Caci_5629 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5629
Symbol
ID	8336989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	6489767
End bp	6491047
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	69%
IMG OID	644958733
Product	NADH dehydrogenase subunit D
Protein accession	YP_003116329
Protein GI	256394765
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.0649561
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTACGACT GGGACGAAGT CCTGCGCGAT GCCGAACGCA CCCCCGGAGC CGGGGGCGAC 
GGCCAAGAGC GCCTCGTCGT CAACATGGGA CCGCAGCACC CCTCGACCCA CGGCGTGCTG 
CGCCTGATCC TGGAGATCGA GGGCGAGAGC GTCATCGAGG CCCGCTGCGG CATCGGCTAC 
CTGCACACCG GCATCGAGAA GAACCTGGAG TACCGGAACT GGACCCAGGC GGTGACCTTC 
CTGACCCGCG CCGACTACCT GATGCCGCTG TTCAACGAGA CCGTCTACTG CCGCGCGGTC 
GAGGCGCTGC TCGGCGTCGA GGACGACGTG CCGCCGCGCG CGAACGTCAT CAGGGTCCTG 
CTGATGGAGC TGAACCGCAT CTCCTCGCAC CTGGTGGCCC TGGCCACCGG CGGCATGGAA 
CTCGGCGCGA TGACGGTGAT GACCAACGGG TTCCGCGACC GCGAGCCGAT CCTGGACGTC 
CTGGAGGCGG TCACGGGGAA CCGGATGAAC CACGCCTACG TCCGTCCCGG CGGGCTCGCG 
CAGGACCTCC CCGACGGCGT CGTCGAGCAG ATCAGAGCCC TGATTGTCGA GTTCCCCAAA 
CGGATCCTGG ACTACGAACG CCTGCTGAGC GCCAACCCGG TGTTCGTCAG ACGCACCAAG 
GGCGTCGGGT ATCTGGACCT GCCGGGCTGT ATGGCGCTCG GCGTCACCGG CCCGGTGCTG 
CGCGCCGCCG GACTCGCGCA CGACCTGCGC AAGTCGGACC CGTATCTGGG CTATGAGACC 
TACGACTTCG AGGTACCGAC CGACACCGGC TGCGACGCCT ACGGCCGCTA TCTGGTGCGC 
CTGCACGAGA TGACCGAATC GCTGCGCATC ATCGAGCAGG CCCTGGACCG CCTGGAACCC 
GGACCGGTCA TGCTCGCCGA CCCGAAGATC GCCTGGCCGG CGCGCCTGTC GCTCGGCGGC 
GACGGGCTGG GCAACTCCGA GGAGTGGATC CGCCACATCA TGGCGCAGTC GATGGAGGCG 
CTGATCCACC ACTTCAAGCT GGTCACCGAG GGTTTCGTGG TGCCGGCCGG GCAGGTGTAC 
TCCTTCGTGG AGTCCCCGCG CGGCGAACTC GGCGCGCACG TCGTCAGCGA CGGCGGCACA 
CGGCCGTTCC GCGTGCACCT GCGCGACCCC TCGTTCACGC ACCTGCAGGC GGTGTCGGCG 
ATGGCCGAGG GCGGCATGCT CGCGGACGTC GTGGCGGTGG TGGCCTCGGT GGATCCGGTG 
CTGGGCGGCG CGGACCGCTG A

Protein sequence

MYDWDEVLRD AERTPGAGGD GQERLVVNMG PQHPSTHGVL RLILEIEGES VIEARCGIGY 
LHTGIEKNLE YRNWTQAVTF LTRADYLMPL FNETVYCRAV EALLGVEDDV PPRANVIRVL 
LMELNRISSH LVALATGGME LGAMTVMTNG FRDREPILDV LEAVTGNRMN HAYVRPGGLA 
QDLPDGVVEQ IRALIVEFPK RILDYERLLS ANPVFVRRTK GVGYLDLPGC MALGVTGPVL 
RAAGLAHDLR KSDPYLGYET YDFEVPTDTG CDAYGRYLVR LHEMTESLRI IEQALDRLEP 
GPVMLADPKI AWPARLSLGG DGLGNSEEWI RHIMAQSMEA LIHHFKLVTE GFVVPAGQVY 
SFVESPRGEL GAHVVSDGGT RPFRVHLRDP SFTHLQAVSA MAEGGMLADV VAVVASVDPV 
LGGADR