Gene Daro_0956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0956
Symbol
ID	3570271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	1036369
End bp	1037418
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	56%
IMG OID	637679415
Product	respiratory-chain NADH dehydrogenase, subunit 1
Protein accession	YP_284182
Protein GI	71906595
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	0.0350312
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.369744
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGCAC TGATGAATTT CGGTACCGGG ATTTTTGGCG GTGCCTGGCC TGCCGTCTGG 
ACACTTATCA AGATTGTCCT GATCGTCGCC CCGATGATGC TCGGCGTTGC TTATCTGACC 
TACTTCGAGC GCAAGGTCAT CGGCTATATG CAAGTGCGTA TCGGCCCTAA CCGGGTCGGT 
CCATGGGGTC TGATCCAGCC GATCGCCGAC GGCCTGAAGC TGCTGATGAA GGAAATCATC 
GTCCCCAGCG GCGCCAACAA GGGCATCTTC ATCATTGCCC CGATGCTGGC TATTGCACCG 
GCACTGGCGG CTTGGGCGGT GGTGCCTTTC ACCGACTCGC TGGTTCTGGC CAACATTGAT 
GCCAGCCTGC TCTACATTAT GGCCATCACC TCGATGGGGG TGTACGGGAT CATCCTGTCC 
GGCTGGGCTT CCAACTCCAA GTACGCCTTC CTCGGCGCCA TGCGTTCTGC TGCCCAGATG 
GTTTCATACG AAATCTCCAT GGGCTTCTCG CTGATCTGCG TTCTGATGGT GTCCAACAGC 
CTGAATCTGG TCGAGATCGT CAATGTTCAA AATCAGGGCC GCTTTGCCGG CTGGGGGCTG 
AGCTTCCTGT CCTGGAACTG GCTGCCGCTG TTCCCGATGT TCTTGGTCTA TCTGATTTCC 
GGCGTTGCTG AAACCAATCG TGCTCCGTTC GACGTCGCCG AAGGTGAATC CGAGATCGTT 
GCCGGTTTCC ATGTTGAATA TTCCGGGATG GCCTTTGCGG TCTTCTTCCT GGCTGAATAC 
GCCAACATGA TTCTGGTCTC AGCTCTGACT TCCATCATGT TCCTTGGTGG CTGGCTGTCT 
CCGGTTAGCT TCCTGCCTGA TGGCATTCTC TGGCTGTTCG CCAAGATGTC GGCAATTCTC 
TTCTTGTTCC TGTGGTTCCG GGCGACGTTC CCGCGCTACC GCTACGACCA GTTGATGCGT 
CTGGGCTGGA AAGTGTTCGT GCCGATCTGT CTGATCTGGC TGGTTGTTGT CGGCGTCTGG 
ATGATGTCGC CGCTGAATAT CTGGAAGTGA

Protein sequence

MDALMNFGTG IFGGAWPAVW TLIKIVLIVA PMMLGVAYLT YFERKVIGYM QVRIGPNRVG 
PWGLIQPIAD GLKLLMKEII VPSGANKGIF IIAPMLAIAP ALAAWAVVPF TDSLVLANID 
ASLLYIMAIT SMGVYGIILS GWASNSKYAF LGAMRSAAQM VSYEISMGFS LICVLMVSNS 
LNLVEIVNVQ NQGRFAGWGL SFLSWNWLPL FPMFLVYLIS GVAETNRAPF DVAEGESEIV 
AGFHVEYSGM AFAVFFLAEY ANMILVSALT SIMFLGGWLS PVSFLPDGIL WLFAKMSAIL 
FLFLWFRATF PRYRYDQLMR LGWKVFVPIC LIWLVVVGVW MMSPLNIWK