Gene Plav_3223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_3223
Symbol
ID	5453987
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	-
Start bp	3441050
End bp	3442228
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	60%
IMG OID	640878812
Product	NADH dehydrogenase I, D subunit
Protein accession	YP_001414486
Protein GI	154253662
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.0966966
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGAAC AGGAACTCCG CAATTATCAC CTGAATTTCG GTCCGCAGCA TCCGGCCGCG 
CATGGTGTGC TGCGCCTCGT GCTGGAGCTC GATGGCGAAG TCGTCGAGCG CGTGGACCCG 
CATATCGGTC TTCTGCACCG TGGCACGGAA AAGCTGATCG AGTACAAGAC CTATCTTCAG 
GCGACCCCAT ACTTCGACCG GCTCGATTAC GTTGCGCCGA TGAACCAGGA GCACGCCTTC 
GTGCTTGCCG CCGAGCGTTT GCTTGGCCTC GAGGTGCCGC GCCGCGCCCA GTTCATCCGC 
GTCCTCTATT CCGAGATCGG CCGCATCCTC GCGCATTTGC TCAACGTAAC GACGCAGGCG 
ATGGACGTCG GCGCGCTCAC CCCGCCGCTT TGGGGCTTTG AAGAACGCGA AAAGCTCATG 
ATCTTTTATG AGCGTGCGTC CGGAGCCCGC CTTCACGCAA ATTATTTCCG CACGGGCGGT 
GTGCATCGCG ACCTGCCGCC AAAGCTGCTC GAGGATATCT ACAATTTTTG CGACCCGTGT 
TCGCAGGTGC TGGACGATCT CGAAGGTCTC ATCACCGACA ACCGCATCTT CAAGCAGCGC 
AACGTCGACA TCGGCGTCGT CTCGCAGGAA GAGGCGCTGG AGTGGGGCTT CTCCGGCGTC 
ATGGTGCGCG GCTCAGGCAT GGCCTGGGAC CTGCGCCGCG CGCAGCCCTA TGAGGTTTAT 
TCCGAACTCG ATTTCGACAT TCCCGTAGGC AAGAACGGCG ACTGCTACGA TCGCTATCTC 
TGCCGCATGG AAGAAATGCG CCAGTCCTTG CGCATCATGA AGCAGTGCAT CGAGTTGATG 
CCGGGTGGTC CTGTGCATGT GCTCGATGGC AAGGTCGTGC CGCCGTCGCG CAGCGAGATG 
AAGCGCTCGA TGGAAGCGCT TATTCATCAC TTCAAGCTTT ATACCGAGGG CTACCACGTG 
CCCGCCGGCG AGGTTTATGC CGCCGTCGAA GCGCCCAAGG GCGAGTTCGG CGTCTACCTC 
GTGTCGGATG GTGGTAATAA GCCTTACAAG TGCAAGATCC GTGCTCCCGG CTACGCGCAT 
CTTCAGGCCA TGGACCATCT CTGCAAGGGT CACATGCTTG CGGACGTATC GGCCATTCTC 
GGTTCTATCG ACATCGTTTT CGGAGAGGTG GACCGGTGA

Protein sequence

MAEQELRNYH LNFGPQHPAA HGVLRLVLEL DGEVVERVDP HIGLLHRGTE KLIEYKTYLQ 
ATPYFDRLDY VAPMNQEHAF VLAAERLLGL EVPRRAQFIR VLYSEIGRIL AHLLNVTTQA 
MDVGALTPPL WGFEEREKLM IFYERASGAR LHANYFRTGG VHRDLPPKLL EDIYNFCDPC 
SQVLDDLEGL ITDNRIFKQR NVDIGVVSQE EALEWGFSGV MVRGSGMAWD LRRAQPYEVY 
SELDFDIPVG KNGDCYDRYL CRMEEMRQSL RIMKQCIELM PGGPVHVLDG KVVPPSRSEM 
KRSMEALIHH FKLYTEGYHV PAGEVYAAVE APKGEFGVYL VSDGGNKPYK CKIRAPGYAH 
LQAMDHLCKG HMLADVSAIL GSIDIVFGEV DR