Gene Sare_4460 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4460
Symbol
ID	5704951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5041079
End bp	5042404
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	67%
IMG OID	641273876
Product	NADH dehydrogenase subunit D
Protein accession	YP_001539225
Protein GI	159039972
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGCTT CCAACTACGC CACCGAGCGG GAGACCGCCG AGGGTAAGGT CTTCACCGTC 
ACCGGCGGCG ACTGGGACGT GGTCGTCTCC GGCACCGACC CGATCAACGA CGAGCGGATC 
GTCGTCAACA TGGGCCCGCA GCACCCGTCC ACGCACGGGG TGCTCCGGCT GGTGCTGGAG 
CTGGAGGGTG AGACGGTCCG CGAGGCCCGG TCGGTCGTCG GCTACCTGCA CACCGGGATC 
GAGAAGAACC TGGAGTTCCG TAACTGGGTG CAGGGCTCGA CCTTCGTGAC CCGGATGGAC 
TACCTCGCCC CGCTGTTCAA CGAGACGGCG TACGCGTTGG CGGTGGAGAA GCTGCTCGGC 
ATCGAGGAGC AGATCACCGA ACGGGCCACC ACCATCCGGG TCCTGATGAT GGAGCTCAAC 
CGGATCTCCT CGCACCTGGT CTGGGTCGCC ACCACGGCCA TGGAGCTGGG TGCGATCAAC 
ATGATGCTGT ACGGCTTCCG GGAGCGGGAG TACATCCTGG AGATCTTCGA GCTGATCACC 
GGGCTGCGGA TGAACCACGC GTACGTCCGC CCGGGTGGGG TGGCTCAGGA CGTGCCGGAC 
GAGGCGATCG CCAAGATCCG CGACTTCCTG AAGCTGATGC CGAAGAAGCT CGAGGAGTAC 
GAGAAGATGC TCTCCGGCCA GCCGATCTGG CTGGAGCGTA CGCAGAACGT CGGGGTGCTC 
GACGCGACCG GTTGCCTCGC GCTCGGCGTG ACCGGACCGG TGCTGCGCTC CGCCGGCCTC 
GCCTGGGACC TGCGCAAGAC CATGCCGTAC TGCGGCTACG AGACGTACGA GTTCGACGTG 
CCGACCCACA CCGATGGTGA CGTGTGGGGC CGGTATCTGG TTCGGCTCGC CGAGATCCGG 
GAGTCGTTGA AGCTCGTCGA GCAGGCGGTG GACCGGCTTC GGCCGGGTCC GGTGATGGTG 
GCGGATCGGA AGATCGCCTG GCCGGCGCAG CTCGCCATCG GGGTCGACGG CATGGGCAAC 
TCACTGGAGC ACGTAGCGAA GATCATGGGG CAGTCGATGG AGTCGCTGAT CCATCACTTC 
AAGCTCGTCA CCGAGGGCTT CCGGGTTCCA CCCGGCCAGG TGTACGTGGC CCTCGAGGCG 
CCCCGGGGCG AGCTGGGCGT GCACGCGGTC TCCGACGGGG GGACCCGCCC GTACCGGGTG 
CACTACCGGG AGCCGAGCTT CGTCAACCTC CAGGCCCTGC CGGCGATGGC CGAGGGCGGC 
CTGATCGCCG ACGTGATCGC GGGTGGCGCC TCGCTGGACC CGGTGATGGG TGGGTGTGAC 
CGGTGA

Protein sequence

MSASNYATER ETAEGKVFTV TGGDWDVVVS GTDPINDERI VVNMGPQHPS THGVLRLVLE 
LEGETVREAR SVVGYLHTGI EKNLEFRNWV QGSTFVTRMD YLAPLFNETA YALAVEKLLG 
IEEQITERAT TIRVLMMELN RISSHLVWVA TTAMELGAIN MMLYGFRERE YILEIFELIT 
GLRMNHAYVR PGGVAQDVPD EAIAKIRDFL KLMPKKLEEY EKMLSGQPIW LERTQNVGVL 
DATGCLALGV TGPVLRSAGL AWDLRKTMPY CGYETYEFDV PTHTDGDVWG RYLVRLAEIR 
ESLKLVEQAV DRLRPGPVMV ADRKIAWPAQ LAIGVDGMGN SLEHVAKIMG QSMESLIHHF 
KLVTEGFRVP PGQVYVALEA PRGELGVHAV SDGGTRPYRV HYREPSFVNL QALPAMAEGG 
LIADVIAGGA SLDPVMGGCD R