Gene Sare_0472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0472
Symbol
ID	5703651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	540234
End bp	541745
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	72%
IMG OID	641269997
Product	proton-translocating NADH-quinone oxidoreductase, chain M
Protein accession	YP_001535392
Protein GI	159036139
COG category	[C] Energy production and conversion
COG ID	[COG1008] NADH:ubiquinone oxidoreductase subunit 4 (chain M)
TIGRFAM ID	[TIGR01972] proton-translocating NADH-quinone oxidoreductase, chain M

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.477344
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGA TCGTGGGGCA GGTCCTGCTG GTCGCGGTGC TGGCAGTGCC GACGGTCGGT 
GCGGCGGTCG TCGTCGCGCT TCGACACGAC CGGGCGGCCC GCCTGGTCGG CACGGTGGCC 
GCCGGGCTGA CCCTGCTCGC CACGCTGCCG CTGGTCGCCG GGCATGACGA CAGCGGCGTG 
GGCACCGACT CGACACCCGC GGTACGACCC TGGCACCAGG TGGACCTGCC CTGGGTGCCC 
GGCCTGGACC TGCGCTTCCA CCTCGGCGTC GACGGCATCT CCTGGCCGCT GGTGGTGCTG 
ACCGCGCTGC TGACCCTGCT CTGCTGCGGC TACACGCTGG GGAGGGTACC CAGCGGGGGC 
AGCGGTCGAG CCCTGGTGGC GTTGCTGCTG CTGGTCGAAG TGGGCATCCT CGGCACCTTC 
CTCGCGCTCG ACCTGGTGCT CTTCTTCGTC TTCTTCGAGG TCGTCCTCCT GCCGATGTAC 
GCGATCATCG CCGGCTGGGG CGGGCCCGAC CGGCACCGGG CGGCCCGTAA GTTCGCCCTC 
TACACACTGT TCGGCTCAGT GCTGCTGCTG GTGGGGGTAC TGGTGGTGGT GACCACTGCC 
GGCACCGCGG ACGTCGTGGC GCTGACCGGC GGCACCGGAC TCTCCCGCGG CCCGCAACTC 
GCCGCGTTCA CCCTGCTGGC ACTCGCCTTC GCGGTGAAGA GCCCACTGTG GCCACTGCAC 
TCCTGGCTGC CCGACGCGCA CACCCAGGCA CCGACCGTGG GCAGCGTGAT CCTCGCCGGA 
GTGCTGCTCA AGATGGGCAC GTACGGGCTG ATCCGGATCG CGGTCGGTGT CGCCCCCGAG 
GGCGCCGACT GGGCCGCGCC GGTGCTCGGT GTGCTCGCCG TCGCGGCGAT CCTGGTCGGA 
TCCCTGGTCT GCCTGGCGCA GACCGAGCTG AAGCGGCTGA TCGCGTACTC CAGCGTGGGG 
CACATGGGTT TCGTGCTCCT CGGCGTCGCC ACGCTCACCG GTACCGGGCT TCAGGCGGCC 
CTGATCGGCA ACGTCGCGCA CGGGATCATC ACCGGCCTGC TGTTCTTCCT CGCCGGCGCC 
GTGAAGGACC GGGCGCACAC CGGTGATCTG GTCGACCTGT CCGGTTTACG GGAGACCGCA 
CCCCGGCTGG CCGGGGTGCT CGGCTTCGCC GCCGTCGCCT CACTGGGCCT GCCTGGCCTG 
GCCGGCTTCT GGGGGGAGGC GTTCGCCGTG GTCGCCGCGG TCCGCGTCGG TGGTCCCCTC 
TGGCTGACCC TCGCCGTGCT CGCGGCGCTC GGCGGCGCGC TGACCGCCGC GTACCTCCTC 
CGGCTGCTCC GCCAGGTCAC CCACGGCCGG CCCAGCCCAG CGGTGGCGTC GGTCAGGCCC 
GGTGTGGCGG GGGTGGAACT GGTCACCTGG GCGCCACTGG TGTTGCTCAC GCTCGCCGTC 
GGACTGGCCC CGATTCTGGT CCTCGGCGTG GCCCACGCAC CGGTCGACGC GCTGCTGGCG 
GGTCTGCCAT GA

Protein sequence

MSGIVGQVLL VAVLAVPTVG AAVVVALRHD RAARLVGTVA AGLTLLATLP LVAGHDDSGV 
GTDSTPAVRP WHQVDLPWVP GLDLRFHLGV DGISWPLVVL TALLTLLCCG YTLGRVPSGG 
SGRALVALLL LVEVGILGTF LALDLVLFFV FFEVVLLPMY AIIAGWGGPD RHRAARKFAL 
YTLFGSVLLL VGVLVVVTTA GTADVVALTG GTGLSRGPQL AAFTLLALAF AVKSPLWPLH 
SWLPDAHTQA PTVGSVILAG VLLKMGTYGL IRIAVGVAPE GADWAAPVLG VLAVAAILVG 
SLVCLAQTEL KRLIAYSSVG HMGFVLLGVA TLTGTGLQAA LIGNVAHGII TGLLFFLAGA 
VKDRAHTGDL VDLSGLRETA PRLAGVLGFA AVASLGLPGL AGFWGEAFAV VAAVRVGGPL 
WLTLAVLAAL GGALTAAYLL RLLRQVTHGR PSPAVASVRP GVAGVELVTW APLVLLTLAV 
GLAPILVLGV AHAPVDALLA GLP