Gene Sare_4451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4451
Symbol
ID	5704942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5029456
End bp	5030988
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	66%
IMG OID	641273867
Product	proton-translocating NADH-quinone oxidoreductase, chain M
Protein accession	YP_001539216
Protein GI	159039963
COG category	[C] Energy production and conversion
COG ID	[COG1008] NADH:ubiquinone oxidoreductase subunit 4 (chain M)
TIGRFAM ID	[TIGR01972] proton-translocating NADH-quinone oxidoreductase, chain M

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0655371
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGACT TCCCGTTTCT TTCGGTGCTC ACCGTGGCGC CGCTGGTCGG TGCCCTGGTG 
GTCGCCGTCC TGCCTCGCCG TCGGCCGGAA CTGGCCAAGC AGGTGGCGCT CGGCTGGTCG 
CTGCTGGTGC TGGCGCTGTC GGTGGTCATG TGGGTGACCT GGCAGACCGG TGGCGAGCGG 
TTCCAGTTCC GCGAGTCCTA TCCGTGGATT CCGAACTGGG GCGTCAACTT CACCTTCGCC 
GCGGACGGCA TCGCGCTGGT CATGCTGATG CTGATCGCGG TGCTGGTGCC ACTGGTGATC 
CTGGCCTCCT GGCACGACGC CGAATCGTCG AAGCGATCGG TACCGGTCTA CTTCGCACTG 
TTGCTGGTTC TCGAGTGCAC GATGATCGGC GTGTTCGCCG CCGCCGACGT CTTCCTGTTC 
TACGTGTTCT TCGAGGTCAT GCTCGTGCCG ATGTACTTCC TCATCGGTAG TTACGGCGGC 
CACCAGCGGC AGTACGCGGC CGTGAAGTTC TTCCTCTACT CCCTGGTCGG CGGCCTGTTC 
ATGCTCGCCG CGGTGATCGG CCTGTGGGTG GTCGGCGGAA AGACGTTCGA CTGGGTGGCG 
TTGTCACAGG TCGACATCTC CACGGGCGCG GAACGTTGGC TGTTCCTCGG CTTCTTCGTC 
GCCTTCGCGA TCAAGGCACC GTTCTTCCCG TTCCACACTT GGCTGCCGGA CGCCGGTGGC 
GCTGCCCCGG CTGGGGCCGC GGCGTTGCTG GTCGGCGTGC TCGACAAGGT GGGAACGTTC 
GGCATCCTGC GCTACTGCCT TCCGCTGTTC CCGGACGCGG CGAAGTGGTT CGCCCCGTGG 
GCGCTGGCGT TGGGCCTGAT CGGCATCATC TACGCGGCGC TGCTTGCCGT CGGTCAGAAC 
GACCTGAAGC GGCTGGTGTC GTACACCTCG ATCGCGCACT TCGGCTTCAT CGGCGTCGGT 
ATCTTCGCGT TCACCAGCCA GGCAGCCACC GGTGCGGTGC TCTACATGGT CAACCACGGG 
CTCGCCACCG GTCTGCTCTT CCTGGTGGTC GGGATGCTGG TCGCCCGTCG GGGCTCCGCG 
CTGATCAGCG ACTTCGGCGG CGCCGGCAAA CTCGTGCCGC TGCTGGCGGG GGTGCTCTTC 
TTCGCCGGTC TCGCCTCGCT GGCGCTGCCC GGCACCGCAC CGTTCATCTC CGAGTTCCTG 
GTGCTGATCG GCACCTTCTC GGTGAACAAG CCGGTGGCCG TGATCGCCAC CCTCGGGATC 
ATCCTGGCCG CCGCGTACGT GCTCTGGATG GTGCAGCGCA CCACTCAGGG CACGCTGAAC 
CCGGCACTGA CCGAGGTCGA CGGCATGAAA CGCGACCTCA ACCTGCGCGA GAAGGTCGTG 
GTGGCCCCTC TGGTGGCGTT GATCGTGCTG CTCGGCTTCT ACCCGAAGCC GGTCACAGAC 
GTGATCAACC CTGCCGTCCA GGCCACCATG CAGGATATCG GCAAGACTGA CCCGGCCCCG 
TCGGCCGGCA CCACACAGGA GGCGAGCCGG TGA

Protein sequence

MSDFPFLSVL TVAPLVGALV VAVLPRRRPE LAKQVALGWS LLVLALSVVM WVTWQTGGER 
FQFRESYPWI PNWGVNFTFA ADGIALVMLM LIAVLVPLVI LASWHDAESS KRSVPVYFAL 
LLVLECTMIG VFAAADVFLF YVFFEVMLVP MYFLIGSYGG HQRQYAAVKF FLYSLVGGLF 
MLAAVIGLWV VGGKTFDWVA LSQVDISTGA ERWLFLGFFV AFAIKAPFFP FHTWLPDAGG 
AAPAGAAALL VGVLDKVGTF GILRYCLPLF PDAAKWFAPW ALALGLIGII YAALLAVGQN 
DLKRLVSYTS IAHFGFIGVG IFAFTSQAAT GAVLYMVNHG LATGLLFLVV GMLVARRGSA 
LISDFGGAGK LVPLLAGVLF FAGLASLALP GTAPFISEFL VLIGTFSVNK PVAVIATLGI 
ILAAAYVLWM VQRTTQGTLN PALTEVDGMK RDLNLREKVV VAPLVALIVL LGFYPKPVTD 
VINPAVQATM QDIGKTDPAP SAGTTQEASR