Gene Sare_3504 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3504
Symbol
ID	5703313
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4042828
End bp	4044234
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	69%
IMG OID	641272931
Product	flavin-containing monooxygenase FMO
Protein accession	YP_001538297
Protein GI	159039044
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2072] Predicted flavoprotein involved in K+ transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00172628
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGACCACCT CCACCGATCA CGGGCGGTCC GACCTGGAGT CGAGCAGCCT TGCCCTGACC 
CGCGACGGCC GTTCGGTCTC CGACCGCGGT GACACCGTCT GCGTGATCGG GGCGGGTGCG 
AGCGGGCTGA CCGCGATCAA GAATCTGACC GAGCACGGGT TCGGCGTCGA CTGCTACGAG 
CGGGAGACCG GAGTCGGCGG CGCGTGGAAC TGGCGACACG ACCGCAGCCC GGTGTACGCC 
AGCACCCACC TGATCTCGTC GCGTCCATTC ACCCAGTTTC CCGACTTCCC GATGCCGGAC 
GACTGGCCGG ACTACCCGCA TCACAGCCAG TTGTTGTCCT ATCTTGAGCG GTACGCGGAA 
CACTTCGACC TGCGCCGGCA CGTCTGGTTC GGCACCGAGG TGGTGCGGGT CGAGCCGGCT 
GACGGCGACC GGTGGGACGT CACGACCCGC AGTACCGGCG GCTACGGCCC GGAACGCACC 
TCCCGGTACG CCGCGGTCGT GATCGCCAAT GGTCACAACT GGTCGCCGAA GCTGCCCGAC 
TACGAAGGGC TCGCCGAGTT CCGGGGCGAG GCCATGCACG CCTCGTCCTA CCAGGACCCG 
GCGCAGCTGC GGGGCAAGCG GGTGCTGGTG GTGGGTGCCG GCAACACCGG CTGCGACATC 
GCCGTCGAGG CCGCGCAGCA GGCGTCGCGC TGCTGGCACG CCACCCGTCG CAGCTACTGG 
TACGCGCCGA AGTACGTCCT GGGTCGTCCA GTCGATCAGA TCAACGACGT GCTGCTGGCG 
CTGCGGGTGC CCCGGCGGGT CCGACAGTGG CTCTACCACC TCACCCTGCG GCTCACGGTG 
GGGGATCTGA CCCGGTTTGG GCTGGCGCGG CCTGACCACA GGATGCTCGA GACACATCCG 
ATCGTCAACA GTCAGCTCGT CCACTATCTG GGCCACGGCC GGATCACGCC GGTGCCGGAC 
CCCGTCCGTT TCCACCCGCA CTCCGTTGAG CTGGCTGACG GTCGCCGGAT CGATCCGGAA 
CTGGTGGTGT TCGCCACCGG CTACTTACCC CGGTTCGACT TCCTCGATCC GAAGATTCTC 
GGCGACGACG GCACGGTCGG GCGGCCGGTG TTGTGGCTCA ACGCCTTCGC GCCGAATCAC 
CCAACCCTCG CCGTGGCCGG GCTGGTGCAG CCCGACTCGG GCATGTTCCC GCTGTCGCAT 
TGGCAGACCG TGCTCTTTGC CCGCCTGCTG CGATCACGCG TGACCCGGCC CGGCCGGGCG 
GCGGGCTTCG CCGCCGCGGT GGTTGCCCGG GCGGGGGAGC GCTACGCGGG ACCGGTCAGG 
GACAGCAGCC GGCACTGGTT CGAGGTTGGT CACGTCGACT ACCTGCGCGC TCTCCAGCGC 
GCCCTGCACG ACCTGGAGGC CAAGTGA

Protein sequence

MTTSTDHGRS DLESSSLALT RDGRSVSDRG DTVCVIGAGA SGLTAIKNLT EHGFGVDCYE 
RETGVGGAWN WRHDRSPVYA STHLISSRPF TQFPDFPMPD DWPDYPHHSQ LLSYLERYAE 
HFDLRRHVWF GTEVVRVEPA DGDRWDVTTR STGGYGPERT SRYAAVVIAN GHNWSPKLPD 
YEGLAEFRGE AMHASSYQDP AQLRGKRVLV VGAGNTGCDI AVEAAQQASR CWHATRRSYW 
YAPKYVLGRP VDQINDVLLA LRVPRRVRQW LYHLTLRLTV GDLTRFGLAR PDHRMLETHP 
IVNSQLVHYL GHGRITPVPD PVRFHPHSVE LADGRRIDPE LVVFATGYLP RFDFLDPKIL 
GDDGTVGRPV LWLNAFAPNH PTLAVAGLVQ PDSGMFPLSH WQTVLFARLL RSRVTRPGRA 
AGFAAAVVAR AGERYAGPVR DSSRHWFEVG HVDYLRALQR ALHDLEAK