Gene Sare_4230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4230
Symbol
ID	5704401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4802216
End bp	4803811
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	73%
IMG OID	641273649
Product	oxidoreductase molybdopterin binding
Protein accession	YP_001539002
Protein GI	159039749
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.14088
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCAGTA CGAACCGTCG CCACGCCGCC CTTGCTGGGG TGACCGCCGC TGCTGTGGCG 
ATCGGCTCGG CGGAACTCGT CGCGGTGTTG ACCGGCCCCC GTTCTGCCCC CTTGGTCGCC 
GTCGGCGGGC TGGTGGTCGA CACCGTGCCC GAGCCGCTCA AGCAGGCTGG CATCGCGTTA 
TTCGGCAGGT ACGACAAGGT AGCCCTGCTG GTGGGGATGG CCCTGCTGCT TGCCGGCTTC 
GCGGCGCTGC TCGGGGTGCT GTCCCGTCGG CAGCTGGCGT ACGGGCTGAC CGGTGTCACG 
GCGTTCACGG CGCTGGGGGC GTTCGCAGCC CTGACCCGGG CCGGCGCTGA TCTCGCGGAC 
GCCCTGCCGG CGCTGGTTGG CGGTAGCCTC GGCGGGTTGG TGCTCTGGGC GTTCATCCTG 
GGTCCGCTGG AGCTGGATCC GTGGCCCTGG TCGTCACCCC TGCCACCGGC CGGGCCGGGG 
GTGCCGGTTG CCGTCTCGGC CGACCATGGG GAGGTCGCGG GGCCGGCCCC GGAGTCCCGG 
CGACGGTTCC TCGCCGCGAG TGGGTTGTTG CTCGGGGCGG CGGGGGCGGC CGGTGTCGGC 
GGCCGGTGGT TGGCTGGCCG GCGGGGGGTT TCGGTGGCCC GCGAGGCGGT CGTGTTGCCG 
GCCCCGGCGT CGCCGGCGCC CGCCGTCCCG GCCGGCGCCG ACCTGAAGGT CACCCAGCTG 
GCTCCCTACG TCACACCCAG ATCCGCCTTC TACCGGATCG ACACGGCCCT GGTGGTGCCG 
CAGGTTGACC CCGCCACCTG GCAGTTGCGC ATCCACGGTC GGGTCCGCAA CCCGATCACC 
CTCAGCTTTG CCGACCTGCT GGCACGGCCG CTGGTCGAGC GCTACGTCAC GCTGGCCTGT 
GTGTCGAACG AGGTCGGCGG CGACCTGATC GGCAACGCCC GCTGGCTGGG GGTGCCGCTG 
CGGGACCTGT TGGCGGAGGC GGAGCCGCAG GAGGGCGCGG ACCAGGTCGT TGGGCGGTCG 
GTTGACGGCT GGACCTGTGG CACCCCCACG GCCGTGCTGC GGGACGGCCG GGACGCGCTG 
CTGGCAATCG GTATGAACGG TGAGCCGCTG CCGGTTGAGC ATGGCTTCCC GGCCCGGATG 
GTGGTGCCGG GTCTGTACGG CTACGTGTCG GCCTGCAAGT GGGTCACCGA ACTGGAGTTG 
ACCAGCTTCG CGGACTTCGA CGCGTACTGG GTGCCGCGCG GTTGGTCGGC GCTGGGCCCG 
GTGAAGACCC AGTCGCGAAT CGACACGCCG CGTCGGCGGA ACCGGCTGGT GGCTGGGGAG 
GTGGTCGTCG CGGGGGTGGC CTGGGCCCAG CACCGCGGCA TCCGGCGGGT CGAGGTCCGG 
GTGGACGAGG GCCCTTGGCA GGAGGCCGAC CTCGCACCGA CGGTCTCGGT GGATACCTGG 
GTGCAGTGGT CGTGGCGGTG GGACGCGACG CCGGGGGAGC ACACGCTCCA GGTTCGGGCT 
ACCGACGCGA CCGGTGAGAC GCAGACCGGC CGGCCTGCTC CGGTCGCGCC GGACGGCGCG 
ACCGGCTGGC ACACGGTGCG CGTGACGGTC CGTTAG

Protein sequence

MTSTNRRHAA LAGVTAAAVA IGSAELVAVL TGPRSAPLVA VGGLVVDTVP EPLKQAGIAL 
FGRYDKVALL VGMALLLAGF AALLGVLSRR QLAYGLTGVT AFTALGAFAA LTRAGADLAD 
ALPALVGGSL GGLVLWAFIL GPLELDPWPW SSPLPPAGPG VPVAVSADHG EVAGPAPESR 
RRFLAASGLL LGAAGAAGVG GRWLAGRRGV SVAREAVVLP APASPAPAVP AGADLKVTQL 
APYVTPRSAF YRIDTALVVP QVDPATWQLR IHGRVRNPIT LSFADLLARP LVERYVTLAC 
VSNEVGGDLI GNARWLGVPL RDLLAEAEPQ EGADQVVGRS VDGWTCGTPT AVLRDGRDAL 
LAIGMNGEPL PVEHGFPARM VVPGLYGYVS ACKWVTELEL TSFADFDAYW VPRGWSALGP 
VKTQSRIDTP RRRNRLVAGE VVVAGVAWAQ HRGIRRVEVR VDEGPWQEAD LAPTVSVDTW 
VQWSWRWDAT PGEHTLQVRA TDATGETQTG RPAPVAPDGA TGWHTVRVTV R