Gene Sare_0201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0201
Symbol
ID	5706220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	217771
End bp	220080
Gene Length	2310 bp
Protein Length	769 aa
Translation table	11
GC content	70%
IMG OID	641269727
Product	aldehyde oxidase and xanthine dehydrogenase molybdopterin binding
Protein accession	YP_001535127
Protein GI	159035874
COG category	[C] Energy production and conversion
COG ID	[COG1529] Aerobic-type carbon monoxide dehydrogenase, large subunit CoxL/CutL homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00447833
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCGCCA TGGCCTGGAT CGGCTCCGAC CATGTCCGCC ACGACGGCAC CGAGAAGGTC 
CGCGGCGAAC CGATCTATGG TGCCGATCGC ACGGCCGAGG CGATGACGTA CGCGGTCCCG 
GTCAGTGCGA CCGTGGGCCG GGGCCGGATC ACGGCGCTCG ACACTACCGC CGCGCAGCGG 
GTGCCGGGCG TGCTCGCGGT GCTCACACAC GAGAACCTGG ACCGCCTGCA CCCGGCCGAC 
TTCGCCTATG GCGTGGGGAG CGCGAGCGCG AGCTACCAGC CGATGCAGGA CGCCGTCGTG 
GCCTACCGGG GTCAACCGAT CGCGCTTGTC GTGGCTGAGA CCCTGGAGGC CGCGGCGGAA 
GCCGCCGGGT TGGTGACCGC CGGGTACGAG GTCGAACCGT TCGCCGTCAC ACTCGACGAT 
CCGGCGGCCG AATCGGTCGA CCAGGCGCAG GCGGTGCCCA CGTTCCCGGT GCTGGAGATC 
GGGGAGGGTG ATCGGCTACT CGACCAAGCG CCGGTCGTGG TCGACGCCAC CTACGGCACG 
CCGGCGCAGC ACCACAACGG GCTGGAGCTG CTGTCCACCG TCGCCGAGTG GAAGGACGGT 
TCACTTCTCA TCCATGAGGG CACTCAGGCG GCGGGACGCG TACGGCACGC GCTGGCGAAT 
CAGCTCGGGA TCCCGATGGA AATGGTCCGG GCAGTTGCGC CATACCTCGG TGGCGGCTTC 
GGCCAGCGCA CCGGTCAGAC GTTCAACACG GTGCTCGCTG CTCTCGCCGC GCGGCGGATC 
GGTCGGCCGG TGAAGCTGAT CGTCCCGCGG GCCGACGTGT TCCACATGGT GCACTTTCGT 
CCGGCGTCCC GGCACCGCAT CCGGCTCGGT GCACGGGACG ACGGCACGAT CACCTCCCTG 
GTGCACGACG CGCATGCGCA AACGTCACGC CACGATCTGA TGCCGTTCTG GGGGCCGGAA 
GTCTCGTCCC GCATGTACGG CATCCCGAAC TTTCGCGGCA CGACCACGCT GGTGCGTCTC 
GACACCCAGA CGCCCGGCTA CATGCGGGCG CCGATGGAGA TGGTGACGAT GTTCGCGGTG 
GAGAGCGCGC TGGACGAACT CGCCGAGCGG CTACACGTCG ACCCGGTCGA GCTACGCCGG 
CGCCACGACA CCGCCACCGA CCCGCTGACC GGCAGACCGT TCTCCTCGCG GCGACTCAAG 
CAGTGCCTCG ATCGGGGTGC CGAGCGGTTC GGGTGGTCCA GACGCGATCC GGCGGCCGGG 
TCGATGCGCG CCGACGACGG CAGTCTCGTC GGCTGGGGTA TGGCGGCAGG CTGCTATCCC 
GGCATCGCCT CCGCCGCCGG CTCCCGGATA CGGCTGCACG AAAACGGCAC GGCGGACGTC 
GCGGTCAGCG GACACGAGAT GGGCCAGGGG ATTCGCACCG TGATCGCGCT GGTCGCGGCC 
GAATCTCTCG GCCTGCCGCC AGATCGAATC CGCATCACCA TCGGAGACAC CCGGGTCGCT 
CCTCAGCCAG AAACCGGCGG TTCGTGGGGA ACCGCCACCG CTGTGCCCGC GGTCCGGGAC 
GCGGCCAACG ACATCCGGGC CCAACTGCAT CAGATCGCCG CCGCCCGTGG CGAGTCCGTC 
GCCACCGTCG ACGTCACCGA GTGCCGACTG GCAGACGGCA GGCTGGTCGG CCCGGACAAT 
TCGGGGCCAC TGATGACCGG GCTCCTGATG GCCGCCGGCC GCTCCTCGGT TGAGGCGACG 
GGGCAGTACT ACGCCCCGGG GCAGCAGCCG TCCGAGGCCC CGACCCTGGC TCCGGCGCGG 
AAGAGCGCGG TGATGGCGGA CGTCGGCAGT GCCTTCGTGG GCCCGGCGTT CCCCGGTTTC 
GTCACCTGGT CCTACATCGC CCACTTCGTC GAGGTCCGCG TCGGAGCCCG GGTCCGCCGA 
CCGCGGGTCA CCCGGATGCT GTCGGTGATC GACTGCGGCC GGGTGATCAG TCGGCGTACC 
GCCACCAGCC AGGCACTGGG CGGCCTGGTC TGGGGCATCA GCACCGCGCT CAGTGAGGAG 
AGCATCGTGG ACCCCCGCTA CGGCGGGTTT CTCAACTCCA ACCTGGGCGA CTACAAGATG 
CCGGTGAACG CCGACATACC CACGCTCGAC GTCGACTTCA TCGACGAGCC CGACCCCTCG 
TTCAGCGCGT TCGGTATCAA GGGCCTGGGG GAGGTCGTCC ATGTCGGGGC AGCAGCCGCG 
ATCACCAACG CCATCTACCA TGCAACCGGC GTCCGGGTCC GGGATCTGCC CGTACACATC 
GAGGACCTGA TGACGGAGAC CTCCCGATGA

Protein sequence

MSAMAWIGSD HVRHDGTEKV RGEPIYGADR TAEAMTYAVP VSATVGRGRI TALDTTAAQR 
VPGVLAVLTH ENLDRLHPAD FAYGVGSASA SYQPMQDAVV AYRGQPIALV VAETLEAAAE 
AAGLVTAGYE VEPFAVTLDD PAAESVDQAQ AVPTFPVLEI GEGDRLLDQA PVVVDATYGT 
PAQHHNGLEL LSTVAEWKDG SLLIHEGTQA AGRVRHALAN QLGIPMEMVR AVAPYLGGGF 
GQRTGQTFNT VLAALAARRI GRPVKLIVPR ADVFHMVHFR PASRHRIRLG ARDDGTITSL 
VHDAHAQTSR HDLMPFWGPE VSSRMYGIPN FRGTTTLVRL DTQTPGYMRA PMEMVTMFAV 
ESALDELAER LHVDPVELRR RHDTATDPLT GRPFSSRRLK QCLDRGAERF GWSRRDPAAG 
SMRADDGSLV GWGMAAGCYP GIASAAGSRI RLHENGTADV AVSGHEMGQG IRTVIALVAA 
ESLGLPPDRI RITIGDTRVA PQPETGGSWG TATAVPAVRD AANDIRAQLH QIAAARGESV 
ATVDVTECRL ADGRLVGPDN SGPLMTGLLM AAGRSSVEAT GQYYAPGQQP SEAPTLAPAR 
KSAVMADVGS AFVGPAFPGF VTWSYIAHFV EVRVGARVRR PRVTRMLSVI DCGRVISRRT 
ATSQALGGLV WGISTALSEE SIVDPRYGGF LNSNLGDYKM PVNADIPTLD VDFIDEPDPS 
FSAFGIKGLG EVVHVGAAAA ITNAIYHATG VRVRDLPVHI EDLMTETSR