Gene Sare_0202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0202
Symbol
ID	5706221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	220077
End bp	221075
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	68%
IMG OID	641269728
Product	molybdopterin dehydrogenase FAD-binding
Protein accession	YP_001535128
Protein GI	159035875
COG category	[C] Energy production and conversion
COG ID	[COG1319] Aerobic-type carbon monoxide dehydrogenase, middle subunit CoxM/CutM homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.955618
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00748025
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGGACCT TCACCTACAC CCGGGTGCGC TCCGTACCAG AGGCCGTGAC GGCGTTCGCC 
ACCTCCACCG ATGACCGGCC GCACTACCTC AGCGGTGGCA CGACCCTGGT AGACCTGATG 
AAACTGGACA TCGAAGCACC CGGCCAGGTC ATCGACCTGA CTGACGTCAC CGACCTCGAC 
TTCGTCCGCG AGGAAGACGG TGACCTGGTC ATCGGCGCGT TGACCCGGAT GAGTGACGTC 
GCGAACCACC CGCTGGTCGG TGCCAGATGT CCGGCGCTCG CGGATTCACT GCTCTCCGGG 
GCTTCGCAAC AGCTTCGGAA CATGGCGCGA GTTGGCGGCA ACCTGCTGCA GCGCACCCGC 
TGCGACTACT TCCGATCGGT CGAGTTTCCC TGCAACAAGC GGCGGCCTGG GTCGGGATGT 
GCCGCGATCG GCGGCGTCAA CCGCCAGCAC GCCATCCTCG GTACCAGCGA ACACTGCATC 
GCCGTGTACC CGGGTGACTG GGCGGTGGCG CTGACCGCGT TCGACGCGAA CCTCGCGGTC 
GTCGGACCGA GTGGCACCCG CTCCATACCG ATCCATGACC TGATCGTGCC GCCCGGCGAC 
ACACCACACC GGGAGACAAC ACTCACGCCC GGCGAGTTCA TCACGACCAT CCGGGTGCCG 
ATGACACCGA CGGCACGGTC GTCCAGCTAT CGCAAGGTCG GCGACCGGAG TTCGTACTCG 
TTCGCGCTGG CGTCGGCCGC CGTCGGGCTC CACCTCGACG CGGGCGGCAC CGTCGACGAG 
GTACGGATCG CCCTCGGTGG CCTGGGCACC GTGCCCTGGC GACTGTGGGA CGCCGAACGA 
GCACTGACCG GTGGCCGGCT GGACGACGCA ACCGTACGGG CGGCGCTGGA GCCGGAGTTC 
CGGTCGGCAT GCACCACGAG GCAGAACGCC TTCCGGGTGC GGTTGGGTGT GGAAACCGTC 
CTTGAGGCTG TCGCCTCGGC GCAGGAGAGG GTGGGATGA

Protein sequence

MRTFTYTRVR SVPEAVTAFA TSTDDRPHYL SGGTTLVDLM KLDIEAPGQV IDLTDVTDLD 
FVREEDGDLV IGALTRMSDV ANHPLVGARC PALADSLLSG ASQQLRNMAR VGGNLLQRTR 
CDYFRSVEFP CNKRRPGSGC AAIGGVNRQH AILGTSEHCI AVYPGDWAVA LTAFDANLAV 
VGPSGTRSIP IHDLIVPPGD TPHRETTLTP GEFITTIRVP MTPTARSSSY RKVGDRSSYS 
FALASAAVGL HLDAGGTVDE VRIALGGLGT VPWRLWDAER ALTGGRLDDA TVRAALEPEF 
RSACTTRQNA FRVRLGVETV LEAVASAQER VG