Gene Sare_5057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_5057
Symbol
ID	5705332
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5725499
End bp	5726749
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	75%
IMG OID	641274450
Product	MoeA domain-containing protein
Protein accession	YP_001539791
Protein GI	159040538
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.44435
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00713418
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAAGCCG CAGCCACCGA TCAGGCCGCC GCGCCCCCAC CGGCCGGATG GGAGGAGGCG 
CGATCGCGGG TCTACGCGGT TGGTCGGGCC GCCGCGCTGC CGGTGGTAAG CCGGCCACTC 
GTCGAGATCG ACGGCCACAC GCTGGCCGAG CCGTTGACCA CCCGGACGCC CCTACCGGCG 
TTCGCCACGG TCAGCGTGGA CGGCTGGGCG GTACGTGGTG CGGGCCCGTG GCGGATCGTG 
GGTCAGGTCC TGGCCGGCGG TGTCCCGGGA CCGCTGACAG CCGACGGCAC GGCGGTCGAG 
ATCGCCACCG GTGCGATGGT TCCCGACGGC GCCGCGGCGG TGCTACGGAT CGAGGAGTCG 
AGTCGCACCC CGGACGGGCT GGTGACCGGC ACCCCGCGTC CCGTGCCGGA GTGGCGTCTG 
CCGGGCGAGG AGGCGAACGC CGGGGAGGAA CTTCTTCCCG TCGGCACCCC AGTGGACCCG 
GCGGTGATCG GGCTGGCCGC CTCCTGCGGG CATGACGACC TGCGCGTACG GCGGCAGCCG 
CGCGCGGCGC TGTTGGTCTT CGGCGACGAG CTGTTGACGG CGGGGCCGCC CGGGGCGGGA 
CGGGTACGCG ACGCGCTCGG CCCCGCGGTG CCGGCCTGGC TGCGCCGGTA CGGGTGCACG 
GTGGACCCGT CCGATGTGGT GGGACCTGTG GCGGATACCC TTCCCGCGCA CGTGGCGGCG 
CTCAGTGGCG CCCTCGCCGA CGCCGACCTG GTCTGCACGA CCGGCGGCAC CATGCACGGC 
CCGGTGGACC ACCTGCACCC GGCGCTGGAG GCGTTGGGGG CGGAATACGT GGTCAACACC 
GTCGCGGTTC GGCCCGGCTT TCCGATGCTG CTGGCCCGCC TGGTCGGTGC GGACGGCCGG 
GTACGTTTCG TCGCCGGGCT GCCTGGCAAC CCGCAGTCCG CGGTGCTCGC CCTGGCGTCG 
TTGGTCGCCC CACTGCTGGC CGGCCTCGCT GGCCGGCCGA TGCCGGCGCT GACGCAGGCG 
GAGCTGACCG GGCCGATCCC CGGGCGGGGC AGTTTCACCC ATCTTGCGTT GGTCCGGCTG 
GACCGAGTCG CCGGCACCGC CCACCCGCTC CGGCACGTCG GGTCGGCCAT GCTGCGCGGC 
CTGGCCCAGG CCGACGGGTT CGCGGTGATC GGCCCCGGCG CCTCCGGTGA GCCGGGCGAC 
CGGGTGCCGG TCGTGTCGTT GCCGCTGCTG CCCGGGGAGC GTGGGGCGTG A

Protein sequence

MEAAATDQAA APPPAGWEEA RSRVYAVGRA AALPVVSRPL VEIDGHTLAE PLTTRTPLPA 
FATVSVDGWA VRGAGPWRIV GQVLAGGVPG PLTADGTAVE IATGAMVPDG AAAVLRIEES 
SRTPDGLVTG TPRPVPEWRL PGEEANAGEE LLPVGTPVDP AVIGLAASCG HDDLRVRRQP 
RAALLVFGDE LLTAGPPGAG RVRDALGPAV PAWLRRYGCT VDPSDVVGPV ADTLPAHVAA 
LSGALADADL VCTTGGTMHG PVDHLHPALE ALGAEYVVNT VAVRPGFPML LARLVGADGR 
VRFVAGLPGN PQSAVLALAS LVAPLLAGLA GRPMPALTQA ELTGPIPGRG SFTHLALVRL 
DRVAGTAHPL RHVGSAMLRG LAQADGFAVI GPGASGEPGD RVPVVSLPLL PGERGA