Gene Sare_3035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3035
Symbol
ID	5707237
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3444038
End bp	3445237
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	71%
IMG OID	641272480
Product	hypothetical protein
Protein accession	YP_001537848
Protein GI	159038595
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACCA CCGTGTGCGT CGTCGGCGGC GGACCCGCAG GGCTCGTCCT GGGGCTGCTG 
CTCGCCCGGC AGGGAGTGGC GGTCACCGTG CTGGAGAAGC ACGCCGACTT CCTCCGGGAC 
TTCCGGGGCG ACACCGTGCA CCCCTCCACA CTGAACATGC TCGACGAAAT CGGGCTTGGC 
GAACGGATGG CGGCGTTGCG CGGGCGCAAG GCCGGCGCGT TGCGCGCCAC CTTCGACGAC 
GGCACGTACG CCATCGTGGA CTTCACCCGC CTGCCGGTGC CCCACAACTA CCTGTACTTC 
GTCCCCCAGT GGGACTTCCT GGAAATGCTC GCGACCGAGG CGGCGAGACT TCCGACCTTC 
ACGCTGCTCC GCTCCGCCAC CGTGACGGGC CTGCTCCGCG ACGAGTCCGG CGCTGTCGCC 
GGCGTTCGGG CCGTGGGTCC GGAGGGCGAA CTGGAGATCC AGGCGTCGCT CACCGTCGCC 
TGCGACGGCC GAGATTCGGC GGTACGCCGG GAACTCGGCC TGAAGCCCGT CGAGTACGGC 
GCACCCATGG ACGTACTGTG GTTCCGGATC TCGCGCCAGG CAGACGACGG CGACGGCCTG 
GCGATGCGGA TCGGCGCCGG AGGGCTGATG CTCGCCGTCG ACCGCGGCGA CTACTACCAG 
TGCGCTTACG TCATCGCCAA GGGCGGCTAC GACAAGATCC GCGCAGCCGG GCTGGAGGCG 
CTGCGGAAGC AGGTGACCCG GCGACACCCG ACCCTCGCCG ACCGGGTCGG CGAGCTCGCC 
ACCTGGGACG ACGTCAAACT GCTGACGGTG AAGGTCAACC GGCTCAAGCG GTGGCACGCA 
CCCGGCGCGC TGCTCATCGG CGACGCCGCG CACGCCATGT CCCCGATCGG CGGCGTCGGC 
ATCAACCTGG CAGTACAGGA CGCCGCGGCC ACCGCCCGGA TGCTGGGTCC AAAGCTCGCC 
ACCGGGCAGC CAGTGACCGA AGCGGACCTC GCCGCAGTGG AGAAGCGCCG GCGTTTGCCG 
GCGGTGGTGA CGCAGAACAT CCAGCGTGCC GCGCAGCGAC GCGTCGTCGA CCCCCTGCTG 
CACACCACCG GCCGGGTCGA GGCCCCGGCG CCGATCCGCC TGCTGCAGCG GATCCCGGCG 
TTGCAAGCCC TCCCCGCCCG ACTCGTCGGC ATCGGCGTAC GCCCCGAGCA CCTACGCTGA

Protein sequence

MKTTVCVVGG GPAGLVLGLL LARQGVAVTV LEKHADFLRD FRGDTVHPST LNMLDEIGLG 
ERMAALRGRK AGALRATFDD GTYAIVDFTR LPVPHNYLYF VPQWDFLEML ATEAARLPTF 
TLLRSATVTG LLRDESGAVA GVRAVGPEGE LEIQASLTVA CDGRDSAVRR ELGLKPVEYG 
APMDVLWFRI SRQADDGDGL AMRIGAGGLM LAVDRGDYYQ CAYVIAKGGY DKIRAAGLEA 
LRKQVTRRHP TLADRVGELA TWDDVKLLTV KVNRLKRWHA PGALLIGDAA HAMSPIGGVG 
INLAVQDAAA TARMLGPKLA TGQPVTEADL AAVEKRRRLP AVVTQNIQRA AQRRVVDPLL 
HTTGRVEAPA PIRLLQRIPA LQALPARLVG IGVRPEHLR