Gene Sare_4645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4645
Symbol
ID	5706232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5264816
End bp	5265946
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	66%
IMG OID	641274046
Product	hypothetical protein
Protein accession	YP_001539393
Protein GI	159040140
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0894942
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGCGG TGCTGCAGGT CGTGGGCTTG GGGTCGATGT GGATGGTGGT AGCCCTGCTT 
CTCCCGCAGG CCTTGGGCGA TGCCAAACGG CGCATGCTGT GGGCGGTTGT CCTGCTGTTC 
GCGATCGAGC TGACGCTGTA CCGGCCAGAG GTGCAGGCAC CGCTGTACGA CGTGATCAAC 
GGACATGTCG TCTTCGTGGC GGTGCATCTG GTGAGCGTCG GCAAAGGGGT CGGCGTGCTG 
TACCTGCTGC TCGTGCTGGT ACAGCGCCCA CGTTTTCGGC TACCGGTAGC GGCATCGGGG 
GTGGCGGTCT CAGCCGCGAT GATCGCTATC TATGCGGCGG CTCGGCCGGA GCCAGCGACG 
GTTGACATCC CACCGGAGAT ACCGCTGGTC TACTGGCACA TTCTTGCGGT GTTCCACACG 
GTTGCGCATC TGCTGGCAGT TGGGTTGTGT TGGCACGCGA GTCGGCTTGT CGCGCCGAGA 
GCGATGCGCA TCAGCCTGAT GGCGTTGACG GGTGGGCTGT TGCTGGCATG CCTGCCGTGG 
GCGTTCAACC TCGGCTGGCT CCTCAGCGAT GACACCGCCT GGCTCGCTCC GATCGGACCG 
ATTGACACGG TGACCGGGCT GTTCTTCGCC TTCGGTGCCG CGTTGCCGCT GGCGGCGTCG 
GTGCGACGGG CAGTGCGGCA CGACCGGGCA ATACGTCAGC TGGAGCCGCT GTGGCGAGAG 
CTCACCTCCG TGGTACCCGA CGTTGTCTTC GAAGCGGTCC GGCCCGGGCT CGGTACGCGT 
CAGCGTCGGC TGCGGCTGTA TCGACGCGTG GTTGAGGTTC GAGACGCGAT GCTGGTGCTG 
CGTGAGTATG TCACTGCTGA TGATCTACGC GGGGCGCAGG AACATGTTGC CGCCGAGTTG 
CCCGACGAGC ATCGACGGGA GGCCGCGGCC ACCGCCTGCT GGCTGGCCGC CGCGGTAGCT 
GCGAAGTCGC GTGGCGACGC GCCGATGGTG CAGCAGGAGG ACCTGACGAG CGCCCCCGGT 
GACGATCTCG ACGAAGAGGT TACGCAGCTA CTGGAGGTAG CGCAGTGGTA CCGCTCGTCG 
CTGGTGAGTC GGTATCGGAC CGGACTGCCG CCGGTCACCG CGTCCCAGTA G

Protein sequence

MTAVLQVVGL GSMWMVVALL LPQALGDAKR RMLWAVVLLF AIELTLYRPE VQAPLYDVIN 
GHVVFVAVHL VSVGKGVGVL YLLLVLVQRP RFRLPVAASG VAVSAAMIAI YAAARPEPAT 
VDIPPEIPLV YWHILAVFHT VAHLLAVGLC WHASRLVAPR AMRISLMALT GGLLLACLPW 
AFNLGWLLSD DTAWLAPIGP IDTVTGLFFA FGAALPLAAS VRRAVRHDRA IRQLEPLWRE 
LTSVVPDVVF EAVRPGLGTR QRRLRLYRRV VEVRDAMLVL REYVTADDLR GAQEHVAAEL 
PDEHRREAAA TACWLAAAVA AKSRGDAPMV QQEDLTSAPG DDLDEEVTQL LEVAQWYRSS 
LVSRYRTGLP PVTASQ