Gene Sare_5013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_5013
Symbol
ID	5705468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5682164
End bp	5683843
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	72%
IMG OID	641274406
Product	hypothetical protein
Protein accession	YP_001539747
Protein GI	159040494
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000363082
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCTGTCG CGGTGACCGA CGCGGCGGGC GCTCGGCGGG TCTCCGCCCG GCAGTTCGTC 
CGGCTCAAGC TACGGGTGAT GGGCAACAAC TTCCGGGGCC AGAGCTGGCG GATCGCCCTC 
TTCGTGCTCG GGGCGTTCGG CGGGCTCTGG CTCGCCACGG TCGGCTTCTT CCTCTTCGCC 
GCTCCGGGCC TCGGCGGCAG CGACCGGTAC GCCTCGGTGG TCGCGGCCCT CGGCGGCGGG 
CTGCTGGTGC TGGGCTGGCT GCTGCTGCCA CTGATCTTCT TCGGGGTCGA CGAGACGCTG 
GACCCGGCTC GCTTCGCGCT GCTTCCGCTG TCTCGTCGAA TGCTGGTCAC CGGCCTGTTC 
GCGGCGGCGC TGGTGAGCGT GCCGGCGGTA GCCGTGCTGC TGGCGTCCAC CGGCCTGATC 
CTCACGGCGG GGTTGCTCGG CGGTTGGCCC GCCGCCCTTA CGCAGGCGGT TGGGGTGTTG 
GCCGGCCTGC TGCTCTGCGT CGCCGCCGCT CGCGCCGTCA CCAGCGCCTT CGCCACGATG 
CTGCGTTCCC GTCGGGTCCG CGACCTGGCG GCGGTGCTGC TGGCTGGGGC CGCCGCCCTG 
ATCGCGCCGG TGCAGCTGGC CGCAGCCGCC GCACTGCGCG ACGCGGACTG GGACCGGCTC 
GTTTCGGTGG CGACCATGAT CGGGTGGACA CCACTTGGCG CCCCGTGGAC CGTCGGCATC 
GATGTCGCGC AGGGGCGGGT CTGGGCCGCA CCGGTGAAGC TGCTGATCAC CACACTCACC 
ATGGTGGCGC TGCTGGCCTG GTGGTCCCGC TCGTTAGAGT CGGCGATGGT CGGCATGGCA 
AACAGTGGTC GGGCGTCGGC CCGGCCGGAG GCCTCTGGCA CCGCCGTCAC ACAGCTCTTT 
CCCCGCGCGC TGGGCTGGCT TCCCCGGGAC CGCTTCGGCG CGCTGGTGGC ACGGGAGGCG 
CGGTACTGGT GGCGGGACGC CCGCCGTCGG GCGAACCTCA TCACGCTGGC CGTGGTCGGT 
CTGTTCGTAC CAGTCATGCT CAATCTCGGC GGTGCCGGCC TCACCGGCGA CACCGGTGGC 
GGCGTTCCAA ACTCGTCACC CGTCCTGGTC AACCTCTCCA TGATCTTCGT CGGGGTGCTC 
GCCACCGCCA CCCTGGCCAA CCAGTTCGGC TTCGACGGCA GCGCGTACGC GGCACACGTG 
GTCGCGGATG TGCCGGGCAC GGTGGAGCTG CGGGCCCGGA TGGCGGCGTT CTCGCTCTAC 
GTCCTGCCGC TGGTGGTGGT CATCTCCGTG GTGCTCGCCC TGCTTCTGGG TAAGCCGGGT 
TGGGTCGGTC TGACGGCGGG GAGCCTGCTC GCCACCTACG GTGCCGGGCT CGCGGTCAAC 
ACGTTGCTGT CGGTGCTCGG GGCATACTCG CTGCCGGAGA CGAGCAACCC GTTCGCGCTG 
AACAGCGGCG CCGGGGTGGC CCGCAGTTTC CTGGGCATCC TGTCCATGCT CGCCTCAGCG 
GTCGCGGTGA TTCCGATGGT GGCGGCCGCC GCACTGCTCG GCGACGTCTG GCTCTGGCTG 
GCCCTGCCGG TCGGTGCGGC CTACGGGCTG GGCGCGGCGC TGCTCGGTGC CTACCTGGCC 
GGCGACGTAC TGGACCGTCG CCGTCCCGAA CTGCTGGCGA CAGTCACGCC TCGCCGCTGA

Protein sequence

MAVAVTDAAG ARRVSARQFV RLKLRVMGNN FRGQSWRIAL FVLGAFGGLW LATVGFFLFA 
APGLGGSDRY ASVVAALGGG LLVLGWLLLP LIFFGVDETL DPARFALLPL SRRMLVTGLF 
AAALVSVPAV AVLLASTGLI LTAGLLGGWP AALTQAVGVL AGLLLCVAAA RAVTSAFATM 
LRSRRVRDLA AVLLAGAAAL IAPVQLAAAA ALRDADWDRL VSVATMIGWT PLGAPWTVGI 
DVAQGRVWAA PVKLLITTLT MVALLAWWSR SLESAMVGMA NSGRASARPE ASGTAVTQLF 
PRALGWLPRD RFGALVAREA RYWWRDARRR ANLITLAVVG LFVPVMLNLG GAGLTGDTGG 
GVPNSSPVLV NLSMIFVGVL ATATLANQFG FDGSAYAAHV VADVPGTVEL RARMAAFSLY 
VLPLVVVISV VLALLLGKPG WVGLTAGSLL ATYGAGLAVN TLLSVLGAYS LPETSNPFAL 
NSGAGVARSF LGILSMLASA VAVIPMVAAA ALLGDVWLWL ALPVGAAYGL GAALLGAYLA 
GDVLDRRRPE LLATVTPRR