Gene Sare_1136 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1136
Symbol
ID	5704280
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1286850
End bp	1287836
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	73%
IMG OID	641270651
Product	hypothetical protein
Protein accession	YP_001536035
Protein GI	159036782
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0231211
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000385837
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCCGCCGG ACCCCGGTCT TGTCGACCTG GCCGGGGACG GGCGGCTGCG CCGACTCGAG 
TTGGCTGTGA CGCGGCGGCT CGACGGTCTG CTGCATGGCC GCTACCAGGG GCTGCTTCCG 
GGACCGGGCA GCGAACCGGC GGGCAGCCGG GAGTACCGGC CCGGCGAGGA CGAGGTGCGC 
CGGATGGACT GGGCGGTGAC GGCGCGCACG ACCGTGCCGC ACGTCCGTCA ACTGGACGCC 
GACCGGGAAC TCACCACCTG GCTGCTGGTC GACGCCAGCA TCAGCATGGA GTACGGCACG 
GCCGAGTTGG ACAAGCGGGA GCTCGCGGTA GCTGCCGTGG CGGCGGTCGG CTTCCTCACC 
GTCGGTGTGG GCAACCGACT CGGTGCCCAG GTGCTCACCC CGACCGCGCT GCGCCGGTAT 
CCCCCCGGCA GCGGCCGAAC CCACCTGTTC GGGCTGCTCC GGATGCTGTT GGCGGCCCCT 
CGGCACGGCG GCTACGACGG GGACACCGCG CCGCTCGCGT CGCCCGACCT GGCCACGGCG 
CTGGACGGCG TGCACCGGAC AGCCACCCGT CGCGGGCTCG TCGTGGTGAT CTCGGACTTC 
TTGGACGGCC TGCCGGACGC ACCCGGACGG GCTGCGCCCT GGGAACGGAT CCTGCGGCGG 
CTCGCGGTCC GTCACCAGGT GCTCGCGGTG GAGGTGACCG ACCCGCGTGA GTGGGAACTA 
CCGGACGTCG GCCTGGTCAC CCTGTTGGAC CCGGAGAACG GCCGACGGCG TGAGGTCTGG 
ACTGGCGATC CCCGGCTGCG CCGGCGGTAC GCCGCGGCGG CTGCTGCTCA GCGTGACCAG 
GTACGCCAGT CGTTGCGTCG CAGCGGGGCG GCGCACCTGC CGCTGCGAAC CGACCGCGAC 
TGGGTGGCCG ACATCGTGCG GTACGTGCAC CAACAACGTC GGCTGGCAAC CGCGCCGGTC 
CCCGCCGGTG GGAGTGGTGG CGCGTGA

Protein sequence

MPPDPGLVDL AGDGRLRRLE LAVTRRLDGL LHGRYQGLLP GPGSEPAGSR EYRPGEDEVR 
RMDWAVTART TVPHVRQLDA DRELTTWLLV DASISMEYGT AELDKRELAV AAVAAVGFLT 
VGVGNRLGAQ VLTPTALRRY PPGSGRTHLF GLLRMLLAAP RHGGYDGDTA PLASPDLATA 
LDGVHRTATR RGLVVVISDF LDGLPDAPGR AAPWERILRR LAVRHQVLAV EVTDPREWEL 
PDVGLVTLLD PENGRRREVW TGDPRLRRRY AAAAAAQRDQ VRQSLRRSGA AHLPLRTDRD 
WVADIVRYVH QQRRLATAPV PAGGSGGA