Gene Sare_2509 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2509
Symbol
ID	5706283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2866141
End bp	2867571
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	69%
IMG OID	641271973
Product	hypothetical protein
Protein accession	YP_001537343
Protein GI	159038090
COG category
COG ID
TIGRFAM ID	[TIGR01376] Chlamydial polymorphic outer membrane protein repeat

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.16291
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0412393
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCAGA GCAGGAGACT CCCACGGCCG CCCGGGCGAC GCCGCGTCCC CCGGGCCGTC 
GCCACGGTCA GCGCCGCGGC CCTCACCGGA ATCGTCGGCC TGGCCGGCAC CGGATCAGCC 
ACCGCCGCAT ACCAGTCCAC ACCCGGTTCC GCCGACCCAT CGCACCGTGA GTGGTCGAAG 
ACCGACGGCC AGTGGGGCGG TCACTGGGGC ACGGCCGGTG ATCCGGGCTG GCACCGCGAC 
GACCACGGTG ACCACAAGGC CAAGGGCACC CCCGTGCCCT GTGACCCCAA CGCGCTCATC 
GCCGCGATCA CCGCCGCGAA CCAGGCCGGC GGAGGCACCC TGCGCCTGGC CGAGAAGTGC 
CGCTACACCC TGACCGTCAA CCAGGACGAC AACGGACTAC CCCCCATCTT CCAACCCATC 
ACGATCCACG GCCAGGGCGC CACCATCATC CGCGCCGCCG CCGCCGACAA CTTCCGCATC 
TTCAACGTCA CCACCGGCGG CGACCTCACC CTCAAAGACC TCACCGTCGC CGGCGGACGA 
GTCGAGGACA CCGACGGTGG CGGGATCTTC GCCGGTGAGG GCACCAGGCT GACCCTCAAG 
CACGTCACCG TCCGCGACAA CATCGCCCTC GCCGGCGACA CGACGGGCGG CGAAGGCGGC 
GGCATCTTCA GCGACCGCAG CAAGGTCACG ATCACCAAGA GCACCATCAC CCGCAACACC 
GCCGGCACCG ACGGCGGCGG CTACTACAGC GACAACGCCG TCGTCTCCAT CAGCAAGTCG 
AAAGTGACCC ACAACACCGC CGGCGACGAA GGCGGCGGGC TGGTCAACGA CGACGGCAAC 
GCCACCATCA GCCACACCGT GATCAGCGAC AACAGCGCCA CCGACGGCGG CGGCGTGCAC 
GGCGACGGTG ACCTGACCGA GATCGTCTAC AGCACCATCA CCCGCAACAC CGCCAGCGCA 
CTCGGCGGCG GCATCCACGA CGACGGCAAC GAGGGCCTGC TGCTGCGACA CGTCACCGTC 
GCCAAGAACA CCGCCACCTC CGGCGGCGGG CTCCACCTCA CCGGCAGCAT CGGCGCCACC 
ATCGAGCACA GCAAGATCGT GCACAACATC GCCACCACCG GCGACGGCGG CGGCATCGCC 
GTCAACGGTG AGGATTCCAC CAATGCCGTG GTGGCCCTGC GTCGGAGCAC CGTCTCCGAC 
AACCAGGCCA CCGGCCGCGC CGGCGGCATC TTCTTCAACC CACCCGAGGG TGCCACCGAC 
GCCCTGCTGA CCCTCACCGA CGTCCGCGTC ACCAAGAACC TCGCCCAACT CGAACCCGGC 
GGCATCTACA ACAACGGCAC CGTCATCGTC CTGGGCAAGA CCACCATCAT CGACAACCGA 
CCCACCAACT GCGTCGGCAG CCCCAACCCC GTACCCACCT GCTTCGGCTG A

Protein sequence

MLQSRRLPRP PGRRRVPRAV ATVSAAALTG IVGLAGTGSA TAAYQSTPGS ADPSHREWSK 
TDGQWGGHWG TAGDPGWHRD DHGDHKAKGT PVPCDPNALI AAITAANQAG GGTLRLAEKC 
RYTLTVNQDD NGLPPIFQPI TIHGQGATII RAAAADNFRI FNVTTGGDLT LKDLTVAGGR 
VEDTDGGGIF AGEGTRLTLK HVTVRDNIAL AGDTTGGEGG GIFSDRSKVT ITKSTITRNT 
AGTDGGGYYS DNAVVSISKS KVTHNTAGDE GGGLVNDDGN ATISHTVISD NSATDGGGVH 
GDGDLTEIVY STITRNTASA LGGGIHDDGN EGLLLRHVTV AKNTATSGGG LHLTGSIGAT 
IEHSKIVHNI ATTGDGGGIA VNGEDSTNAV VALRRSTVSD NQATGRAGGI FFNPPEGATD 
ALLTLTDVRV TKNLAQLEPG GIYNNGTVIV LGKTTIIDNR PTNCVGSPNP VPTCFG