Gene Sare_4920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4920
Symbol
ID	5707408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5585189
End bp	5586595
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	64%
IMG OID	641274314
Product	hypothetical protein
Protein accession	YP_001539659
Protein GI	159040406
COG category
COG ID
TIGRFAM ID	[TIGR01376] Chlamydial polymorphic outer membrane protein repeat

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0390615
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0715167
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGGGA AGGACACCAA CACCGCGATG AACGATCAGC GTTATGACCA CGAACCGGAC 
CGGCCAGGTG CGCGCCGGGC GAGGTCACGG TGGTGGGCGG TTGGACTGGC CGGCATGACC 
GGCCTGGCCC TCACCACCAG CCTCGGCATC GGCGGAGCGC CGGCTATCGG CGCCGTCGAC 
GGCATTCTCA CTGCCGCCGA TGACCGGCGG GGAAAACCTG ACCGCGCCTC CACCGACAAC 
AAGGACCACA AGGGCAAGGG AACAAAGGAC AAACGCAAGG GCACACCGGT CCCGTGTGAC 
GCCGATGCGC TGATCGCGGC GATCACCCTC GCCAACGCCC GCGGCGGCGC CGTCCTCGAC 
CTCGCCACAG ACTGCACCTA CCTACTCACC GCCACCATCG ACGGTGCCGG CCTGCCCGCC 
ATCACCACCC CGATCACCCT CAACGGCGGC AAACACACCA CCATCACCCG CGCCGCCGCC 
GCTGAACCGT TCAGAATTCT CACCGTTGAG GCCGGAGGAC ACCTCACTCT CAACCACCTC 
ACCATCACCG GGGGCCAGAC CGAAACGTTT GACGACGGTG GGGGGATCCT TGCCAACAGC 
GGAAGCACCC TCGCCATCAA CCACAGCGTG ATCCGAAACA ATATCGGCAA CAACGGCGGC 
GGAGTGGCCA ACTTCGGCAC GACCACCGTC AAGCACTCCA CGGTTAGCGA GAATACTGCA 
CGGGCCAACG CTGGCGGCCT CCAGAATATG GCCGGACTGC TCACCATCGA ACGATCCAAA 
ATCACCGACA ACACCGCCCC CGGATTGGCG ATCGGCGGGG GGCTCGGCAG CATCAACGGC 
GCGACCACGC GCATAAACCG GAGCAGCATC ACCCACAACC ATTCAGGACT ATCCGGAGGA 
GGAATCGGCG ATTTCGACGC CACCACCGTC GTTACCGACT CCACCATCAG CCAGAACACC 
GCTGACGTTT CGGGAGGCGG AATCTTCGAG GAGGGGCAAC TCACCCTGCG ACACGTTACG 
ATCACTGACA ACAACGCCCT TGATGGTGGC GGTGGGGTCG AAATTCAAAA CGTTCTCGGC 
GGGAGCGCCG CGACCATCGA GGACAGCGAA ATCACCAACA ACACGACGGG ACGGGGCGGA 
GGGATTCGCA ACCTCGCCGC CACGATCGTG CTCCGAAACA CCCGGATCGC CGGGAACCAG 
GCCGACACCG GCGCCGGCGT CTTCAACAAC ATCGGCTCAA CGCTCACCCT TTTCTCCACC 
AAGGTCGTCA AGAACACCGC TGTTACCGAC GGTGGGGGCA TCTTCAACGA GGTGGGCGGC 
ACGGTGGAGT TGAATACCGC CACCGGCACT GTTGTGGTCA AGAACCGGCC GAACAACTGC 
GTCAACGTCA CCGGCTGCCC GGGCTGA

Protein sequence

MTGKDTNTAM NDQRYDHEPD RPGARRARSR WWAVGLAGMT GLALTTSLGI GGAPAIGAVD 
GILTAADDRR GKPDRASTDN KDHKGKGTKD KRKGTPVPCD ADALIAAITL ANARGGAVLD 
LATDCTYLLT ATIDGAGLPA ITTPITLNGG KHTTITRAAA AEPFRILTVE AGGHLTLNHL 
TITGGQTETF DDGGGILANS GSTLAINHSV IRNNIGNNGG GVANFGTTTV KHSTVSENTA 
RANAGGLQNM AGLLTIERSK ITDNTAPGLA IGGGLGSING ATTRINRSSI THNHSGLSGG 
GIGDFDATTV VTDSTISQNT ADVSGGGIFE EGQLTLRHVT ITDNNALDGG GGVEIQNVLG 
GSAATIEDSE ITNNTTGRGG GIRNLAATIV LRNTRIAGNQ ADTGAGVFNN IGSTLTLFST 
KVVKNTAVTD GGGIFNEVGG TVELNTATGT VVVKNRPNNC VNVTGCPG