Gene Sare_3890 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3890
Symbol
ID	5705828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4430597
End bp	4431796
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	71%
IMG OID	641273315
Product	hypothetical protein
Protein accession	YP_001538672
Protein GI	159039419
COG category	[S] Function unknown
COG ID	[COG4198] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.282654
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTCG CCCATCCGAT CGCCCGGGCC TGGATCACCA CCGGCGGCAC CGGCGCGCAG 
AACTACGACG AGTTCGCCGA CGACGCGGAG ATCACCGCGA TCATCGAGGC GAATCCGCAC 
AGTGCCCTCG GCATCGAGAT GCCGCACCGG GCCCCGGAGA GCCGGGGGAA GGCCTTCCTC 
GACGCGCTGC CGGACGCGGC GGCCCGGCTG GCCGAGGCCA AGGCGGCTGG CAGCTACACA 
CCTGCCGAGC AGGTGGTGGT CCTCTACCGA ATCAGCGCGC CGGACGAGGA GCCCGGGTAC 
GGGCTGTTCG TCATGGTCGA CACCGACCAG ATCTCGACCA GCGCCGACGA GCCGGGTCTG 
GTCATCCGTA ACGAGGACGT GTTCATCTCC AAGGTGCGCG AGCGGGTCGC CCTCGCCGAG 
ACCCTGGGGC ACCTGCTGTC GCCGGTGCTC CTGCTGCAGA CCGGCCGCGG CGACGAACTG 
CACGCCGCCC TCGCCGCAGC CACGGACCGG GCCGGGGTGC CGGCCGCCAC CGACACCGAT 
CAGGCCGGGC GCACGCATGC AGTGTGGCTG GTCGGTCCAG GCCGAGAGCA GGATGAGCTG 
ACCGCCCTGG CGGGCGGTGG CGAGTTGGTC GTCGCCGACG GCAACCACCG TAGTCTCGCG 
GCCCAGACCG GCGGGCTACC ACGCTTCCTG GCCGTGGTCA CCACGCCGGC CTCGGTCGCC 
ATCGCGCCGT ACAACCGGCT GGTCGAACAG CTCACCACCA CCCCAGACGA ACTGGTCGAC 
CGGCTTCGCA CCGCCGGCGC CCAGGTCGAG CCGATCGACG CGCCGGTCGA GGTCCCGGCA 
GCGGGCGGCA CCGTCCACCT CCGGCTACCC GATGCCGCGT ACGCGGTACG CCTGCCTCGG 
GTGGGCGCCG GACGCCTGGA GAACCTGGAC CATGCCCTGG TAGAGCGGTT GCTGCTGCGG 
GACGCGTTGG GGCTGGAACC GGGCGACAAG CGGATCATCT ACGTGGGCGG CGACTACCCG 
GCGACTTGGC TTTCCGGTGA GGTCGACGCC GGACGAGCCG AACTGGCCGT CCTCGTCGCG 
CCGGTGACCG TGGACGACTT CGTCGCGGTG AACCTGGCGC GGGAGAAGAT GCCACGCAAG 
AGCACCTGGT TCACCCCGAA GGCCCGCGGC GGCCTGGTCG TCGCCGAGCT GGTGTCCTGA

Protein sequence

MTVAHPIARA WITTGGTGAQ NYDEFADDAE ITAIIEANPH SALGIEMPHR APESRGKAFL 
DALPDAAARL AEAKAAGSYT PAEQVVVLYR ISAPDEEPGY GLFVMVDTDQ ISTSADEPGL 
VIRNEDVFIS KVRERVALAE TLGHLLSPVL LLQTGRGDEL HAALAAATDR AGVPAATDTD 
QAGRTHAVWL VGPGREQDEL TALAGGGELV VADGNHRSLA AQTGGLPRFL AVVTTPASVA 
IAPYNRLVEQ LTTTPDELVD RLRTAGAQVE PIDAPVEVPA AGGTVHLRLP DAAYAVRLPR 
VGAGRLENLD HALVERLLLR DALGLEPGDK RIIYVGGDYP ATWLSGEVDA GRAELAVLVA 
PVTVDDFVAV NLAREKMPRK STWFTPKARG GLVVAELVS