Gene Sare_2104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2104
Symbol
ID	5704718
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2425310
End bp	2426431
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	68%
IMG OID	641271589
Product	abortive infection protein
Protein accession	YP_001536960
Protein GI	159037707
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.574556
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0108203
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACACC AACCGACCGG CCCCGCCGCG GGCTTGGCGG CACCGGGCCT CGTGCACCGG 
GGGGTCGCGT ACGACACCGG CACGAACTTC GCGACCGGTC AGGGGGCGTT GTCCCGCACC 
TGCTGGACCA CCTCGAACAT GCTGTCCGAG ATCAGCCTGA TCAGTGACCA GCTGAACTGC 
AACTCGGTGA CCATCTACGG CAGCGACCTC GACCGACTCA CGGCGACCGC CGAGGCCGCC 
GTGGCACGGG GTCTGCACGT CCGGTTGCAG CCCCGGCTCG TGGACCGGCC GCAACCGGAC 
GTCCTGGAGC ACCTCGCCGA GGCCGCCCGA CTCGCCGAGT CACTACGCCG CCAGGACGCC 
CAGGTGAGCC TCACCGTCGG CGCCGTACAC CTGATCTTCA CACCGGGCAT CACCCCCGGA 
GACCAGTATC ACGAGCGCAT GGCCAACGTG TACGCGGACG CCAAGCACCA CCTGCTGACC 
CCGACGGGGA CGGTGAACAT GGCGACCGCC ACTCCCCGGC TCAACGAGTT CCTCCACCGG 
GCGAGCGGCG TCGCCCGTGG GCTGTTCAAC GGCGAACTGG GCTACTCCGC CGCGCTGTTC 
GAAGACGTCG ACTGGCAGCT GTTCGACTCG ATCGGACTCA TGTACCAGTA CCTGCCGAGG 
TGGCTGCCCA CGGCGGAGGA GCACATCGCG GAGGTGACGC GCTACCACCG GTGGGGCAAG 
CCGATCCACA TCGCCGAGTA CGGCACCGCG ACCTACCAGG GCGCCGAGCA GAAGGCGTTC 
TTTTTCTGGG ACATCGTCGA CCGCAGTGGG CCGGTCCCCC TCATCCTCGA CGGCTACGTC 
CGGGACGAGA GCGAGCAGGC CGCGTACCAC CTGCGCATGC TCGACGCATT CGAGCGGGCG 
GGCGTGCACG GTGTCGCGGT CTCGGAGCTG ATCCATCCCA CCCATCCGCA CTCGACCGAC 
CCTCGTAAAG ACCTTGACAT GGCAAGCATG GCCATCGTCA AGACCATTCG GGACGACTTC 
GCCGATCCGG CCTCCACCTA CCGCTGGGAG CCGAAGGAGT CGTTTCACAC CATCGCCGAC 
CACTACGCCC ACATCGGCTT CCAGGCAGCC GCCCGCAGGT GA

Protein sequence

MSHQPTGPAA GLAAPGLVHR GVAYDTGTNF ATGQGALSRT CWTTSNMLSE ISLISDQLNC 
NSVTIYGSDL DRLTATAEAA VARGLHVRLQ PRLVDRPQPD VLEHLAEAAR LAESLRRQDA 
QVSLTVGAVH LIFTPGITPG DQYHERMANV YADAKHHLLT PTGTVNMATA TPRLNEFLHR 
ASGVARGLFN GELGYSAALF EDVDWQLFDS IGLMYQYLPR WLPTAEEHIA EVTRYHRWGK 
PIHIAEYGTA TYQGAEQKAF FFWDIVDRSG PVPLILDGYV RDESEQAAYH LRMLDAFERA 
GVHGVAVSEL IHPTHPHSTD PRKDLDMASM AIVKTIRDDF ADPASTYRWE PKESFHTIAD 
HYAHIGFQAA ARR