Gene Sare_1766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1766
Symbol
ID	5705093
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2035845
End bp	2036867
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	71%
IMG OID	641271269
Product	adenosine deaminase
Protein accession	YP_001536644
Protein GI	159037391
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1816] Adenosine deaminase
TIGRFAM ID	[TIGR01430] adenosine deaminase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.474067
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00306919
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGACCGACC TGTCCACCTT TATCGCCGGC CTGCCCAAGG TCGAGCTGCA CGTGCACCAC 
GTTGGTTCCG CCTCGCCCCG GATCGTCGCC GAGTTGGCCG CCCGGCACGA GGGCCGCAGC 
CCGGTCCCGG CCGACCCGGC CGCCCTCGCG GACTACTTCG CCTTCCGCGA CTTCACCCAC 
TTCGTCGAGG TCTACCTGAG CGTCGTGGAT CTGATCCGGG ACCAGGAGGA CGTCTGGCTC 
CTCACCCACG AGGTGGCCCG GGAACTGGCC CGCCAGCAGG TCCGCTACGC GGAGCTGACC 
ATCACCCCGT ACTCGCACGT GAACCGTGGC ATTCCCGCGC CGGCGTTCTG CGAGGCGATC 
GAGGACGCCC GGAAACGGGC GGCGGCCGAC TTCGGCATCG AGCTGCGCTG GTGCTTCGAC 
ATCCCGGGCG AAGCCGGCCT GCCGGCAGCC GAGGAGACCC TGCGGATAAG CCTGGACGAG 
CGCCCCGACG GCCTGATCAG TTTCGGCTTG GGCGGCCCGG AGGTTGGCGT GTCCCGGCCT 
CAGTTCAAGC CGTACTTCGA TCAGGCTCGC GCGGCCGGCC TGCGGTCGGT ACCGCACGCC 
GGGGAGACCA CCGGGCCGCA GACCGTCTGG GACGCGCTGC GCGACCTGGC CGCCGAGCGG 
ATCGGGCATG GCATCGCGGC GGCCGAGGAC CCGAAACTGC TCGAGTTCCT GGCCGAGCGG 
CAGATCGCGC TGGAGGTGTG CCCGACCTCC AACGTCCGCA CCCGGGCGGT ACCCCGGATC 
GAGGAGCACC CGCTGCCTCG GCTGGTCGAG GCCGGGCTGC TGGTCACGAT CAACTCTGAT 
GATCCGCCGA TGTTCGGCAC CACCCTCAAT GACGAGTACG CCGTAGCCGC CCGGTTACTC 
GGTCTTGGCC CGCAGGGTGT GGCCGCGCTG GCCCGCAACG CGGTGGTCGC GTCGTTCCTC 
GACCCCGCGA GCAAGCAACG GATCGCGGGG GAGATCGACG CCCACCTGGC GACCGTGTCC 
TGA

Protein sequence

MTDLSTFIAG LPKVELHVHH VGSASPRIVA ELAARHEGRS PVPADPAALA DYFAFRDFTH 
FVEVYLSVVD LIRDQEDVWL LTHEVARELA RQQVRYAELT ITPYSHVNRG IPAPAFCEAI 
EDARKRAAAD FGIELRWCFD IPGEAGLPAA EETLRISLDE RPDGLISFGL GGPEVGVSRP 
QFKPYFDQAR AAGLRSVPHA GETTGPQTVW DALRDLAAER IGHGIAAAED PKLLEFLAER 
QIALEVCPTS NVRTRAVPRI EEHPLPRLVE AGLLVTINSD DPPMFGTTLN DEYAVAARLL 
GLGPQGVAAL ARNAVVASFL DPASKQRIAG EIDAHLATVS