Gene Sare_1106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1106
Symbol
ID	5706671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1244276
End bp	1245451
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	74%
IMG OID	641270621
Product	aminotransferase class V
Protein accession	YP_001536005
Protein GI	159036752
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00753492
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCATACC TGGATCACGC GGCGACCACT CCGATGCTCG ACGTGGCACT CGAGGCGTAC 
GTCGCCACCG CCCGCGAGGT CGGCAACGCA TCCGCCCTGC ACGTGGCGGG CCGCCATGCC 
CGCCGCCGAG TCGAGGAGTC GCGTGAGCGG GTGGCCGCCG CGCTGGGCGC CCGCCCCGCC 
GAGGTCATCT TCACGGGCGG TGGCACGGAA AGCGACAACC TCGCGGTCAA GGGCATCTTC 
TGGGCCCGTC GGTCCGCCGA CCGTCGGCGG ACGCGGCTGG TGTCCAGCGC GGTGGAGCAT 
CACGCGGTGC TCGACAGTGT CGACTGGCTG GCCGCGCACG AGAGCGCCGA GGTGGGTTGG 
CTGCCGGTCG ATGCCCTCGG CCGGGTCACC CCGCAGCGGC TCCGCGCCGA GTTGGCCGCG 
TCCGCCGATC GGGTGGCCGT GGTCACGACG ATGTGGGCCA GCAACGAGGT GGGTACGATC 
CAGCCGGTCA CCGAACTGGC CGAGGTCGCG GCCGAGTACG GGGTGCCCTT TCACACCGAC 
GCGATCCAGG CGGTCGGCCA GGTGGCGGTG GACTTCGCCG CCAGTGGCGT CTCGGCGCTC 
ACGGTGACCG GGCACAAGCT CGGCGGTCCC GCCGGGGTGG GCGCACTGGT GCTCGCCCGC 
GACGTCGCCG CGACCCCGCT CCTGCACGGT GGTGGCCAGG AACGGGACGT CCGTTCGGGA 
ACCCTGGACA CGGCCGGGAT CGTCGCCTTC GCCGCCGCGC TGGAGGCCGC GGTCCAGCAC 
CAGCAGGAGT ACGCGACCCG CGTCGCCGCC CTTCGGGACG ACCTCGTGGC ACGGGTGCGG 
CAGGTGGTGC CGGAGGCGGT GCTCAACGGT GACCCAGCCG GACGGCTGCC CGGCAATGCC 
CACTTCTCGT TCCCCGGGTG CGAGGGCGAT GCGCTGCTGC TCCTCCTCGA CGCGCAGGGC 
ATCGCCTGCT CCACCGGCTC GGCGTGCTCG GCCGGCGTCG CCCAGCCGAG CCACGTGCTG 
CTCGCGATGG GCGCCGATGG CGCCCGCGCC CGCTCCTCAC TGCGCTTCAC CCTCGGCCAC 
ACCAGCACAC CGGAGGAGGT CGACGCGCTG ATCGCGGCCC TACCGGAGGC GGTCGATCGA 
GCCCGTCGCG CCGGCGGCCT CCGCGCTCCG CGCTGA

Protein sequence

MAYLDHAATT PMLDVALEAY VATAREVGNA SALHVAGRHA RRRVEESRER VAAALGARPA 
EVIFTGGGTE SDNLAVKGIF WARRSADRRR TRLVSSAVEH HAVLDSVDWL AAHESAEVGW 
LPVDALGRVT PQRLRAELAA SADRVAVVTT MWASNEVGTI QPVTELAEVA AEYGVPFHTD 
AIQAVGQVAV DFAASGVSAL TVTGHKLGGP AGVGALVLAR DVAATPLLHG GGQERDVRSG 
TLDTAGIVAF AAALEAAVQH QQEYATRVAA LRDDLVARVR QVVPEAVLNG DPAGRLPGNA 
HFSFPGCEGD ALLLLLDAQG IACSTGSACS AGVAQPSHVL LAMGADGARA RSSLRFTLGH 
TSTPEEVDAL IAALPEAVDR ARRAGGLRAP R