Gene Sare_2784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2784
Symbol
ID	5707863
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3165714
End bp	3166979
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	72%
IMG OID	641272240
Product	aminotransferase class I and II
Protein accession	YP_001537610
Protein GI	159038357
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1168] Bifunctional PLP-dependent enzyme with beta-cystathionase and maltose regulon repressor activities
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000199621
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTCCTGCC CCACGCGATC TGACAGCAGC CCCGCAGCCA CGCGGAACCC GCTCACCCAG 
CTCACGCTGG AACAGCTCCG ACGGCGTACC AGCGTGAAGT GGCGCACATT CGCCCCCGAC 
GTGCTTCCGC TATGGGTAGC GGAGATGGAT GTGCACCTCG CCCCCGCCGT GGTCGACGCG 
CTGCACCGCG CGATCGAGCT CGGCGACACC GGCTACGCCA ACCCGACGGC GTACGCCGAG 
GCGTTCGGCG AGTTCGCCGC CCAGCGGTGG GGCTGGACCG ACTTCCACCC CGGACGGACC 
GCCGTGGTGC CCGACGTGAT GCTGGGCATC GTCGAGGTGC TCCGGCTCGT GACCGACCCC 
GGCGACGCCG TGGTCGTCTG CTCCCCCGTC TACCCGCCCT TCTACGCGTT CGTCACCCAC 
GCCGGACGGC GGGTGGTCGA GGCTCCACTC GGGGCCGACC TGCGGATGGA TCCCGCCGCG 
CTCGACGAGG CTTTTCGGCG CGCCCGCGAC CACGGCAGCC GGCCGGCCTT CCTGCTGTGC 
AACCCGCACA ACCCGACCGG AGTGGTACCA CACCGCGCGG AACTCGAGGT CGTCGCCGAC 
CTAGCCGGGC GGCACGGGGT ACGGGTGATC TCCGATGAGA TCCACGCGCC GCTGGCGCTA 
CCTGGGGCAG CCGTCACCCC GTACCTCACC GTCGCCGGCT CCCAGGACGC GTTCGCGGTG 
ACCTCCGCGT CCAAGGCGTG GAACCTTGCC GGCCTGAAGG CGGCGCTCGC GGTCGCGGGA 
CCACACGCGG CGGCTGATCT GGCCCGGATG CCGGAGGAGG TCAGCCACGG CCCCAGTCAC 
CTGGGCGTGA TCGCGCACAC CGCCGCCCTC CGGATGGGCG GGGAGTGGCT CGACGGTCTT 
CTCGACGGCC TACACACCAA CCGCACCCTG TTGGAGGAAC TGCTGGCGGA TCACCTACCC 
ACCGTCGGGT ACCGCCGCCC CGAGAGCACC TACCTGGCGT GGCTGGACTG CCGGCCGTTC 
GGCCTGCACA CCGATCGGCC CGGCGGTGAG CCCGGCGTGG TCAGTGAGGT CGCCGGGCCG 
GCGAAGATGT TCCTGGACCG CGCACGGGTG GCCCTCAGTT CCGGGCACGC CTTCGGAACC 
GGCGGAGCAG GCTTTGTCCG GTTGAACTTC GCCACCTCCC CCGCGATCCT CACCGACGCT 
GTCGTCCGGA TGGGTCGGGC CGCCCGGGAC GCACCGTCAC CGCCCCGAGT CGATCCGATC 
AGCTGA

Protein sequence

MSCPTRSDSS PAATRNPLTQ LTLEQLRRRT SVKWRTFAPD VLPLWVAEMD VHLAPAVVDA 
LHRAIELGDT GYANPTAYAE AFGEFAAQRW GWTDFHPGRT AVVPDVMLGI VEVLRLVTDP 
GDAVVVCSPV YPPFYAFVTH AGRRVVEAPL GADLRMDPAA LDEAFRRARD HGSRPAFLLC 
NPHNPTGVVP HRAELEVVAD LAGRHGVRVI SDEIHAPLAL PGAAVTPYLT VAGSQDAFAV 
TSASKAWNLA GLKAALAVAG PHAAADLARM PEEVSHGPSH LGVIAHTAAL RMGGEWLDGL 
LDGLHTNRTL LEELLADHLP TVGYRRPEST YLAWLDCRPF GLHTDRPGGE PGVVSEVAGP 
AKMFLDRARV ALSSGHAFGT GGAGFVRLNF ATSPAILTDA VVRMGRAARD APSPPRVDPI 
S