Gene Sare_2039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2039
Symbol
ID	5705693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2334888
End bp	2336270
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	67%
IMG OID	641271529
Product	aminotransferase class V
Protein accession	YP_001536900
Protein GI	159037647
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000739402
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGTCGGCCC GGACCGCCTG TGTGGCCTCC GGACCCGCCG TCGGCTACGA AGGGATCACC 
GTGAGCCATA CCGTGGACTC CCCCGGCTCG GCCACAGTCC CGGCGTCGGT GCCACCGAGC 
CCGTTGCGCA CCGCGTCGTG GAGTCGCATC CGGGAACTGT TCGCCCTGGA CCCGACGACC 
GTGCATCTCA ACACCGGAAC CGTCGGGGCC ATGCCGTACG AGGTCCTCGA CACCGTCGAC 
CGGGTCACCC GACAGTGGAC CGGCGGACTC CTGGACGTCT ACCGCCCGGC CATGTTCACC 
GAGTACCGGG CCTTCATCGG CACGACGTTC GGAGTGGACG AGGACGAGAT CGTCATCTGC 
CACAACGCGA CCGAGGGCGT CGCTCGGGTC ATCCACGGGC TGGACCTGCG CGCGAGTGAC 
GAGGTGGTGA CCACCACCCA CGAGTGTTAC TCGGTGCTGT CCAACTTCAA CTTGCTGCGC 
AACCGGCACG GCATTGTGGT ACGCACCGTC ACCCCGCCGT CGGGCCACGA CCTACGAGCT 
GAGGAGATCG TCGATCTGGT CGAGTCGGCG ATCACGCCGC GTACCAAGGT GCTGTCGTTC 
GCGGCGATCA CTCTCTTCAC CGGCACCATG TTTCCCGTCC GGCAGCTGTG CGAGCTGGCT 
CACCGGTACG GCCTGACCAC CGTCATCGAC GGCGCCCTGA TCCCCGGCAT GTTCGACGTG 
AACCTACGCG ACTACGGCGC CGACTTCATC ACCTGCTCCG GCTCGAAGTT CCAGTGTGGG 
CCCCTCGGCA CCGGCCTCAT CTACGTCCGC AACAAGGTCG TCCCCGAGTC CAACCCGCTG 
CCGTTGCCCA CCTTCTGGCC GCTCATCTCC ACCTGGTACC CGATGATGGG CACTCCGCCG 
CCGCGTACCA CCAACGAGGT GGCCAGCTAC AACATGGGCG ACTACCTGCA AAGCGCCGGG 
AGCGCCAACC TGGCTCGTGG CGCCGCGCTG ACCCGCGCCT TCGAGCTGTG GGACGACATC 
GGGCGGGACC GCATCGAGCG GTACGTCATG GAGCTCGCCG AGTACGCGCG CGGCCGACTG 
ATCGAGGCTT TCGGCGAGGA GGCCATGTAC TCCCCCGGCG CCGACCCACG GTTGCGCTCA 
CCGCTGATCG CGTTCAACCC GTTCCGCCGC GCCGAGGACG CCTGGAACAT CAAGAAGTTC 
GTCACCTTCG TCAAACGACT GGAGACCGAG CACCGGATCT GGACCCGTTG GACCGAGTTC 
GACGTCCCCG GATCGCCGCA CCAGCACTAC GCGGCACGCA TCACCACGCA CCTGTTCAAC 
ACGCGTGGAG AGATCGACCA CAGCGTCCGG ACGATGGTCC GCCTTGCCGA GGAGATGTCC 
TGA

Protein sequence

MSARTACVAS GPAVGYEGIT VSHTVDSPGS ATVPASVPPS PLRTASWSRI RELFALDPTT 
VHLNTGTVGA MPYEVLDTVD RVTRQWTGGL LDVYRPAMFT EYRAFIGTTF GVDEDEIVIC 
HNATEGVARV IHGLDLRASD EVVTTTHECY SVLSNFNLLR NRHGIVVRTV TPPSGHDLRA 
EEIVDLVESA ITPRTKVLSF AAITLFTGTM FPVRQLCELA HRYGLTTVID GALIPGMFDV 
NLRDYGADFI TCSGSKFQCG PLGTGLIYVR NKVVPESNPL PLPTFWPLIS TWYPMMGTPP 
PRTTNEVASY NMGDYLQSAG SANLARGAAL TRAFELWDDI GRDRIERYVM ELAEYARGRL 
IEAFGEEAMY SPGADPRLRS PLIAFNPFRR AEDAWNIKKF VTFVKRLETE HRIWTRWTEF 
DVPGSPHQHY AARITTHLFN TRGEIDHSVR TMVRLAEEMS