Gene Sare_4033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4033
Symbol
ID	5705013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4589204
End bp	4590517
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	73%
IMG OID	641273458
Product	homoserine dehydrogenase
Protein accession	YP_001538814
Protein GI	159039561
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0016038
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCGCTTGG CGCTACTCGG CTGTGGCACG GTCGGCAGCG AGGTGGTCCG ACTGCTGCAC 
ACGCAGTCCG CCGACCTCGC CGCCCGGATC GGTGCCCCGC TGGAGATCGT CGGAATCGCG 
GTCCGTCGGA TCGGCCGAGA CCGTGGGGAA CTGCCGGTCG ATCCGGCCGT GTTCACCACC 
GACCCGCTCG ACCTGGTCAA ACGCGACGAC GTCGACGTGG TGATCGAGTG TGTGGGCGGC 
ATCGAACCGG CCCGGGGTTG GCTGGTGGAG GCGCTACGGG CGGGTAAGAG TGTCGTGACC 
GCGAACAAGG CCCTGCTCGC CGAGGACGGC GGGACGCTGC ACGACGCGGC GGCCGAGGGC 
GGGGGCGACC TCTACTACGA GGCGGCCGTG GCCGGTGCGA TCCCCCTGCT GCGCCCGCTG 
CGGGAGTCGC TGCACGGAGA TCGGATCACC CGGGTGACCG GGATCGTCAA CGGCACCACG 
AACTTCATCC TCTCCGCGAT GGACGCCACC GGTGCCGGCT TCGCCGAGGC GCTGGAGGAG 
GCGACCGACC TGGGGTACGC CGAGGCCGAC CCGACGGCCG ATGTGGAGGG GTTTGACGCG 
GCGGCCAAGG CGGCGATCCT CGCCTCGCTG GCGTTCCACA CCCGAGTCGG CGCGGCGGAC 
GTGCACCGGG AGGGCATCAC CGAGGTCACC GCCGCCGACG TGATCAGTGC CAAGGCGATG 
GGCTGCACCA TCAAGCTGCT CTGCATCGCG GCGCGGGGGG TCGCCGTGGA CGGCCGGGAG 
ACAGTCGGCG TACGGGTACA TCCGGCGATG ATCCCGCTCA CCCACCCCCT CGCGAGCGTG 
GGTGACGCCT TCAACGCGGT CTTCGTGGAG GCCGAGGCGG CTGGGCAGTT GATGTTCTAC 
GGGCGGGGCG CCGGCGGGGC GCCGACCGCC AGTGCGGTGC TCGGCGACGT GGTGGCGGTC 
TCCCGTAACC GGCTCGCCGG GGTCCGGGCG GCCAGCGAGT CCGCGTACGC CGACCTGCCG 
GTGCGGCCGA TGGGGGAGGC CCTCACCCGC TACCACATCA GCCTCGACGT GACCGACCGC 
CCCGGCGTGC TGGCTGCGGT GGCCGGTGTG TTCGCGCGGC ATGACGTGTC GATCGCGACC 
GTACGGCAGG GGTCCGGGGG TGGTGGGGTG GCCGGCCGTG GCGAGGACGC TGACCTGGTC 
ATCGTCACCC ATGTCGCGCC GGACGCCGCG TTGGCCGCGA CGGTCCGGGC GCTGCGCGGG 
CTGGACACTG TTCGCTCGGT CGCCAGCGTG CTGCGGGTCG AGGGCGGCGC CTAG

Protein sequence

MRLALLGCGT VGSEVVRLLH TQSADLAARI GAPLEIVGIA VRRIGRDRGE LPVDPAVFTT 
DPLDLVKRDD VDVVIECVGG IEPARGWLVE ALRAGKSVVT ANKALLAEDG GTLHDAAAEG 
GGDLYYEAAV AGAIPLLRPL RESLHGDRIT RVTGIVNGTT NFILSAMDAT GAGFAEALEE 
ATDLGYAEAD PTADVEGFDA AAKAAILASL AFHTRVGAAD VHREGITEVT AADVISAKAM 
GCTIKLLCIA ARGVAVDGRE TVGVRVHPAM IPLTHPLASV GDAFNAVFVE AEAAGQLMFY 
GRGAGGAPTA SAVLGDVVAV SRNRLAGVRA ASESAYADLP VRPMGEALTR YHISLDVTDR 
PGVLAAVAGV FARHDVSIAT VRQGSGGGGV AGRGEDADLV IVTHVAPDAA LAATVRALRG 
LDTVRSVASV LRVEGGA