Gene Sare_4520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4520
Symbol
ID	5706010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5107956
End bp	5109290
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	73%
IMG OID	641273934
Product	glutamate-1-semialdehyde aminotransferase
Protein accession	YP_001539283
Protein GI	159040030
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.228286
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000903
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGACCGACG TGCTCCCAGC CGGACCCGGC CGCTACCCGG CCGCCGCGCC GGCCTCCGAG 
GCCCTGTTCG CCCGCGCCCG CGCCCTCGTG CCCGGCGGGG TGAACTCCCC TGTCCGCGCG 
TTCCGTGCCG TCGGCGGCAC CCCGCGCTTC ATGGTCCGAG GGGAGGGTCC ATGGCTGTAC 
GACGCCGACG GACGGCGCTA CGTCGACCTG GTCTGCTCGT GGGGCCCCAT GATCCTGGGG 
CACGCGCACC CCGCGGTGGT GGAGGCGCTG CACTCGGCCG CCGCGCTCGG CACCAGCTTC 
GGCGCCCCCA CCCCGGGTGA GGTGGAGTTG GCCGCGGAGA TCGTCGACCG CACGCCCGTC 
GAGCAGGTAC GTCTGGTCAG CTCGGGCACC GAGGCCACCA TGTCGGCGAT CCGGCTGGCC 
CGGGGCTGCA CCGGCCGCGC CCGGATCATC AAGTTCGCCG GCTGCTACCA CGGGCACTCG 
GACGCACTGC TCGCCGCCGC CGGCTCCGGC GTCGCCACCT TCGGCCTGCC CGACTCGCCG 
GGTGTGACCG ACGCGGCAGC CGGGGACACG ATCGTGCTGC CGTACAACGA CATTCAGGCA 
GTCGAGGCGG CGTTCGCCGC CGAGGGCCCA CAGATCGCCG CGATCATCAC CGAGGCCGCC 
GCCGGCAACA TGGGTGTGGT GGCTCCTCGC GACGACTTCA ACCAGCGACT CGCCGCCATC 
GCCCACGCCA ACGGTGCACT GCTGATCGTT GATGAGGTCA TGACCGGCTT CCGGGTCTCC 
CGAGCCGGGT GGCACGGCCT GGACGCCTGC CCGGCCGACC TGTGGACCTA TGGCAAGGTC 
ATGGGTGGTG GCCTGCCCGC CGCCGCCTTC GGTGGCCGAG CGGAGATCAT GGCACAACTG 
GCCCCCGCCG GTCCCGTCTA CCAGGCCGGC ACCCTCTCCG GTAACCCCCT CGCCTGCGCC 
GCCGGGCTCA CCACGCTGCG GCTCGCCGAC GACGCCCTCT ACCGCAGGCT GGACGACACG 
GCCGCCGTCG TGGGCCGGCT CGCCGGTGAC GCCCTCGCCG CCGCCGGGGT GCCGCACCGG 
TTGTCGTACG CGGGCAACAT GTTCTCGATC TTCTTCACCG ACGCCGACGT GGTCGACTAC 
GCGAGCGCGC GTACCCAGCA GGTGCCCGCG TTCAAGGCGT TCTTCCACGC CATGCTCGAG 
GCCGGCGTCT ACCTGCCGCC GAGCGCCTTC GAGTCGTGGT TCGTCTCGGC GGCGATCGAC 
GACACCGCCC TGGAGCAGAT CGCCGCGGCG CTGCCAGCGG CGGCAGCGGC AGCCGCGGCG 
GGTCACGGGG GGTGA

Protein sequence

MTDVLPAGPG RYPAAAPASE ALFARARALV PGGVNSPVRA FRAVGGTPRF MVRGEGPWLY 
DADGRRYVDL VCSWGPMILG HAHPAVVEAL HSAAALGTSF GAPTPGEVEL AAEIVDRTPV 
EQVRLVSSGT EATMSAIRLA RGCTGRARII KFAGCYHGHS DALLAAAGSG VATFGLPDSP 
GVTDAAAGDT IVLPYNDIQA VEAAFAAEGP QIAAIITEAA AGNMGVVAPR DDFNQRLAAI 
AHANGALLIV DEVMTGFRVS RAGWHGLDAC PADLWTYGKV MGGGLPAAAF GGRAEIMAQL 
APAGPVYQAG TLSGNPLACA AGLTTLRLAD DALYRRLDDT AAVVGRLAGD ALAAAGVPHR 
LSYAGNMFSI FFTDADVVDY ASARTQQVPA FKAFFHAMLE AGVYLPPSAF ESWFVSAAID 
DTALEQIAAA LPAAAAAAAA GHGG