Gene Saro_1797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1797
Symbol
ID	3918356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1894532
End bp	1895752
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	63%
IMG OID	640444538
Product	5-aminolevulinate synthase
Protein accession	YP_497071
Protein GI	87199814
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0156] 7-keto-8-aminopelargonate synthetase and related enzymes
TIGRFAM ID	[TIGR00858] 8-amino-7-oxononanoate synthase [TIGR01821] 5-aminolevulinic acid synthase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATTACG ATCAGGTTTT CGATTCTGCC ATCGAGCGCT TGCACTCCGA AGGCCGTTAC 
CGCGTTTTCA TCGACATCCT GCGCAACAAG GGAGCCTACC CCAACGCGCG CTGCTTTGCG 
GGCCACAACG GCCCCAAGCC GATCACGGTG TGGTGTTCGA ACGACTATCT CGCAATGGGC 
CAGCACCCCA AGGTGATCGC GGCCATGGAA GAGGCGTTGC ACAACGTCGG CGCGGGCTCG 
GGCGGTACGC GCAACATCGG CGGCAACACC CACTACCACA TCGAGCTTGA GCACGAGCTG 
GCCGACCTTC ACGGCAAGGA CGGGGCGCTG CTGTTCACGT CGGGTTACGT CTCGAACGAC 
GCGACGCTGT CGACGCTCGC CAAGATCCTG CCTGGCTGCG TGATCTTCTC GGACGAACTG 
AACCACGCAT CGATGATCGC GGGCATCCGC AACTCGGGTG CGGAAAAGCG GGTGTTCCGC 
CACAACGACG TGGAACACCT CGAACAGCTT CTCGCCGAGA CCGACCCTGC GCTGCCAAAG 
CTGATCGCGT TCGAGTCGGT CTATTCGATG GATGGCGACA TTGCGCCGAT CCATGCGATC 
TGCGACCTGG CCGAGAAGTA CAACGCGCTG ACCTACATCG ATGAAGTGCA TGCCGTCGGC 
ATGTACGGAC CGCGCGGCGG CGGCATCACC GATCGTGACG AGGCGGCCCA CCGCATCGAC 
ATCATCGAGG GCACGCTGGG CAAGGCCTTC GGCGTGATGG GCGGCTATAT CGCGGCAGAC 
ACGCGGATCA TCGACGTGAT CCGATCCTAT GCGCCGGGGT TCATCTTCAC CACCTCGCTT 
TCGCCGGTTC TGGTAGCGGG CGTTCTCGCA TCGGTCCGCC ACCTCAAGGC GTCGAGCGCC 
GAGCGCGACG GGCAGCAGGC GGCGGCGGCC TACCTCAAGA AGGCGTTCGC CGACGCCGGC 
CTTCCCGTGA TGCCATCGAC CACGCACATC GTGCCGCTGA TGGTCGGTGA TCCGGTAAAG 
GCCAAGAAGA TCAGCGACAT ACTTCTGGCG GAGTATGGCG TATACGTGCA GCCCATCAAC 
TTCCCGACCG TGCCGCGCGG GACCGAGCGC CTGCGCTTCA CTCCGGGACC GTCGCACACC 
GAGGCGATGA TGGACGAGCT TACCGGAGCG CTGGTGGAAA TCTGGCAGCG CATGGAAATG 
GAACTGCAGA AGGCAGCCTG A

Protein sequence

MNYDQVFDSA IERLHSEGRY RVFIDILRNK GAYPNARCFA GHNGPKPITV WCSNDYLAMG 
QHPKVIAAME EALHNVGAGS GGTRNIGGNT HYHIELEHEL ADLHGKDGAL LFTSGYVSND 
ATLSTLAKIL PGCVIFSDEL NHASMIAGIR NSGAEKRVFR HNDVEHLEQL LAETDPALPK 
LIAFESVYSM DGDIAPIHAI CDLAEKYNAL TYIDEVHAVG MYGPRGGGIT DRDEAAHRID 
IIEGTLGKAF GVMGGYIAAD TRIIDVIRSY APGFIFTTSL SPVLVAGVLA SVRHLKASSA 
ERDGQQAAAA YLKKAFADAG LPVMPSTTHI VPLMVGDPVK AKKISDILLA EYGVYVQPIN 
FPTVPRGTER LRFTPGPSHT EAMMDELTGA LVEIWQRMEM ELQKAA