Gene Hhal_1471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1471
Symbol
ID	4710044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1587967
End bp	1589103
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	71%
IMG OID	639855938
Product	succinyl-diaminopimelate desuccinylase
Protein accession	YP_001003040
Protein GI	121998253
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01246] succinyl-diaminopimelate desuccinylase, proteobacterial clade

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCCA CGCTCGAGCT CGCCCGGGAG CTGATCCAGC GCCCGTCGGT AACTCCCGAG 
GACGCCGGAT GCCAGACCCT CGTCGCCGAG CGCCTGGCCG CGGCCGGGTT CGGCGCCGAG 
TGGCTGAACG CCGCCGGGGT CACCAACCTG TGGGCGCAGC GCGGCACCGA GCGCCCCCTG 
TTCTGCTTTC TCGGCCACAC CGACGTGGTC CCCAGCGGTC CAGAGTCGGC CTGGCAACAC 
CCGCCGTTCC AGCCCATCGT CGAGAACGGC TGTCTCTATG GCCGAGGCGC GGCCGACATG 
AAGGGCAGTG TGGCGGCCTT CGTCGCTGCG GTGGAGCGCT TCGTCGCCCG CCACCCGGAC 
CACGCGGGCG CCATCGCCGT GCTGCTGACC AGCGACGAGG AAGGCCCCGC GGTGGATGGC 
ACCCGACGCG TGGTCGAGAC CCTGGCAGCG CGGGGGGCGG CCATCGACTA CTGCCTGGTG 
GGCGAACCCA GCAGCCAGGC ACGGCTCGGC GACGAGTACA AGGTCGGCCG CCGCGGGTCC 
CTAACGGGGC ACCTCACCGT GCACGGCGAA CAGGGGCACG TCGCCTACCC GCACCAGGCG 
GACAATCCCA TCCACGCGTT CGCCCCGGCA CTCCAGGAGC TGGTCGCCAC CGAGTGGGAC 
CAGGGCGATG CCGACTTCCC GCCGACGAGC TTCCAGATCT CCAACATCCA GGCGGGCACC 
GGCGCCGACA ACGTCATCCC CGGAGCCATG GAGGTCGTGT TCAACCTGCG CTACGCCCCG 
GCGGTCTCCG CCGAGGAGCT TCAGGAACGG ATCGAATCCA TCCTGCACCG TCACGGGGTG 
CACCACACCC TGCACTGGCG GCACTCCGGC GCCCCCTTCG CCACCCGCGA GGGCGCACTC 
ATCGATGCCG TTGAACAGGC AGTCACAGCG CACACCGGGC AGTGTCCACG ACGATCGACC 
TCCGGCGGCA CCTCCGATGG CCGTTTCATG GGTCCGACCG GGGCGCAGGT GGTCGAGCTT 
GGTCCGCTGA ACGCCACCAT CCACAAGGCC AACGAGCACG TCGCGGTCGC CGACCTGGAG 
GCCCTGGAGG CGATCTACTT CGACATCCTG CAGCACCTGC TGGCCCCGGC CGACTGA

Protein sequence

MSATLELARE LIQRPSVTPE DAGCQTLVAE RLAAAGFGAE WLNAAGVTNL WAQRGTERPL 
FCFLGHTDVV PSGPESAWQH PPFQPIVENG CLYGRGAADM KGSVAAFVAA VERFVARHPD 
HAGAIAVLLT SDEEGPAVDG TRRVVETLAA RGAAIDYCLV GEPSSQARLG DEYKVGRRGS 
LTGHLTVHGE QGHVAYPHQA DNPIHAFAPA LQELVATEWD QGDADFPPTS FQISNIQAGT 
GADNVIPGAM EVVFNLRYAP AVSAEELQER IESILHRHGV HHTLHWRHSG APFATREGAL 
IDAVEQAVTA HTGQCPRRST SGGTSDGRFM GPTGAQVVEL GPLNATIHKA NEHVAVADLE 
ALEAIYFDIL QHLLAPAD