Gene Msed_1823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1823
Symbol
ID	5105386
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1769843
End bp	1770952
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	55%
IMG OID	640507722
Product	succinyl-diaminopimelate desuccinylase
Protein accession	YP_001191901
Protein GI	146304585
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01910] acetylornithine deacetylase or succinyl-diaminopimelate desuccinylase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.248504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTTC TAAGGGAGCT CGTGGAGATA GAGACCGTGA ACCCTCCCGG GTCTCATTAC 
GAGGAATTTA CGTCGGTGAT GAGGGAGAGA CTTGGGGAAC TGGGATTTCA GGTAGAGCTC 
GTGGAGATTC CAGACGAGTT CCTGGACAAG AACTACATTT ATTCCCCTAG GCACAGGGGG 
AACAAGAGGG TCATACTCCT CGCGAGGAAT GACCCTGAAC CCAGGCTTCA CTTCAACTTC 
CATTACGACG TGGTTCCTGC AGGGAACGGT TGGGTGACTG ATCCCTTCAA GCTGAAGGTA 
GTTGAGGACA GGGCATACGG GAGAGGGACT TCTGACATGA AGGGGGCCAT CGCGAGCCTT 
TACCTCGCGT TATCGGGTCA GGACTTCCCC GTAGAGGTTG CGCTTGTACC TGATGAGGAG 
AGCGGAGGGC TAGGAACCAG GTACCTTGTG GATAAACTTC GGGTCAGGCC GAGACACGTG 
ATCCTAGGCG AGCCGAGCTT CCCCGACCTG TACGTGGGTC ATTTCGGGAT CGTCCGGGGA 
GTTGTGAGGG TGTTCGGGAA ACAGGTCCAC GCCAGCATGG CAAACCAAGG AGTTAACGCC 
TTCCTTGAGG CCTCTAGGTT AGCCCTGGAG CTTCAGAGGA GGTACTCCTC GCTCTCGCTC 
TCGCTCGAGG GATCAACGGT GCTCGGCGGA TACGTCGAGG GTTCAACGAG CGACGGGATG 
GTTCCAGGGA CATTCGCCTT CAGTTTCTAT AGGTCAGTCC CACCAAAGGG AAGGGGTCCG 
GACCTCGATC ATGAGATCGT GGACGAGACG GCCAGGGAAC TGGGGATCAA GCACGAGTTC 
GAGATTAAGT CCTTCGTACC GGGTTCAATG ACCAGTCCTG ATTCCAGCTT GACGAGAGTC 
GTCGAGGCGT GTATTAGGGA GATGGGCTGG GAACCTAGGA AGGAGGTGGC GAAGATTAGA 
TATGACGCGG TATTCTACGG AGATATTGAC GCCGTGAACT TCGGCCCAGG GGAGCCGGGG 
CAGGCCCACG TTGCGAATGA GTATGTTGAC CTTAGAAACG TAAAAAGGGT AAGCCAAGTA 
TATAGTTGCG TGATGAGATC CATGTTGTAG

Protein sequence

MNLLRELVEI ETVNPPGSHY EEFTSVMRER LGELGFQVEL VEIPDEFLDK NYIYSPRHRG 
NKRVILLARN DPEPRLHFNF HYDVVPAGNG WVTDPFKLKV VEDRAYGRGT SDMKGAIASL 
YLALSGQDFP VEVALVPDEE SGGLGTRYLV DKLRVRPRHV ILGEPSFPDL YVGHFGIVRG 
VVRVFGKQVH ASMANQGVNA FLEASRLALE LQRRYSSLSL SLEGSTVLGG YVEGSTSDGM 
VPGTFAFSFY RSVPPKGRGP DLDHEIVDET ARELGIKHEF EIKSFVPGSM TSPDSSLTRV 
VEACIREMGW EPRKEVAKIR YDAVFYGDID AVNFGPGEPG QAHVANEYVD LRNVKRVSQV 
YSCVMRSML