Gene Msed_0344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0344
Symbol
ID	5105502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	298619
End bp	300067
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	48%
IMG OID	640506250
Product	carboxypeptidase Taq
Protein accession	YP_001190445
Protein GI	146303129
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2317] Zn-dependent carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTCAAG AAATTCTTGA AAAGTACAAG AGGGTCTGGT CCCTGAACTA CTCTCAAGCC 
CTTCTAGCGT GGGATCTGGA AACCTACATG CCAGAAGAGG ACTCAGCGTT AAGGGGAGAA 
GTACTGGCTA ACATCTCCAC CATGATCAGG GAAATGACCA TGGCACTTGA ACCTGACGTG 
GAAAAGGTGA GGGAAGAGGA CTTAGACGAC TTCGGGAAGG GCGTAATTCG GGTACTGAGG 
AGGTCACTTA GGTTCTACAA GCTTGTCCCC AAGGAGATCA CAGAGGAACT GGACAGGTTA 
ACCTCCCAAA GCGTGGTAGT ATGGAGGGAG AGTAAAAGGA AAGGGGACTT CAACCTGTTC 
AAGCCTTACC TGGAGAGGAT AGTGGAGCTT CAGAGGAGTA TTGCTGAGAA ACTGGGTTAC 
GAGGGACATC CCTATAACGC GTTAGTTGAT CTCTACGAGG AAGGGATAAC GGTGACCGAT 
CTAGATGCCG TGTTCTCTCA GTTACTTCCA GATCTGAGGA CCATCCTGGA AAAGGTGTTG 
GCCGAGGGCT ATTTTCCCTC TAATCATCCG CTCAAGGAAA TGAGCTATGA CCCAAAGGTT 
ATGGAGGAGG TGAATAGGGA GGTCCTGAAG ATTCTCAACA TGCCCACGAA AACGTTTAGG 
ATGGACGTAT CCGCACACCC GTTCACGATT AGAATATCAT CTAAGGACGT AAGGATTACG 
ACCCGATATG AGGGGATAGA CTTCAGGAGT ACCATATTCT CGGTAATACA TGAATCAGGA 
CATGCCATGT ACGAGCTTAT GGTTGATCCT GCATATGAGA TGACTCCAGT TGCCGGTGGA 
GCCTCAACAG GGATTCATGA GTCTCAATCG AGGTTCTGGG AGAACATAGT GGGTAGAAGT 
AGGGAGTTCA CTAACATCCT CTACCCCATC CTTAAGAGTA AGCTCCCAAT CAAGGATGAC 
CAGGAGTCGC TGTACAGGTA CTTCAACATG GTGTCGCCAA GCCTCATTAG GGTAGATGCA 
GACGAAGTCA CATACAACTT TCACATTGCC CTCAGGTACG AAATTGAGAA GAACCTTATC 
TCCGGTAAGC TGAGCGTAAG CGATCTTCCG TCAATGTGGA ACGACTTCAT GGATAAGTAC 
CTGGGAGTCA GACCCAAGCA TGATGGAGAA GGGGTTCTGC AGGACATCCA CTGGTCACAG 
GGTAGTTTCG GCTACTTCCC GACGTACACC TTGGGAAACG TTCTAGCTGC GACCATCTAC 
CATTTCATAG AGGACTTGCC TACGAAGGTG AGCAGGGGAG ACGTGAACGG AATAAGGGCT 
TTCCTGTCGG AGAAGATATG TAAGTATGGG GCTGTTTATC CACCTAAGGT TCTCTTAACC 
AAGGCATTCG GTGAGGTCTA TAACCCAAAG AGACTATCGT CCTATCTTGA AAAGAAATAC 
ATAGCCTAA

Protein sequence

MLQEILEKYK RVWSLNYSQA LLAWDLETYM PEEDSALRGE VLANISTMIR EMTMALEPDV 
EKVREEDLDD FGKGVIRVLR RSLRFYKLVP KEITEELDRL TSQSVVVWRE SKRKGDFNLF 
KPYLERIVEL QRSIAEKLGY EGHPYNALVD LYEEGITVTD LDAVFSQLLP DLRTILEKVL 
AEGYFPSNHP LKEMSYDPKV MEEVNREVLK ILNMPTKTFR MDVSAHPFTI RISSKDVRIT 
TRYEGIDFRS TIFSVIHESG HAMYELMVDP AYEMTPVAGG ASTGIHESQS RFWENIVGRS 
REFTNILYPI LKSKLPIKDD QESLYRYFNM VSPSLIRVDA DEVTYNFHIA LRYEIEKNLI 
SGKLSVSDLP SMWNDFMDKY LGVRPKHDGE GVLQDIHWSQ GSFGYFPTYT LGNVLAATIY 
HFIEDLPTKV SRGDVNGIRA FLSEKICKYG AVYPPKVLLT KAFGEVYNPK RLSSYLEKKY 
IA