Gene Mbar_A1641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A1641
Symbol
ID	3625439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	-
Start bp	2023061
End bp	2024323
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	44%
IMG OID	637700522
Product	diaminopimelate decarboxylase
Protein accession	YP_305166
Protein GI	73669151
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0019] Diaminopimelate decarboxylase
TIGRFAM ID	[TIGR01048] diaminopimelate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTTCAA AGGACCTTCC CTTCACCAAA GAGAAAATTC AGGAAATAAT AAAAAAGTAT 
CCCACGCCGT TTCATATATA CGATGAGAAA GCCATTCTGG AAAATGCGGA GAAAATGAAA 
GCAGTTTTCA GGGAGGTTCC GGGTTTTAAA GAATTTTTTG CTGTGAAAGC CCTTCCAAAC 
CCCTTTATTC TTAAAATCCT GAGAGAAAAG GGCTTTGGTG CGGATTGCAG TTCTTTACCG 
GAGTTAATTC TTGCTGAAAA AGCAGGAATT ACCGGAGAAG ACATAATGTT TAGCTCAAAC 
GATACTCCTG CTGAAGAGTT CTTAAAGGCA AAAGAGCTTG GAGCATACAT AAATCTTGAT 
GACATAAGCC ATATTGACTA CCTTGAGAAA TATGCCGGAC TTCCTGATAT TGTCTGTTTC 
AGGTACAATC CTGGCCCTCT TAAAGAGGGA AATGCCATTA TAGGAAGGCC TGAAGAAGCA 
AAGTACGGCT TTACGAGAGA CCAGCTTTTT GAAGGCTACC GCATACTCAG GGATAGAGGA 
GTAAAGCGTT TCGGAATGCA CACGATGGTG GCCTCGAATG AACTAAAAGC TGATTACTTT 
GTGGAAACCG CAAGAATTCT CTTCGAACTT ATAGTTGAAA TCTCAAAAGA ACTCAACATA 
AAGTTCGAAT TTGTGAACCT CGGCGGAGGC ATAGGCATCC CCTATAGGCC TGAAGAAGAA 
CCTGTTTCCT TCGAAGCCGT GGCAAAAGGT GTCAAAGAAG CTTACGAAGC CACAATCACA 
GCTAGCGGGC TTTATCCACT TAAAGTGTTT CTGGAATGCG GCCGTGTAAT TACAGGCCCC 
TATGGTTACC TGATTACCCA GGTTCGGCAC CTCAAACACA CCTACAAAGA CTATGTAGGA 
ATGGACTCCT GTATGGCCAA CTTGATGCGG CCTGGCATTT ACGGAGCCTA TCACCATATA 
ACAGTGCTCG GAAAGGAAAA TGAGGCTCCT GTCCATAAGT ATGATGTCAC CGGCTCCCTA 
TGCGAAAATA ATGACAAATT CGCAATCGAC AGGCATCTTC CAGAAATTGA GATAGGAGAT 
ATCCTTGCAA TCCACGACAC AGGTGCTCAC GGTCACTCTA TGGGTTTCAA TTACAACGGA 
AAACTCCGTT CTGCCGAACT CCTTCTCAGA AAAGACGGAA GCGTTGTGCA GATCAGGAGA 
GCCGAGACTA TTGAAGATTA CTTTGCAACC CTGGATTTCG AAGCCCTGAA AGATTTCAAG 
TAA

Protein sequence

MVSKDLPFTK EKIQEIIKKY PTPFHIYDEK AILENAEKMK AVFREVPGFK EFFAVKALPN 
PFILKILREK GFGADCSSLP ELILAEKAGI TGEDIMFSSN DTPAEEFLKA KELGAYINLD 
DISHIDYLEK YAGLPDIVCF RYNPGPLKEG NAIIGRPEEA KYGFTRDQLF EGYRILRDRG 
VKRFGMHTMV ASNELKADYF VETARILFEL IVEISKELNI KFEFVNLGGG IGIPYRPEEE 
PVSFEAVAKG VKEAYEATIT ASGLYPLKVF LECGRVITGP YGYLITQVRH LKHTYKDYVG 
MDSCMANLMR PGIYGAYHHI TVLGKENEAP VHKYDVTGSL CENNDKFAID RHLPEIEIGD 
ILAIHDTGAH GHSMGFNYNG KLRSAELLLR KDGSVVQIRR AETIEDYFAT LDFEALKDFK