Gene Athe_2050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2050
Symbol
ID	7408263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2163389
End bp	2164870
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	41%
IMG OID	643716417
Product	Orn/Lys/Arg decarboxylase major region
Protein accession	YP_002573900
Protein GI	222530018
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1982] Arginine/lysine/ornithine decarboxylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0371444
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGGCAG GGCAGAATAA GGTGACAAAG GAGGACCAGA GCAAAACACC CTTATTTGAT 
GCTGTAAAAA GACATATTGA AAAGAACATA ATACCGTTCC ACGTTCCAGG GCACAAATAT 
GGAAGAGGTC TTAAAGAGTT TACCGATTTT GTTGGACAAA ACGTCATGCT AATGGACTTA 
AACGGTATGG AAGACTTAGA CAACGCAAAT AACCCAATAG GAGTCATCTA TGAAGCCGAA 
AAACTTTTTG CAAGCGCGTT TGGTGCCCAG TATGCATATT TTTTGGTAAA CGGTACAACA 
TCGGGTGTTC AAACAATGAT AATGTCGGCG TGCGAACCTG GAGATGAGAT AATACTGCCT 
CGAAACGCAC ACAAAAGTGC ATTTGGCGGG ATAATTCTAA GCGGGGCTAT ACCTGTGTAT 
GTGCAACCAG AGGTCAATGA AGAGCTTGGG ATTACAATGG GTGTTACAAT TGAGAATGTA 
AAAAAGGCAA TCCTGAAACA CCCTCATGCC AAAGCAGTTT TTGTTATAAA CCCCACATAT 
TATGGAATTG CAAGTGATTT GAAGTCCATA ACAAGGACAG CGCACAAGTT TGGAATGGCT 
GTTTTGGTAG ATGAAGCGCA TGGTGCACAT ATGGGATTTC ATAACGATTT TCCGCTCACT 
GCAATGGAAG TTGGAGCAGA TATGAGCGCA GTTTCAACAC ACAAAACAGG TGGGTCGCTA 
ACGCAAAGTT CAGTACTTCT TCTTAGAGGG CACAGGATTC AACCAGAAAC TGTAAAGCAG 
GTACTAAATC TTACTATGAC AACAAGTTCA TCTTACATTT TGATGTGTTC TATAGACGTT 
GCGAGAAAAC AGCTTGCAAT GTATGGTGAA GAGATGTTAG AAGAAACTTT GCGACTTGCC 
AGAATGGCAA GAGAAGAGAT TAACAAGATT GAAGGGCTTT ATGCATTTGG TAAAGAGTTG 
ATTGGAACAC CGGGAGTTTA TGATTTTGAT GAGACAAAAC TTGGGATAAA TGTCAGAAGA 
CTTGGTATAA CTGGATATGA AGCTGAAAGA ATTTTGAGAG ATGAATATAA CATCCAAGTG 
GAGATGTCTG ACCTTTACAA TATACTGGCT ATAATCTCTT TGGGAGATAC ACAGGAGAGT 
GTGGAAAAGC TAATTGAAGC TCTTCGCGAT ATGGCTAAAA AACTTGGTGT CAAGGATGTA 
AAGACACCAA CAATAGTTTT GCACTCACCA CAGGTGATTG TGTCGCCAAG AGATGCCTTT 
TACAGCTCTA AAAAGGTTGT TGATCTTGAC AATGCAGTTG GTGAAATTTC GGGTGAGATG 
GTCATGGCGT ATCCGCCTGG AATACCACTT ATTTTGCCGG GTGAGAGAAT TACAAAGGAC 
CTTGTTGATT ATATAAAACT TTTGAAAGAA GAGGACTGCC AGCTTCAGGG CACAGCCGAC 
CCTTATGTCA ATACAATAAG GGTACTTGGA ACAGCTGATT AA

Protein sequence

MEAGQNKVTK EDQSKTPLFD AVKRHIEKNI IPFHVPGHKY GRGLKEFTDF VGQNVMLMDL 
NGMEDLDNAN NPIGVIYEAE KLFASAFGAQ YAYFLVNGTT SGVQTMIMSA CEPGDEIILP 
RNAHKSAFGG IILSGAIPVY VQPEVNEELG ITMGVTIENV KKAILKHPHA KAVFVINPTY 
YGIASDLKSI TRTAHKFGMA VLVDEAHGAH MGFHNDFPLT AMEVGADMSA VSTHKTGGSL 
TQSSVLLLRG HRIQPETVKQ VLNLTMTTSS SYILMCSIDV ARKQLAMYGE EMLEETLRLA 
RMAREEINKI EGLYAFGKEL IGTPGVYDFD ETKLGINVRR LGITGYEAER ILRDEYNIQV 
EMSDLYNILA IISLGDTQES VEKLIEALRD MAKKLGVKDV KTPTIVLHSP QVIVSPRDAF 
YSSKKVVDLD NAVGEISGEM VMAYPPGIPL ILPGERITKD LVDYIKLLKE EDCQLQGTAD 
PYVNTIRVLG TAD