Gene Cthe_2108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2108
Symbol
ID	4810968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2502533
End bp	2503990
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	43%
IMG OID	640107515
Product	arginine decarboxylase
Protein accession	YP_001038508
Protein GI	125974598
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1982] Arginine/lysine/ornithine decarboxylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.970229
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTTGATT CAAAAGTGAT GAATGTCCCT ATATATAACG CATTGAGAAA TTATTCCAAC 
TCATGTCCGA CTGTTTTTCA CATGCCGGGA CACAAGCTTG GAAAAGGTAT ACCTTTGTCA 
TTTTTGAGGG ACTTGTATTT GATGGATTTA ACAGAAATAC CAGGCCTCGA CAGTCTTTAC 
TGCCCGAGCG GGGTGATTAA AGAGGCCCAG GAATTGGCAG CAAAGGCTTT TGGGGCCGAC 
AAAACTTTCT TTTTGGTAAA CGGCTCAACC TGTGGAATTC AGGCGGCAAT TATGACTGTT 
TGCAAACCGA AAGACAAGCT TATAATTGCA AGGGACTGCC ACAAATCTGC CGTTGCCGGG 
ATGATGCTGT CAGGAGCCGT TCCTGTGTAT GTGAAACCTC AGTTTAACAG TTCTTTTGGC 
ATACCTTCGA TTATTTCGGA AAAAGAGATT GAAAAAGCCC TTGCAGAGAA TCCAGACGCT 
GTCGGAGTTT ACATAACGAG ACCGAATTAT TATGGAATTT GTTCGGACAT AAAATCCATA 
AGTGAATTGG TTCATTCATA CAATAAGATA TTGATTGTTG ACGAAGCCCA TGGTGCGCAT 
TTGAAATTTT CAGAAAACCT TCCTCCGTCA TCTGTGGAAT ATGGAGCGGA TATATGCATT 
CAGAGCGCCC ACAAGACCCT TCCGGCACTA ACCCAGGGGG CGTACCTTCA TGTCAAAGGC 
AGCAGGGTGG ATGTTGAAAA GCTTGAATTT ACCCTGTCCC TTTTAGGAAC CACCAGTCCG 
TCGTATATCA TAATGGCTCA TCTGGACATT GCCCGTGCGA TTATGGAAGA AACCGGAGAA 
GAAAATATCA AAAGAGTGCT TGCAGGGATA GAAATGCTAA GCAGTGCTCT TTCAAAAAGC 
GGTGTTTTTA AAATCCTCTC CGATGACGAT ATAAATGACG GAGAAATAGA CAGAACCAGG 
GTTGTGATTA ATGTAAGGAA CACCGGAAAG ACAGGTTTTG AATTTGAAAA AATTTTAAGA 
AACCAATATA ATATTCAGGT GGAAATGTCC GATTTATATA ATATTGTGTG TATTACAACC 
GTTGCGGATA CTCCTGAAGA CATAATGAGG CTTCAGAGGG CGTTTGTGGA ATTGGCTGAC 
TGCCCTGGAA AGTCCGGCGG GCAAAGAAAA TTTGAAAAGG AATTTAAAAT AGACTGCCTG 
GACATACCGG AGCAAAGGGT TGAGCCTGCC GCCGTCATGC ACAGCGGTTT TGTAAAAAGA 
AAGCTTTATG ATGCTGTTGG CTGTGTAAGC AGAACGATGA TAACTCCGTA TCCGCCGGGG 
ATACCTGTGG TATGTCCGGG TGAAGTTATA AACGGAGACA TTGTGGAGTA TATCGTAAAA 
ATTATTGAAG CCGGCGGCGT GGTAAACGGT GTGTCTTCAA ACCTTGAAGT TGACGTAATT 
GACCGGAGCA ATCTGTAA

Protein sequence

MVDSKVMNVP IYNALRNYSN SCPTVFHMPG HKLGKGIPLS FLRDLYLMDL TEIPGLDSLY 
CPSGVIKEAQ ELAAKAFGAD KTFFLVNGST CGIQAAIMTV CKPKDKLIIA RDCHKSAVAG 
MMLSGAVPVY VKPQFNSSFG IPSIISEKEI EKALAENPDA VGVYITRPNY YGICSDIKSI 
SELVHSYNKI LIVDEAHGAH LKFSENLPPS SVEYGADICI QSAHKTLPAL TQGAYLHVKG 
SRVDVEKLEF TLSLLGTTSP SYIIMAHLDI ARAIMEETGE ENIKRVLAGI EMLSSALSKS 
GVFKILSDDD INDGEIDRTR VVINVRNTGK TGFEFEKILR NQYNIQVEMS DLYNIVCITT 
VADTPEDIMR LQRAFVELAD CPGKSGGQRK FEKEFKIDCL DIPEQRVEPA AVMHSGFVKR 
KLYDAVGCVS RTMITPYPPG IPVVCPGEVI NGDIVEYIVK IIEAGGVVNG VSSNLEVDVI 
DRSNL