Gene Cthe_3101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_3101
Symbol
ID	4809727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3657482
End bp	3658714
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	43%
IMG OID	640108529
Product	L,L-diaminopimelate aminotransferase
Protein accession	YP_001039489
Protein GI	125975579
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID	[TIGR03542] LL-diaminopimelate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTTTA TTAATGAAAA TTATCTTAAG CTTCCGGGAA GCTACCTTTT TTCTGAAATT 
GCGAGGAGAG TGGACAATTT CAGAAAGGAA AATCCCAATG CAAAAATAAT ACGGCTGGGT 
ATTGGAGATG TTACAAAGCC GTTGGCGCCG GCAGTTATTG ACGCTTTGCA CAAAGCGGTG 
GACGAAATGG CAAAAGAGGA GACTTTTAAA GGATACGGAC CGGAGCAAGG TTATAGCTTC 
TTAGTCAGCA AAATAATTGA ATATGACTAT ATGCCCCGGG GAATCAGGCT TGATGAGGAC 
GAGGTTTTTG TAAGCGACGG GGCGAAAAGT GATACTGGAA ATTTCCAGGA GATATTTGGC 
CTGGACAACA AAGTTGCCGT TACCGACCCT GTATATCCTG TTTATGTTGA CAGCAATGTT 
ATGGCAGGAA GGACCGGAAA GTATCTTGCG AATGGTTATT TTGAGAATAT AACCTATCTT 
CCGTGTACTG CCGAAAACAA TTTCATTCCT GAACTTCCAA AAGAGAAAGT GGATATTATT 
TACCTTTGTT TCCCAAATAA TCCGACGGGA ATGACCTTGT CTAGGGAAGA ACTTAAAAAG 
TGGGTCGACT ATGCAAGGGA AAACCGCGCG ATAATACTGT TTGACTCGGC ATACGAGGCG 
TATATCCGTG AGAAAGATGT GCCCCACAGC ATTTATGAGG TTGAGGGAGC AGATGAGGTG 
GCAATTGAGT TTAGAAGCTT TTCCAAGACG GCAGGTTTTA CCGGAACAAG GTGTGCGTAT 
ACCGTAGTTC CCAAAAAGGT TGTGGCTTAT ACCAAAAACG GAGAAGCGCA TCAGCTCAAC 
AGCCTTTGGA ACAGAAGACA GACAACAAAA TTCAACGGTG TTCCGTATAT TATACAGCGG 
GCAGCGGCGG CGGTTTATAC CCCGGAGGGA CAAAAACAGA CTAAAGAAAC CATAGACTAT 
TACATGGAAA ATGCAAAAAT AATCAAACAA GGTTTGGAGG ATATCGGGCT TACCGTATTT 
GGAGGAGTAA ATGCTCCGTA TATCTGGCTT AAGACTCCGG ATGGCATAAG TTCATGGGAA 
TTTTTTGATA TCATGCTAAA AGAAATAAAT GTTGTCGGAA CACCCGGTTC AGGATTCGGA 
CCGAGCGGAG AAGGATATTT CCGGTTAACC GCTTTCGGAA GCAGGGAGAA TACTCTTGAG 
GCTGTGGAAA GATTTAAAAA TTTGAAATTT TAG

Protein sequence

MAFINENYLK LPGSYLFSEI ARRVDNFRKE NPNAKIIRLG IGDVTKPLAP AVIDALHKAV 
DEMAKEETFK GYGPEQGYSF LVSKIIEYDY MPRGIRLDED EVFVSDGAKS DTGNFQEIFG 
LDNKVAVTDP VYPVYVDSNV MAGRTGKYLA NGYFENITYL PCTAENNFIP ELPKEKVDII 
YLCFPNNPTG MTLSREELKK WVDYARENRA IILFDSAYEA YIREKDVPHS IYEVEGADEV 
AIEFRSFSKT AGFTGTRCAY TVVPKKVVAY TKNGEAHQLN SLWNRRQTTK FNGVPYIIQR 
AAAAVYTPEG QKQTKETIDY YMENAKIIKQ GLEDIGLTVF GGVNAPYIWL KTPDGISSWE 
FFDIMLKEIN VVGTPGSGFG PSGEGYFRLT AFGSRENTLE AVERFKNLKF