Gene Cthe_0580 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0580
Symbol
ID	4808255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	709432
End bp	710625
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	40%
IMG OID	640105994
Product	aspartate aminotransferase
Protein accession	YP_001037009
Protein GI	125973099
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATATCAG AAAGTGTTGT AAACAGTTTA AAGAAAGCCT CCTGGATAAG GGCAATGTTT 
GAAGAGGGAG AAAAACTTCG TAAAATTCAC GGGGCCGACA ACGTTTATGA TTTTACTTTG 
GGAAATCCCG ACCACGAACC GCCCTCTTCG GTAAAAGAAA CACTTAAAAA AATTGTTACC 
GAAGACAAAC CGGGCATACA CCGTTATATG AATAACGCAG GATATGAAGA TGTGAGACAA 
AAAGTGGCAG ACTATCTGAA CAGAACCTCC GGGCTGTCTT CCATATCATC TCAGCATATA 
ATCATGACCT GCGGCGCTGC CGGTGCTCTC AACGTTGTAC TGAAAACTCT TCTCAACCCC 
GGAGAAGAAG TCATCATACT GGCACCTTAC TTTGCAGAGT ATATATTCTA TGTGGGAAAT 
CACGGCGGAA AAGTGGTTAT AGTACCACCG GAAAAGGACA GTTTTAAACC TGACTTAAAA 
ATACTTGAAA ACAGCATCAC CGAAAAAACT AAAGCCATAA TCATAAATTC TCCCAATAAT 
CCATCGGGTT ACATATACAG CGAAGAAACC CTGAAGGAGA TTTTTGAAGT TCTTGAAAAG 
AAAGAAAAGG AATATAATTC CAGTATATAT GCAATTTCCG ATGAACCTTA CTACAAGCTG 
GTTTACGACA ATGTAAAACT TCCTTTTCTT TTCAGACTGT ATAAAAAATC CTTTATCGTA 
AACTCTTTCA GCAAATCCCT GGCTCTTGCG GGGGAAAGAA TCGGTTATAT TGCGGTAAAT 
CCGGAGATTC CCGAACTGGA ACTTATATTG GAAAGCTTGA TATTCTGCAA CCGTACCTTA 
GGTTACGTCA ATGCTCCTGC ATTGTTCCAA AAGGCAATTG CCGACTCTCT GGATGCGGAT 
ATTGATGTTG AAAGCTATAA ACAAAGGCGG GATTTAATAT ATGACACTTT AACCCGTCTG 
GGCTTTTCAT GCATAAAGCC CCAGGGAACT TTCTACATTT TCCCCAAATC CCCTATTGAA 
GATGATATAC AATTTATCAA ACATGCGGTT AAATACAACA TTCTTTTGGT TCCGGGCACC 
GGCTTTGGTT TACCGGGGCA CTTCAGACTC TCCTACTGCG TAAGCATGGA TATCATAAAA 
AAATCACTGC CGGCTTTCGA AGCATTGGCC AAAGACTTTA ATCTTATAAA ATAA

Protein sequence

MISESVVNSL KKASWIRAMF EEGEKLRKIH GADNVYDFTL GNPDHEPPSS VKETLKKIVT 
EDKPGIHRYM NNAGYEDVRQ KVADYLNRTS GLSSISSQHI IMTCGAAGAL NVVLKTLLNP 
GEEVIILAPY FAEYIFYVGN HGGKVVIVPP EKDSFKPDLK ILENSITEKT KAIIINSPNN 
PSGYIYSEET LKEIFEVLEK KEKEYNSSIY AISDEPYYKL VYDNVKLPFL FRLYKKSFIV 
NSFSKSLALA GERIGYIAVN PEIPELELIL ESLIFCNRTL GYVNAPALFQ KAIADSLDAD 
IDVESYKQRR DLIYDTLTRL GFSCIKPQGT FYIFPKSPIE DDIQFIKHAV KYNILLVPGT 
GFGLPGHFRL SYCVSMDIIK KSLPAFEALA KDFNLIK