Gene Cthe_0363 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0363
Symbol
ID	4808440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	454648
End bp	455820
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	41%
IMG OID	640105777
Product	aminotransferase
Protein accession	YP_001036794
Protein GI	125972884
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATTG CAGAAATGGT TTTGCCGACT GTCAGACAGG TACCTCCTTC AGGGATCAGG 
AAGTTTTTTG ATTTGGTAAA TGAAATGAAG GATGCCATAT CCTTAAGTAT TGGTGAGCCT 
GATTTTGTAA CTCCGTGGAA TATCCGGGAG GCCGGTATTT ATTCGCTGGA AAAAGGGCAT 
ACCCACTATT CGCCAAATGC GGGATTTATG GAGCTGCGTG AAGAGATATG CAAGTATCAG 
GAGAGAAAAT ACAATTTAAA ATATGATCCA AAGACCCAGG TTATTGTAAC CGTAGGAGGA 
AGTGAGGGAA TTGACATAGC TTTAAGGGCT CTTGTCGGAC CCGGAGATGA AGTGATTATT 
CCTGAACCTT GTTTTGTTGC CTATAAACCA TGCACTATTT TCACCGGAGC TACTCCTGTG 
ATAGTAAATT TGAGCGCGGA AAACGAGTTT CGGCTGACAC CGGAACTTTT GGAAAAGGCA 
ATTACCGACA GAACTAAAGT GTTGATTTTG CCTTATCCCA ACAATCCTAC AGGCGCCGTT 
ATGGAAAAAA AGGATTTAGA GGCTATTGTT GAAGTACTTA AGGACAAAGA CATAATTGTT 
ATTTCCGATG AGATTTATTC TGAGCTTACT TACGGAGTTA AGCATGTATC CATAGCGTCT 
TTTCCTGAGA TGAAGGATAA GACGGTGGTT ATAAACGGCT TTTCCAAAGC CTATGCCATG 
ACGGGCTGGA GACTTGGATA TTGCTTGGGG CATCCTGATT TGATTTCACA GATGTACAAG 
ATACATCAAT ATGCCATAAT GTGTTCTCCG ACAACTGCCC AATATGCAGC CATAGAAGCT 
TTAAGAAACA GTGATGATGA TGTGGAAGCA ATGGTCAGAG AGTACAACCG AAGAAGAAGA 
ATTATGGTTG AAGGTTTCAG GAGTGCAGGG CTTGAATGTT TTGAGCCGTT GGGTGCTTTT 
TATGTTTTTC CGTGCATAGA ATCAACAGGA ATGACTTCGT ATGAGTTTTC CGAAAGGCTT 
TTAATGGAGG AAAAAGTTGC GGTAGTTCCG GGGACTGCTT TTGGAGAATG TGGAGAAGGA 
TATGTACGTT CGTGCTATGC CAGCTCCATG GACAATATAA TTGAAGCAAT GAAAAGAATT 
AAAAGATTTG TCGAAAGAAA TAGAAAGAAG TAA

Protein sequence

MNIAEMVLPT VRQVPPSGIR KFFDLVNEMK DAISLSIGEP DFVTPWNIRE AGIYSLEKGH 
THYSPNAGFM ELREEICKYQ ERKYNLKYDP KTQVIVTVGG SEGIDIALRA LVGPGDEVII 
PEPCFVAYKP CTIFTGATPV IVNLSAENEF RLTPELLEKA ITDRTKVLIL PYPNNPTGAV 
MEKKDLEAIV EVLKDKDIIV ISDEIYSELT YGVKHVSIAS FPEMKDKTVV INGFSKAYAM 
TGWRLGYCLG HPDLISQMYK IHQYAIMCSP TTAQYAAIEA LRNSDDDVEA MVREYNRRRR 
IMVEGFRSAG LECFEPLGAF YVFPCIESTG MTSYEFSERL LMEEKVAVVP GTAFGECGEG 
YVRSCYASSM DNIIEAMKRI KRFVERNRKK