Gene Acel_1074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1074
Symbol
ID	4485322
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	1184212
End bp	1185489
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	70%
IMG OID	639729848
Product	tryptophan synthase subunit beta
Protein accession	YP_872832
Protein GI	117928281
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.32093
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.660313
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGGCG TCCGACCAGC GTTGCCGGAT GCCGCCGGGC ATTTCGGCCC GTTCGGCGGG 
CGCTTCGTAC CGGAGGCGCT CGTCGCGGCA CTGGACGAGC TCGCCGCTGC ACACGCGGTG 
GCGATGGCCG ATCCGGATTT CCAGCGCGAA CTACGGCAGC TGCTCACGTC CTACGCCGGC 
CGGCCGACAC CGATCACCGA GGCGCGGCGG TTCTCCGAGC ACGCCGGCGG AGCCCGCATT 
CTGCTGAAAC GCGAGGACCT GACGCACACC GGCTCCCACA AGATCAATAA CGTGCTGGGG 
CAGGCACTGC TCACTGTCCG GATGGGCAAG AAGCGGGTCA TCGCCGAGAC CGGGGCAGGC 
CAGCATGGCG TGGCGACCGC TACGGCTGCG GCGCTCTTCG GCTTGGACTG CACGATCTAC 
ATGGGCGAGG AGGACACGCG CCGGCAGGCC CTGAACGTGG CCCGGATGCG GTTGCTCGGC 
GCGGACGTCG TCCCGGTCGA CGCCGGTACC CGCACGTTGA AAGATGCGAT AAACGAGGCA 
TTCCGCGACT GGGTGACGAC CGTCGAATAC ACCCACTACG TCTTCGGCAC GGTGGCCGGC 
CCGCATCCTT TTCCCGCGGT GGTCCGCGAT TTTCAGCGGA TCATCGGCGA CGAGACGCGG 
ACCCAGGTGC TCGACGCTCT CGGACGGTTG CCGGACGCGG TGGTCGCCTG TGTCGGCGGC 
GGGTCCAATG CCATTGGGAT TTTCACCGCC TTCCTTGCGG ATCCGCAGGT CCGGCTGTAC 
GGATTTGAAG CCGGCGGGGA GGGGATCGAG ACGGGTCGGC ATGCGGCGAC GTTGAGCGCC 
GGGAGCCGGG GCGTCCTGCA CGGCGCCCGC ACCTACGTGC TGCAGGACGC CGACGGCCAG 
ACCCGCCCGT CGCATTCCAT TTCCGCGGGG TTGGACTACC CGGGCGTCGG GCCGGAACAC 
GCGTGGCTGC GGGAAACCGG ACGGGTCTGC TACCAGCCGG TCACCGACGC CGAAGCGATG 
GACGCGTTCC GGCTTCTGGC CCGCACGGAG GGCATTCTCG CGGCGTTGGA GAGCGCGCAC 
GCCCTGGCCG GCGCGTTACG GGTCGGGCGG GAGCTTGGCC CCGGGAGTGT CGTGGTCGTC 
AGCTTGTCGG GGCGCGGCGA CAAAGACGTG CAGACCGCGG CCCGGTGGTT CGGCCTTGAT 
GCGTCGGACA GGTCCAGCAG GTCGGCCGCG TACCGCCGGC CGGGCTCCGG CGTGGACGTC 
CCCGGCAGGC CGATGTGA

Protein sequence

MSGVRPALPD AAGHFGPFGG RFVPEALVAA LDELAAAHAV AMADPDFQRE LRQLLTSYAG 
RPTPITEARR FSEHAGGARI LLKREDLTHT GSHKINNVLG QALLTVRMGK KRVIAETGAG 
QHGVATATAA ALFGLDCTIY MGEEDTRRQA LNVARMRLLG ADVVPVDAGT RTLKDAINEA 
FRDWVTTVEY THYVFGTVAG PHPFPAVVRD FQRIIGDETR TQVLDALGRL PDAVVACVGG 
GSNAIGIFTA FLADPQVRLY GFEAGGEGIE TGRHAATLSA GSRGVLHGAR TYVLQDADGQ 
TRPSHSISAG LDYPGVGPEH AWLRETGRVC YQPVTDAEAM DAFRLLARTE GILAALESAH 
ALAGALRVGR ELGPGSVVVV SLSGRGDKDV QTAARWFGLD ASDRSSRSAA YRRPGSGVDV 
PGRPM