Gene Acel_0237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_0237
Symbol
ID	4485375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	257040
End bp	258035
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	72%
IMG OID	639729000
Product	hydroxymethylbilane synthase
Protein accession	YP_871997
Protein GI	117927446
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0181] Porphobilinogen deaminase
TIGRFAM ID	[TIGR00212] porphobilinogen deaminase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACAG CCGCCGCCCT CTCCGTGCTG CGGCTGGGCA CCCGGCGCAG CACGCTCGCC 
CGCGCGCAGA CCGAGGAGAT CGCCGGCGCC CTCCGTGCCG CCGGCTGCCG GGTGGAAATC 
GTCGGTATCC AGAGCACGGG CGATCGGCAC GCCGACGTCC CCCTGCACGA ATTCGCCGGC 
TCCGGCGTTT TCGTCGCCGA GCTCCGGGCC GCACTGCTCC GCGGCGAGGT GGACGTCGTC 
GTCCATTCGA TGAAGGATTT GCCGACGGCG GAAATACCCG AGCTGGCCAT TGCGGCCATC 
CCGCGCCGCG CGGATCCGCG CGATGCGCTC GTCACCGGCG CGGGATGCCG GCTGGCGGAA 
CTGCCGACGG GTGCGATCGT CGGCACCGGA TCGCCACGGC GCGCCGCCCA ACTGCGGCTG 
CTCCGGCCGG ATCTGGAAAT TCGCCCGATC CGCGGTAACC TCGATACCCG GCTCGGCAAA 
CTCCACGCAG GCGGGTACGC CGCGTTGATT GTGGCGGCGG CCGGACTTGC CCGATTGCAC 
CGGTCGGAAG AAGCCGCCGA ATTCTTCGAC CCGACGGTGA TGCTGCCGGC ACCCGGTCAA 
GGCGCGCTCG CCGTCGAGTG CCGCCGGGCG GACATCGCGG ACGGCGGCCG GCTCGCCGGG 
ATTCTCGCCG GCCTGGACGA TCCGGCGACC CGGGCGGCGG TCACCGCAGA GCGTGCGCTG 
CTGGCCGCCG TGGGCGCGGG GTGCTCGGCG CCGGTGGGTG CGCTGGGCGT GGTCACCGCG 
GACACCCTGC AGCTGGACGC CGTCGTCGTC GACCCGTCCG GCACGACCGC ATTCCGCCGG 
TCGTTGACCG GGACGCCGGA CGACGCAAGC GACCTCGGGC GGCGGCTCGC CGCCGATCTG 
ATCCGCGCGG GGGCGGATCA GCTGCTCCAG GCTCCGAAAC AAACGGGGGA ACCGCATGAC 
CCCGACAGGC ACGACAAAGG AACAGGACGA CCATGA

Protein sequence

MTTAAALSVL RLGTRRSTLA RAQTEEIAGA LRAAGCRVEI VGIQSTGDRH ADVPLHEFAG 
SGVFVAELRA ALLRGEVDVV VHSMKDLPTA EIPELAIAAI PRRADPRDAL VTGAGCRLAE 
LPTGAIVGTG SPRRAAQLRL LRPDLEIRPI RGNLDTRLGK LHAGGYAALI VAAAGLARLH 
RSEEAAEFFD PTVMLPAPGQ GALAVECRRA DIADGGRLAG ILAGLDDPAT RAAVTAERAL 
LAAVGAGCSA PVGALGVVTA DTLQLDAVVV DPSGTTAFRR SLTGTPDDAS DLGRRLAADL 
IRAGADQLLQ APKQTGEPHD PDRHDKGTGR P