Gene Acel_1274 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1274
Symbol
ID	4486345
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	1420843
End bp	1421943
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	74%
IMG OID	639730054
Product	diaminohydroxyphosphoribosylaminopyrimidine deaminase / 5-amino-6-(5-phosphoribosylamino)uracil reductase
Protein accession	YP_873032
Protein GI	117928481
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0117] Pyrimidine deaminase [COG1985] Pyrimidine reductase, riboflavin biosynthesis
TIGRFAM ID	[TIGR00227] riboflavin-specific deaminase C-terminal domain [TIGR00326] riboflavin biosynthesis protein RibD

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.308593
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.319876
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGGTG TGGAAGCGAC CGCACACGTC GCTGCGCACG AACTCGCCGC GATGCGACGG 
GCGCTTGCAC TGGCCGAGCG GGGCCGCGGG TCGACGAGCC CGAATCCGAT CGTCGGTTGC 
GTGGTGCTGG ACGCCGCGGG TCGAGTCGTC GGGGAAGGTT TTCACCTTCG GGCGGGTGGG 
CCGCACGCCG AGGTCGTCGC GCTGGCCGCC GCCGGTCCGG CGGCCCGTGG CGGCACCCTC 
GTGGTCACCC TCGAACCGTG CCGGCACGTC GGCCGGACCG GTCCGTGCGT TGCCGAAATT 
CGGCGCGCCG GGATTCGGCG TGTGGTGTAC GCCGTCGCCG ACCCGACAGC CGCCGGCGGT 
GGCGGGGCGG AGCTCGCCGC TGCCGGCCTG GATGTCGTCG GCGGCGTGTT GGCTGCCGAG 
GCCGCTGCAG CCAACCGCGC CTGGCTGCAC CGGGTTGCGA CCGGCCGGCC CTTCGTTACC 
TGGAAGTACG CCGCGACCCT CGACGGCCGG GTCGCCGCGG CAGACGGCTC CAGCCGGTGG 
ATCACCTCTG ACGAAGCTCG GCGCGACGTC CACCTGCTGC GCGCTCAGTC GGACGCGATC 
GTCATCGGCA CCGGAACAGC GCTTGCCGAC GATCCCGCCC TCACCGTGCG GGTGGACGAC 
GCTGCGCCGG ACCTGACCCA GCCGCTCCGG GTCGTGGTCG GCCGTCGCGA TCTCCCACCG 
GGCGCGCGAC TACGCGACGA TACGGCGCCT ACGGTGCAGC TGCGCAAGCA CGATCCAGCG 
GCTGTCCTCG CCCGGCTTGC GGACCGGGGC GTGCTGAGCG TGCTGCTCGA AGGCGGCCCA 
ACACTCGCCG CCGCGTTCCT CCGAGCGCGC CTTGTGGACC GGATCGTCGC CTACGTCGCG 
CCGATCCTCC TCGGCTCCGG CCCGCCGCTC GTTGCTGATC TCGGCATTGC CACTCTTGCC 
GCCGGCCAGC GGTGGCGGAT CGACGAGGTC ACCCGTATCG GACCCGACCT GCGGCTCACC 
CTGGCGCCGG TCTCGGCCGA CGCGACCGCG GCGGCGGCGC CGGGCGCGAC CGTGACCCCA 
GCGGCTGTCG GCGTGGCCTA G

Protein sequence

MQGVEATAHV AAHELAAMRR ALALAERGRG STSPNPIVGC VVLDAAGRVV GEGFHLRAGG 
PHAEVVALAA AGPAARGGTL VVTLEPCRHV GRTGPCVAEI RRAGIRRVVY AVADPTAAGG 
GGAELAAAGL DVVGGVLAAE AAAANRAWLH RVATGRPFVT WKYAATLDGR VAAADGSSRW 
ITSDEARRDV HLLRAQSDAI VIGTGTALAD DPALTVRVDD AAPDLTQPLR VVVGRRDLPP 
GARLRDDTAP TVQLRKHDPA AVLARLADRG VLSVLLEGGP TLAAAFLRAR LVDRIVAYVA 
PILLGSGPPL VADLGIATLA AGQRWRIDEV TRIGPDLRLT LAPVSADATA AAAPGATVTP 
AAVGVA