Gene Acel_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_2010
Symbol
ID	4484948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	2284627
End bp	2285841
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	70%
IMG OID	639730804
Product	hypothetical protein
Protein accession	YP_873768
Protein GI	117929217
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.785171
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGGCC ATCTTTCCTG GATGGGTTGT GCGGCCGCCG CTCTTGTCTT GGTGACGGCG 
TGCGCCGCGC CGAATGGACA ATCCCCACGC GCCGCCGGAT CGGCGCCTGG TCTAGCGGCG 
AGCAAGGCAC GTAACGGCTC CGCGTCCCCT GCCGGCGGGG CGAGTCGGGG CGGCGCCGTG 
GGCGCCGCCG CGGTGCGGCA GCTCCGCCTG CGAGGACAGA TCGGCGTCCG ACTTGCCGGC 
GAAACCTTGG CCGTCACCCA TGACGGTGGC CGGACCTGGG CGCCGGTATC GCTGCCGGCA 
GGGCTGGCTC CGGCGAACAT CGCGGCCGTT GATTCAGCTC CCGACGGTGC TCCGCTGCTC 
GCCGCGGTGG ACCCCACGGG GTCGGTGCAC GTCTACCGCT ACGCCGCCGA GTGGAGCGCG 
GTACGGCTCG ATCCACGGTG GCCGGCCGGC ACCTCGACGG CGGACGGCAC CGAACAGGTT 
GCATTCCACC CGGCCGCCGG CGGGATCGTC GCCGTCGTCG TCTCCCTCGC TGGCGGCGGA 
TTCAGCGCCG AGCATGCGCT TTTCGTCTCC ACCGACAACG GCGGGCATTT CGGACCGCCG 
GCGACGCCGA ACGGTCCGGA TGTCAACGTG CGCTGGTCCG GTCTGCTCAT GGTGACGCCG 
CGGATCGGCG TCCTCGTCGC GGGTCCCACG CAGGAATTGC TCCTGCGCAC CACGGACGGC 
GGTGCGTCGT GGCAACGACT GTCTGTCCCC GGCGTCGGCG GCCCCGGCAC GTTCGCCCTC 
GGGGCTCCGG TGCTCAGCGG GTCACGTATC GACATTCCGG TGACCGTGCA GGCGGCGGCC 
GACGGAAGCC GGGAGAAATT CTTCCTGCTC GCTAGTGACG ATCAGGGTGC GACCTTCACC 
GTCCGGGGCG TCGCTCTGGA CATCCCAGCG GATTTCGCCC CGACCGGCGC CGTAACGGGA 
AACACCGGGT CCACCTGGTG GGTGGTTGCG CCGTCCATCG GCACGGTGTA TGAGACGACC 
GACGACGGCG CCAGTTGGCG GACGGTTCAC GAAACCGGAC TCGCGCTGAA CACCGTCGCG 
GTCACCCTCA CCGGCCCAGC AGCCGCAACC GCGGTAATCG CGGTGAATTC ATGCGCCAAT 
GACAAGAGTG AGTGCACGAT GACCGTCACG GTCGAACAGA CCACGGACGG CGGTGCGACC 
TGGTCCCCCG CGTGA

Protein sequence

MRGHLSWMGC AAAALVLVTA CAAPNGQSPR AAGSAPGLAA SKARNGSASP AGGASRGGAV 
GAAAVRQLRL RGQIGVRLAG ETLAVTHDGG RTWAPVSLPA GLAPANIAAV DSAPDGAPLL 
AAVDPTGSVH VYRYAAEWSA VRLDPRWPAG TSTADGTEQV AFHPAAGGIV AVVVSLAGGG 
FSAEHALFVS TDNGGHFGPP ATPNGPDVNV RWSGLLMVTP RIGVLVAGPT QELLLRTTDG 
GASWQRLSVP GVGGPGTFAL GAPVLSGSRI DIPVTVQAAA DGSREKFFLL ASDDQGATFT 
VRGVALDIPA DFAPTGAVTG NTGSTWWVVA PSIGTVYETT DDGASWRTVH ETGLALNTVA 
VTLTGPAAAT AVIAVNSCAN DKSECTMTVT VEQTTDGGAT WSPA