Gene Acel_1019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1019
Symbol
ID	4484560
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	1125485
End bp	1126780
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	63%
IMG OID	639729794
Product	nickel-dependent hydrogenase, large subunit
Protein accession	YP_872778
Protein GI	117928227
COG category	[C] Energy production and conversion
COG ID	[COG3259] Coenzyme F420-reducing hydrogenase, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.00653003
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCGCTG AACGTCGGGT CCTGCGAACT GACTACCTTG CCCGGGTCGA GGGCGAAGGG 
GCGCTGTTCG TCGAATGTGA TGGCGACGTC GTCACCAAGG TGGAGTTGCG CATCTTCGAG 
CCGCCGCGTT TCTTTGAGGC TCTCTTGCGC GGCCGGTCGT GCTTCGAGGC TCCCGACATC 
ACCGCGCGTA TTTGTGGCAT CTGCCCGGTC GCCTATCAGA CCAGCGCGGT CAACGCCGTG 
GAGAGTCTCG CCGGTGTGGA CGTACCCGAA TCCATTCACC ATCTGCGCCG ATTGTTGTAC 
TGCGGTGAGT GGATCGAGAG TCACGCCTTG CACGTGTACC TGCTTCATGC ACCGGATTTC 
CTTGGTTACC CTGATGCCAT CACGTTGGCC CGCGATTACC CGGACATCGT GCAGCGGGGC 
CTACAGCTCA AGGCGGCAGG CAACCACCTC ATGCGGGTTC TCGGCGGCCG CGAAATTCAT 
CCGATCAATG TACGAGTCGG CGGCTTCTAC CGCGTCCCTT CGGCGTCCGA ACTTCGCGCG 
CTCCGGCCCG AGCTCGAGCA GGCGCGCGAA ATCGCAGTCG AGACCGTCCG GTGGGTCTCG 
GGATTCTCCT TCCCCGAGCG GGTATTCGAG GGCGCGCTTG TCGCCCTCCA CCAGCCGGAC 
AGTTACGCTA TTGAGCGCGG CCGTATTCGG TCGGATACCG GTCTGGATAT CGACGCTTCC 
CGCTACGACG ACTACTTCGA AGAGGAGCAG GTCGGCCATT CCACTGCACT GCATTCACGG 
TTGCGTGGCG CCGGGCGGTA CCTCTGCGGG CCGCTTGCCC GTTACAGCCT GAATTATCGG 
CAACTGTCTC CGCTGGCCAA GGAATGTGCC CGCGAAGCCG GGCTCGGCGA GGTGTGCCGG 
GACGTCTTTC GCAGCATCGT GGTGCGCAGC GTCGAACTCG TGTACGCCTG CGATGAAGCA 
CTGCGGCTGA TTGACATTTA TGAGCGACCC GAAATTCCGG CCGTGCCCGT CGTCGTTCGG 
CCAGGTACCG GTCACGGCGT CAGCGAGGCA CCGCGCGGTC TGCTCTACCA CCGTTACCGT 
CTTGACGGCG ACGGGACGAT TCTCGACGCG GAGATCGTGC CTCCGACAGC GCAGAATCAG 
GCAGCGATCG AAGGAGACGT GCACGACGTT GTCGTCCGTT ACCGCGACCT CGACGATGAG 
CAGTTGCGCC ACCTCTGCGA GCAAGCGATT CGCAACTACG ACCCGTGCAT TTCGTGCGCT 
ACTCACTTCC TCCGGCTGGA GGTGAACCGG CGATGA

Protein sequence

MSAERRVLRT DYLARVEGEG ALFVECDGDV VTKVELRIFE PPRFFEALLR GRSCFEAPDI 
TARICGICPV AYQTSAVNAV ESLAGVDVPE SIHHLRRLLY CGEWIESHAL HVYLLHAPDF 
LGYPDAITLA RDYPDIVQRG LQLKAAGNHL MRVLGGREIH PINVRVGGFY RVPSASELRA 
LRPELEQARE IAVETVRWVS GFSFPERVFE GALVALHQPD SYAIERGRIR SDTGLDIDAS 
RYDDYFEEEQ VGHSTALHSR LRGAGRYLCG PLARYSLNYR QLSPLAKECA REAGLGEVCR 
DVFRSIVVRS VELVYACDEA LRLIDIYERP EIPAVPVVVR PGTGHGVSEA PRGLLYHRYR 
LDGDGTILDA EIVPPTAQNQ AAIEGDVHDV VVRYRDLDDE QLRHLCEQAI RNYDPCISCA 
THFLRLEVNR R